mljar-supervised是一個自動機器學習Python套件,可以處理表格資料。它的設計是為了節省資料科學家的時間。它抽象了預處理資料、建構機器學習模型、執行超參數調優以找到最佳模型的常見方式。它不是黑箱,因為你可以看到ML管線是如何建構的(每個ML模型都有詳細的Markdown報告)。
Continue reading “透過特徵工程和超參數調整實現機器學習管線自動化”針對機器學習從業者的開源文字註釋工具
Doccano 是一個給人使用的開源文字註釋工具。它為文字分類、序列標註和任務序列化提供了註釋特徵。因此,可以建立用於情感分析、命名實體識別、文字摘要等的標記資料。只需建立一個專案,上傳資料並開始註釋。你可以在數小時內構建資料集。
Continue reading “針對機器學習從業者的開源文字註釋工具”機器學習的特徵工程
學習插補( imputation )、變量編碼( variable encoding )、離散化( discretization )、特徵提取( feature extraction )、如何處理日期時間( datetime )、離群值( outliers )等。
Continue reading “機器學習的特徵工程”機器學習的特徵選擇
學習過濾器、包裝器和嵌入式方法、遞歸特徵消除、窮舉搜尋、特徵改組等。
Continue reading “機器學習的特徵選擇”