Contents
這是 Soft & Share 為訂閱會員所推出的服務,小編週一到週五會每天整理一篇開源專案的摘要說明整理 (早上 8 點前會發佈在 Soft & Share 網站 ) ,讓你可以利用上班前快速掌握目前開源專案的焦點。( 之前出版的開源報報 )。想體驗開源報報,可先參考每週五有開放閱讀。
🔥以主題方式整理出相關的開源專案 – 開源報報主題報導
每天快速瀏覽開源報報具備有什麼效益?
- 增加自己的學習動力,提升自己的視野
- 從開源專案中獲得 side project 靈感與想法
- 利用開源專案提升自己的生產力
每天使用 NT8.3 元,你可以使用 Soft & Share 開源報報省下掌握每天開源資訊焦點的時間,這是一個很划算的時間槓桿投資
開源報報內容
學習資源
機器學習大學: 電腦視覺速成班
這是 Amazon 推出的免費線上課程,主要推廣 AWS 的機器學習服務
這個 repository 包含機器學習大學(MLU)電腦視覺課程的幻燈片、筆記本和資料集。我們的使命是讓機器學習能夠為每個人所用。我們的課程涵蓋了機器學習的許多主題,我們相信機器學習的知識是成功的關鍵。本課程旨在幫助你開始學習電腦視覺,學習廣泛使用的機器學習技術,並將其應用於實際問題。
課程網址 YouTube playlist
機器學習大學: 自然語言處理速成班
這個 repository 包含了機器學習大學(MLU)加速自然語言處理課程的幻燈片、筆記本和資料集。我們的使命是讓機器學習能夠為每個人所用。我們的課程涵蓋了機器學習的許多主題,我們相信機器學習的知識是成功的關鍵。本課程旨在幫助你開始學習自然語言處理(Natural Language Processing,NLP) ,學習廣泛使用的技術,並將其應用於實際問題。
課程網址 YouTube playlist
機器學習大學: 加速 Tabular 資料類別
此 repository 包含用於機器學習大學(MLU)加速 Tabular 資料類別的幻燈片、筆記本和資料集。我們的使命是讓機器學習能夠為每個人所用。我們的課程涵蓋了機器學習的許多主題,我們相信機器學習的知識是成功的關鍵。這個類旨在幫助你開始使用表格資料(類似電子表格的表格) ,瞭解廣泛使用的表格資料機器學習技術,並將其應用於實際問題。
課程網址 YouTube playlist
工具
Web 應用程式開發
一個基於 Material-UI Table 的簡單而強大的資料表,帶有一些額外的特性
詳細功能可參考官方網站 https://material-table.com/#/
資料科學
語言解釋工具: 在一個可擴充、框架不可知的介面中互動式地分析 NLP 模型,以便理解模型
語言解釋工具(LIT)是一個視覺化的、互動式的 NLP 模型理解工具。
LIT 是用來回答以下問題的:
- 我的模型在哪些範例上表現不佳?
- 我的模型為何做出此預測? 可以將這種預測歸因於對抗行為,還是歸因於訓練集中的不良先驗??
- 如果我改變文字風格、動詞時態或代詞性別,我的模型是否一致?
透過基於瀏覽器的使用者介面,LIT 支援各種除錯工作流。特性包括:
- 通過顯著圖,注意力和模型預測的豐富視覺化進行本地解釋
- 聚合分析包括客製化度量、切片和分割,以及嵌入空間的視覺化
- 透過手動編輯或生成器外掛來動態建立和評估新範例的反事實( Counterfactual )生成
- 並排模式可以比較兩個或多個模型,或者一個模型上的一對範例
- 新模型型別的高度可擴充性,包括分類、迴歸、跨度標記、 seq2seq 和語言建模。支援多頭模型和多種輸入功能開箱即用
- 框架無關,並與 TensorFlow、 PyTorch 等相容

一個非常簡單的框架,用於最先進的自然語言處理(NLP)
有以下特色
- 一個強大的 NLP 程式庫。Flair 允許你將我們最先進的自然語言處理(NLP)模型應用於你的文字,如命名實體識別(NER)、詞性標籤(PoS)、意義消歧和分類,並支援數量迅速成長的語言。
- 生物醫學 NER 程式庫。Flair 公司為生物醫學資料提供特殊支援,具有最先進的生物醫學 NER 模型,並支援超過32個生物醫學資料集。
- 一個文字嵌入程式庫。Flair 具有簡單的介面,允許你使用和組合不同的單詞和文件嵌入,包括我們提議的 Flair 嵌入、 BERT 嵌入和 ELMo 嵌入。
- PyTorch NLP 框架。我們的框架直接建構在 PyTorch 之上,使得使用 Flair embedding 和 classes 來訓練你自己的模型和嘗試新的方法變得非常容易。
總是知道從你的資料中期望得到什麼
Great Expectations 透過資料測試、文件化和分析,幫助資料團隊消除管道債務( pipeline debt )。
軟體開發人員早就知道,測試和文件對於管理複雜的程式碼庫是必不可少的。Great Expectations 給資料科學和資料工程團隊帶來了同樣的信心、完整性和加速度。
有關管道測試哲學的介紹,請參考 Down with Pipeline Debt!
主要特色
- 期望 – 期望是對資料的斷言。它們是 Great Expectations中主要的抽象概念
- 包含一系列的資料驗證
- 測試就是文件,文件就是測試
- 自動化資料分析
- 可插拔和可擴充
雲端和網路管理
一個功能齊全的本地端 AWS 雲端堆疊。離線開發和測試你的雲端和無伺服器應用程式!
LocalStack 為開發雲端應用程式提供了一個易於使用的測試/模擬框架。
目前,重點主要放在支援 AWS 雲端堆疊上。
程式設計語言/程式庫
VTIL 支援的 VMProtect x643. x 靜態去虛擬化器
NoVmp 是一個將 VMProtect x643.0-3.5(最新版)去虛擬化為優化的 VTIL 的專案,並且可以選擇使用虛擬機器翻譯中間語言庫重新編譯回 x64。
VTIL 在這期的開源報報有介紹
一個現代的、 C++ 原生的、只包含 header 的、用於單元測試、 TDD 和 BDD 的測試框架
Catch2 是 C++ 的多範例( multi-paradigm )測試框架。它也支援 Objective-C (也許是 C)。
Go 語言的流暢 SQL 產生器
Squirrel 不是 ORM。使用 Squirrel 開發的應用程式可參考 structable, a table-struct mapper
Squirrel 幫助你從可組合部分構建 SQL 查詢
import sq "github.com/Masterminds/squirrel"
users := sq.Select("*").From("users").Join("emails USING (email_id)")
active := users.Where(sq.Eq{"deleted_at": nil})
sql, args, err := active.ToSql()
sql == "SELECT * FROM users JOIN emails USING (email_id) WHERE deleted_at IS NULL"
在Python 應用程式中管理 GitHub 資源
PyGitHub 是一個 Python 程式庫,用於訪問 GitHub API v3 和 GitHub Enterprise API v3。這個程式庫使你能夠在 Python 應用程式中管理 GitHub 資源,比如儲存庫、使用者配置檔案和組織
使用 Cranelift 為 WebAssembly 提供獨立的 JIT 風格的 runtime
特色
- 輕量級。Wasmtime 是 WebAssembly 的一個獨立 runtime,可以根據你的需要進行擴充。它可以安裝在小型晶片上,也可以使用大型伺服器。Wasmtime 幾乎可以嵌入到任何應用程式中。
- 快速。 Wasmtime 是基於優化 Cranelift 程式碼生成器建構的,可以在執行時快速生成高品質的機器程式碼。
- 可配置的。無論你是需要提前預編譯你的程式碼,還是用 Lightbeam 快速生成程式碼,或者在執行時解釋它,Wasmtime 已經滿足了你所有的程式碼執行需求。
- WASI.Wasmtime 支援一組豐富的 api,用於透過 WASI 標準與主機環境進行互動。
- 符合標準。透過了官方的 WebAssembly 測試套件,實現了官方的 wasm C API,並且也實現了 WebAssembly 的未來提案。一直以來,Wasmtime 開發人員都在密切參與 WebAssembly 標準流程。
嵌入式系統
微型四足機器人專案
這個專案是一個 Spot 微型四足機器人的原始碼,一個4條腿的開源機器人。該程式碼具有坐、站、角度指令和行走能力,能夠對現場微型機器人進行鍵盤控制。該軟體是在執行 Ubuntu 16.04的 Raspberry Pi 3B 電腦上實現的。
該軟體由 ROS 框架中的 C++ 和 python 節點組成。

喜歡今天小編整理的開源報報嗎?歡迎給小編意見與回饋