Contents
這是以前 Soft & Share 為訂閱會員所推出的服務,小編週一到週五會每天整理一篇開源專案的摘要說明整理 (早上 8 點前會發佈在 Soft & Share 網站 ) ,讓你可以利用上班前快速掌握目前開源專案的焦點。( 之前出版的開源報報 )。
🔥以主題方式整理出相關的開源專案 – 開源報報主題報導
每天快速瀏覽開源報報具備有什麼效益?
- 增加自己的學習動力,提升自己的視野
- 從開源專案中獲得 side project 靈感與想法
- 利用開源專案提升自己的生產力
開源報報內容
學習資源
使用 Julia 學習運算思維入門
這是一門運算思維的入門課程。我們使用 Julia 程式語言來處理不同領域的實際問題,應用資料分析、運算和數學建模。在這門課程中,你將學習電腦科學、軟體、演算法、應用程式和數學。
主題包括:
- 影象分析
- 粒子動力學與射線追蹤
- 傳染病的傳播
- 氣候模擬
工具
加速硬體合成
XLS (加速 HW 合成)專案的目的是透過“軟體風格”的方法學,使得硬體 IP 能夠快速發展,並且能夠作為高效的主機軟體執行。
XLS 實現了一個高階綜合(HLS)工具鏈,它從靈活的、高階的功能描述中產生可合成(synthesizable)的設計。它是完全開源的
Web 應用程式開發
C++後端開發的搜狗(Sogou)框架。
搜狗公司C++伺服器引擎,支撐搜狗幾乎所有後端C++線上服務,包括所有搜尋服務,雲端輸入法,線上廣告等,每日處理超百億請求。這是一個設計輕盈優雅的企業級程式引擎,可以滿足大多數C++後端開發需求。
一個用 Go 編寫的 Web 和 rpc 框架
Go-zero 是一個 web 和 rpc 框架,內建了大量的工程實踐。它的誕生是為了確保繁忙服務的穩定性和彈性設計,多年來一直服務於數千萬使用者的網站。
Go-zero 包含簡單的 API 描述語法和程式碼生成工具 goctl。你可以使用 goctl 生成 Go,iOS,Android,Kotlin,Dart,TypeScript,JavaScript。Api 檔案。
Go-zero 的好處
- 提高服務的穩定性,每天有數以千萬計的活躍使用者
- 內建鏈式超時控制,併發(concurrency)控制,速率限制,自適應斷路器,自適應負載減少,甚至不需要配置
- 內建中介軟體也可以整合到你的框架中
- 簡單的 API 語法,一個命令來生成幾種不同的語言
- 自動驗證客戶端的請求參數
- 大量的內建微服務管理和併發工具包

免費、快速、漂亮的 API 請求構建器

資料科學
分散式深度學習框架
一個在網際網路上訓練大型神經網路的程式庫。想象一下,用來自大學、公司和志願者的成千上萬台電腦訓練一個巨大的 transformer ( 一種自然語言模型 )。
你為什麼要關心這個?
- 更大的神經網路正在取得勝利:
- 預訓練 transformers 支配大多數 NLP 任務;
- 更大的 CNNS 在電腦視覺上表現得更好
- GPT-3 具有175B 參數,比賽仍在繼續
也就是說,訓練大型神經網路並不便宜。之前最大的語言模型使用的硬體成本超過2500萬美元。GPT-3的單次訓練執行在雲端 gpu 上至少要花費460萬美元。因此,研究人員無法為最先進的深度學習模型做出貢獻,而且如果沒有巨型公司的支援,從業者也無法建構應用程式。如果我們希望人工智慧的未來是光明的,它就不能是私人的。
什麼是 hivemind?
Hivemind 是一個用於大型神經網路分散訓練的程式庫。簡而言之,你想要訓練一個神經網路,但是你所擁有的只是一群愛好者,他們的電腦並不可靠,只能透過網際網路進行交流。任何同儕都可能在任何時候失敗或離開,但訓練必須繼續下去。為了實現這個目標,這些模型使用一種特殊的層型別: 分散的專家混合 Decentralized Mixture of Experts (DMoE)。
100篇必讀的 NLP 論文
這是一份100篇重要的自然語言處理(NLP)論文的清單,在這個領域工作的認真學生和研究人員可能應該瞭解和閱讀這些論文。這份名單是由 Masato Hagiwara 編制的。
資料工程師的學習路線圖

讓影片中的嘴型與聲音精確地同步
這個 repository 包含了這篇論文 A Lip Sync Expert Is All You Need for Speech to Lip Generation In the Wild 的程式碼