fbpx

Soft & Share 開源報報 216 – 一個用 Java 編寫的開源機器學習框架,它允許機器學習和統計應用程式的快速發展

這是 Soft & Share 為訂閱會員所推出的服務,小編週一到週五會每天整理一篇開源專案的摘要說明整理 (早上 8 點前會發佈在 Soft & Share 網站 ) ,讓你可以利用上班前快速掌握目前開源專案的焦點。( 之前出版的開源報報 )。想體驗開源報報,可先參考每週五有開放閱讀

🔥以主題方式整理出相關的開源專案 – 開源報報主題報導

為什麼需要 Soft & Share 開源報報?

每天快速瀏覽開源報報具備有什麼效益?

  1. 增加自己的學習動力,提升自己的視野
  2. 從開源專案中獲得 side project 靈感與想法
  3. 利用開源專案提升自己的生產力

每天使用 NT8.3 元,你可以使用 Soft & Share 開源報報省下掌握每天開源資訊焦點的時間,這是一個很划算的時間槓桿投資

訂閱網址

開源報報內容

工具

FreeCAD,一個免費的開源多平台 3D 參數建模工具。

這個 3D 建模軟體使用 C++ 開發,適合用來做機構設計,裡面有一個功能還蠻吸引我 – Create 3D from 2D & back,因為我高中是唸機械製圖,也畫過 3D 的機構圖,如果可以從 2D 轉成 3D 物件,真的很方便

Web 應用程式開發

用於在檔案系統上建立與 dat 相容的 Node 模組工具

Dat 是用於在電腦之間共享資料的通訊協定。Dat 的優點是資料由網路上的許多電腦分散託管,它可以使用在離線工作或連線性差的狀況,原始上傳器可以新增或修改資料,同時保持完整的歷史記錄,它可以處理大量的資料。

Dat 社群最初的設計考慮到了科學性資料,但它正在試水溫,並已開始將其用於網站、藝術、音樂釋出、點對點聊天程式和許多其他實驗。

Authboss是用於Web的模組化身份驗證系統

適合使用 Go 開發 Web application 時使用。

它具有幾個模組,這些模組代表了通常在網站上常見的身份驗證和授權功能,因此你可以根據需要啟用任意數量的功能,而忽略其他功能。 透過它,可以輕鬆地將身份驗證插入應用程式並獲得大量功能,以進行更少量的整合工作。

為何使用 Authboss?

當你想開始一個新的 Web 專案時,你真的很想快點了解要完成的工作的核心,可以肯定地說,你對實現其中的一個系統感到興奮 而創新不是認證。 實際上,這恰恰相反:這是你必須要做的一件事,也是你討厭做的一件事。 Authboss應該消除了與此相關的許多乏味內容,並且消除了很多犯錯的機會。 這使你可以關心自己打算做什麼,而不是關心實現自己想要的事情所需的輔助支援系統。

Javascript中的下一代模擬( Mock ) 框架

Kakapo 是一個功能齊全的 http 模擬( mock )程式庫,他使你可以直接在瀏覽器中以簡單和宣告性的方式完全複製後端邏輯。 這樣,你無需後端即可輕鬆進行原型設計和開發整個應用程式,而在營運時只需停用Kakapo。 為了實現這一點,Kakapo為你提供了一組實用程式,例如路由,資料庫,響應,請求等。

資料科學

Mask R-CNN,用於在Keras和TensorFlow上進行物件檢測和實例分割

這是 Mask R-CNN 在Python 3,Keras和TensorFlow上的實現。 該模型為影象中物件的每個實例生成邊界框和分割遮罩。 它基於 Feature Pyramid Network (FPN)和 ResNet101 主幹網。

預先訓練好的聲音轉文字模型 ( STT )

Silero 模型: 預先訓練好的企業級 STT 模型和基準。我們提供的品質可以與 Google 的 STT 相媲美(有時甚至更好) ,而且我們不是谷歌。

這個模型目前支援英語/德語/西班牙語

資料探勘工具箱

ELKI 是用 Java 編寫的開源(AGPLv3)資料探勘軟體。 ELKI的重點是演算法研究,重點是聚類分析和離群值檢測中的非監督方法。 為了實現高效能和可伸縮性,ELKI 提供了許多資料索引結構,例如 R*-tree,它們可以帶來很大的效能提升。 ELKI 的設計易於擴充到這一領域的研究人員和學生,並歡迎特別是新方法的貢獻。 ELKI的目的是提供大量高度可參數化的演算法,以允許輕鬆,公正地評估和基準化演算法。

背景

資料探勘研究產生了許多用於類似任務的演算法。 由於以下幾個原因,很難對這些演算法進行公正,有用的比較:

  • 比較夥伴間的實現尚不成熟。
  • 如果提供了不同作者的實現方式,則在效率方面的評估會偏向於評估不同作者在有效程式設計中的工作,而不是評估演算法的優點。

另一方面,高效的資料管理工具(如索引結構)可能對資料探勘任務產生相當大的影響,因此可用於多種演算法。

在ELKI中,資料探勘演算法和資料管理任務是分開的,並允許進行獨立評估。 這種分離使得ELKI在資料探勘框架(例如Weka或Rapidminer)和索引結構框架(例如GiST)之間是獨一無二的。 同時,ELKI可以接受任意資料型別,距離或相似性度量或檔案格式。 基本方法是檔案解析器或資料庫連線,資料型別,距離,距離函式和資料探勘演算法的獨立性。 Helper 類別,例如 用於代數或解析運算的演算法可用於所有演算法,且均等。

Datumbox 是一個用 Java 編寫的開源機器學習框架,它允許機器學習和統計應用程式的快速發展。

Datumbox 機器學習框架是一個用 Java 編寫的開源框架,它允許快速開發機器學習和統計應用程式。該框架的主要重點是包括大量的機器學習演算法和統計方法,並能夠處理大規模的資料集。

行動應用程式設計

一個輕量級,純 Swift 程式庫用來從網路下載和快取影像

功能

  • 非同步影像下載和快取
  • 從任何一個 URLSession-based 網路或本地提供的資料載入影像
  • 提供有用的影象處理器和過濾器
  • 記憶體和磁碟的多層混合快取記憶體
  • 對快取行為的精細控制。可自定義的過期日期和大小限制
  • 可取消下載和自動重用先前下載的內容,以提高效能
  • 獨立元件。根據需要分別使用下載器、快取系統和影象處理器
  • 預取圖片並從快取中顯示它們來加速你的應用程式
  • UIImageView, NSImageView, NSButton and 及UIButton 的檢視擴充套件,直接從 URL 設定影象
  • 設定影象時內建的動畫過場特效
  • 載入影象時可自定義的 placeholder 和 indicator
  • 易於擴充的影象處理和影像格式化
  • SwiftUI support.

程式設計語言/程式庫

一個自主託管的模糊測試( Fuzzing-As-A-Service )平台

讓開發者可以在持續開發工作管線( pipeline )中嵌入模糊測試,以主動發現軟體的臭蟲與漏洞。開發者只要透過單一指令,就能夠啟動各種規模的模糊測試工作,從數台虛擬機器到數千顆核心的規模都可以。

模糊測試是一種提高程式碼安全性和可靠性的方法,讓開發人員在開發生命周期早期,就能夠主動發現臭蟲以及安全性漏洞

微軟內部使用這個框架來測試 Windows 作業系統的開發

更多資訊請參考 Microsoft announces new Project OneFuzz framework, an open source developer tool to find and fix bugs at scale

ITHome 有這篇報導的中文翻譯 https://www.ithome.com.tw/news/140016

訂閱網址

喜歡今天小編整理的開源報報嗎?歡迎給小編意見與回饋

Comments are closed.

Powered by WordPress.com.

Up ↑

%d 位部落客按了讚: