2023 年最佳開源軟體

原文 : The best open source software of 2023

InfoWorld 的 2023 年 Bossie 獎旨在表彰年度領先的軟體開發、資料管理、分析、人工智慧和機器學習開源工具。17 年來,Bossies 每年慶賀最好、最具創新性的開源軟體。

與往年一樣,InfoWorld Bossie 在 2023 年的首選包括令人驚嘆的折衷技術組合。 在 25 個獲獎者中,你會發現程式語言、執行時間、應用程式框架、資料庫、分析引擎、機器學習程式庫、大型語言模型( Large Language Models,LLM)、用於部署 LLM 的工具,以及至少一兩個超出如此簡單描述的專案。

如果軟體中有一個重要問題需要解決,你可以打賭將會出現一個開源專案來解決它。

2023 年 Bossie 選出的開源有 :

  1. Apache Hud 一個交易資料湖平台,將資料庫和資料倉儲功能引入資料湖。 Hudi 透過強大的新增量處理框架重新構想了緩慢的老式批次資料處理,以實現低延遲的分鐘級分析。
  2. Apache Iceberg 適用於大型分析表的高性能格式。 Iceberg 為大數據帶來了 SQL 表的可靠性和簡單性,同時使 Spark、Trino、Flink、Presto、Hive 和 Impala 等引擎能夠同時安全地處理相同的表。
  3. Apache Superset 一個開源的現代資料探索和視覺化平台。
  4. Bun 開發、測試、運行和捆綁 JavaScript 和 TypeScript 專案—全部使用 Bun。 Bun 是一款專為提高速度而設計的一體化 JavaScript 執行階段和工具包,配有捆綁器、測試運行器和與 Node.js 相容的套件管理器。
  5. Claude 2 Claude 2 具有改進的效能、更長的回應時間,並且可以透過 API 以及面向公眾的新測試版網站 claude.ai ( 人工智慧助手,憲法人工智慧:人工智慧回饋的無害性 )進行存取。
  6. CockroachDB 在 CockroachDB 上執行任務關鍵型應用程式 – 雲端原生分散式 SQL 資料庫,專為高可用性、輕鬆擴展和資料放置控製而設計。
  7. CPython CPython 可以定義為解釋器和編譯器,因為它在解釋 Python 程式碼之前將其編譯為字節碼。 它具有與多種語言(包括 C)的外部函數接口,其中必須使用 Python 以外的語言明確編寫綁定。
  8. DuckDB 快速進程內分析資料庫,支援功能豐富的 SQL 方言,並與客戶端 API 進行深度整合
  9. HTMX and Hyperscript HTMX 採用你熟悉和喜愛的 HTML,並透過增強功能對其進行了擴展,使編寫現代 Web 應用程式變得更加容易。 HTMX 消除了許多用於將 Web 前端連接到後端的 JavaScript 樣板。 相反,它使用直覺的 HTML 屬性來執行諸如發出 AJAX 請求和使用資料填充元素之類的任務。 一個兄弟專案 Hyperscript 引入了類似 HyperCard 的語法來簡化許多 JavaScript 任務,包括非同步操作和 DOM 操作。 總而言之,HTMX 和 Hyperscript 為當前反應式框架的趨勢提供了大膽的替代願景。
  10. Istio 利用領先的服務網格簡化可觀察性、流量管理、安全性和策略。
  11. Kata Containers 開源容器運作時,建構無縫插入容器生態系統的輕量級虛擬機器。致力於使用輕量級虛擬機構建造安全的容器運行時,這些虛擬機的感覺和性能類似於容器,但使用硬體虛擬化技術作為第二層防禦提供更強大的工作負載隔離。
  12. LangChain LangChain 為開發人員提供了一個框架,可以輕鬆建立 LLM 支援的應用程式。
  13. Language Model Evaluation Harness 是 🤗 Hugging Face 流行的 Open LLM 排行榜的後端,已在數百篇論文中使用,並被 NVIDIA、Cohere、BigScience、BigCode、Nous Research 和 Mosaic ML 等數十個組織內部使用。
  14. Llama 2 透過具有人工智慧模型、工具和資源的開放平台實現存取民主化,讓人們有能力塑造下一波創新浪潮。
  15. Ollama 啟動並運行 Llama 2、Mistral、Gemma 和其他大型語言模型。
  16. Polars Polars 在獨立的 TPC-H 基準測試中與其他幾個解決方案進行了基準測試。 此基準測試旨在複製實務中使用的資料整理操作。 由於其平行執行引擎、高效演算法以及 SIMD(單指令、多重資料)向量化的使用,Polars 輕鬆勝過其他解決方案。 與pandas相比,它可以實現30倍以上的效能提升。
  17. PostgreSQL 全球最先進的開源關係型資料庫
  18. QLoRA 量化 LLM 的高效能微調
  19. RAPIDS 用於常見資料科​​學和分析任務的 GPU 加速 libraries 的集合。 每個 library 處理特定的任務,例如用於資料幀處理的 cuDF、用於圖形分析的 cuGraph 和用於機器學習的 cuML。 其他程式庫涵蓋影像處理、訊號處理和空間分析,而整合則將 RAPIDS 引入 Apache Spark、SQL 和其他工作負載。 如果現有的函式庫都不符合要求,RAPIDS 還包括 RAFT,這是用於建立自己的解決方案的 GPU 加速原語的集合。 RAPIDS 也與 Dask 攜手合作,跨多個節點進行擴展,並與 Slurm 一起在高效能運算環境中運行
  20. Spark NLP 最先進的自然語言處理 | 以前所未有的方式體驗大型語言模式的力量!利用 Spark NLP 釋放自然語言處理的全部潛力,Spark NLP 是一個提供可擴展 LLM 的開源庫 入門 GitHub
  21. StarRocks 開源、高效能分析資料庫 | 快速、新鮮且靈活:毫不妥協的分析
  22. TensorFlow.js 可用 JavaScript 開發機器學習的程式庫 | 以 JavaScript 開發機器學習模型,並直接在瀏覽器或 Node.js 中使用機器學習。
  23. vLLM 透過 PagedAttention 輕鬆、快速、便宜地提供 LLM 服務
  24. Weaviate 最簡單的建置方法和 規模化人工智慧應用 Weaviate 是一個開源的 AI 原生向量資料庫,可協助 開發人員創建直覺且可靠的人工智慧應用程式。
  25. Zig 用於維護健壯、最佳化和可重複使用軟體的通用程式語言和工具鏈。

原文對每個選擇都有詳細的介紹且有的還有影片幫助你更清楚了解。 想進一步了解請點入原文閱讀。

也許你會有興趣

輸入關鍵字尋找相關課程

不受 FB 演算法影響,歡迎透過 e-mail 訂閱網站更新

發表迴響

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料

由 WordPress.com 建置.

Up ↑

探索更多來自 Soft & Share 的內容

立即訂閱即可持續閱讀,還能取得所有封存文章。

Continue reading