原文 : The best open source software of 2023
InfoWorld 的 2023 年 Bossie 獎旨在表彰年度領先的軟體開發、資料管理、分析、人工智慧和機器學習開源工具。17 年來,Bossies 每年慶賀最好、最具創新性的開源軟體。
與往年一樣,InfoWorld Bossie 在 2023 年的首選包括令人驚嘆的折衷技術組合。 在 25 個獲獎者中,你會發現程式語言、執行時間、應用程式框架、資料庫、分析引擎、機器學習程式庫、大型語言模型( Large Language Models,LLM)、用於部署 LLM 的工具,以及至少一兩個超出如此簡單描述的專案。
如果軟體中有一個重要問題需要解決,你可以打賭將會出現一個開源專案來解決它。
2023 年 Bossie 選出的開源有 :
- Apache Hud 一個交易資料湖平台,將資料庫和資料倉儲功能引入資料湖。 Hudi 透過強大的新增量處理框架重新構想了緩慢的老式批次資料處理,以實現低延遲的分鐘級分析。
- Apache Iceberg 適用於大型分析表的高性能格式。 Iceberg 為大數據帶來了 SQL 表的可靠性和簡單性,同時使 Spark、Trino、Flink、Presto、Hive 和 Impala 等引擎能夠同時安全地處理相同的表。
- Apache Superset 一個開源的現代資料探索和視覺化平台。
- Bun 開發、測試、運行和捆綁 JavaScript 和 TypeScript 專案—全部使用 Bun。 Bun 是一款專為提高速度而設計的一體化 JavaScript 執行階段和工具包,配有捆綁器、測試運行器和與 Node.js 相容的套件管理器。
- Claude 2 Claude 2 具有改進的效能、更長的回應時間,並且可以透過 API 以及面向公眾的新測試版網站 claude.ai ( 人工智慧助手,憲法人工智慧:人工智慧回饋的無害性 )進行存取。
- CockroachDB 在 CockroachDB 上執行任務關鍵型應用程式 – 雲端原生分散式 SQL 資料庫,專為高可用性、輕鬆擴展和資料放置控製而設計。
- CPython CPython 可以定義為解釋器和編譯器,因為它在解釋 Python 程式碼之前將其編譯為字節碼。 它具有與多種語言(包括 C)的外部函數接口,其中必須使用 Python 以外的語言明確編寫綁定。
- DuckDB 快速進程內分析資料庫,支援功能豐富的 SQL 方言,並與客戶端 API 進行深度整合
- HTMX and Hyperscript HTMX 採用你熟悉和喜愛的 HTML,並透過增強功能對其進行了擴展,使編寫現代 Web 應用程式變得更加容易。 HTMX 消除了許多用於將 Web 前端連接到後端的 JavaScript 樣板。 相反,它使用直覺的 HTML 屬性來執行諸如發出 AJAX 請求和使用資料填充元素之類的任務。 一個兄弟專案 Hyperscript 引入了類似 HyperCard 的語法來簡化許多 JavaScript 任務,包括非同步操作和 DOM 操作。 總而言之,HTMX 和 Hyperscript 為當前反應式框架的趨勢提供了大膽的替代願景。
- Istio 利用領先的服務網格簡化可觀察性、流量管理、安全性和策略。
- Kata Containers 開源容器運作時,建構無縫插入容器生態系統的輕量級虛擬機器。致力於使用輕量級虛擬機構建造安全的容器運行時,這些虛擬機的感覺和性能類似於容器,但使用硬體虛擬化技術作為第二層防禦提供更強大的工作負載隔離。
- LangChain LangChain 為開發人員提供了一個框架,可以輕鬆建立 LLM 支援的應用程式。
- Language Model Evaluation Harness 是 🤗 Hugging Face 流行的 Open LLM 排行榜的後端,已在數百篇論文中使用,並被 NVIDIA、Cohere、BigScience、BigCode、Nous Research 和 Mosaic ML 等數十個組織內部使用。
- Llama 2 透過具有人工智慧模型、工具和資源的開放平台實現存取民主化,讓人們有能力塑造下一波創新浪潮。
- Ollama 啟動並運行 Llama 2、Mistral、Gemma 和其他大型語言模型。
- Polars Polars 在獨立的 TPC-H 基準測試中與其他幾個解決方案進行了基準測試。 此基準測試旨在複製實務中使用的資料整理操作。 由於其平行執行引擎、高效演算法以及 SIMD(單指令、多重資料)向量化的使用,Polars 輕鬆勝過其他解決方案。 與pandas相比,它可以實現30倍以上的效能提升。
- PostgreSQL 全球最先進的開源關係型資料庫
- QLoRA 量化 LLM 的高效能微調
- RAPIDS 用於常見資料科學和分析任務的 GPU 加速 libraries 的集合。 每個 library 處理特定的任務,例如用於資料幀處理的 cuDF、用於圖形分析的 cuGraph 和用於機器學習的 cuML。 其他程式庫涵蓋影像處理、訊號處理和空間分析,而整合則將 RAPIDS 引入 Apache Spark、SQL 和其他工作負載。 如果現有的函式庫都不符合要求,RAPIDS 還包括 RAFT,這是用於建立自己的解決方案的 GPU 加速原語的集合。 RAPIDS 也與 Dask 攜手合作,跨多個節點進行擴展,並與 Slurm 一起在高效能運算環境中運行
- Spark NLP 最先進的自然語言處理 | 以前所未有的方式體驗大型語言模式的力量!利用 Spark NLP 釋放自然語言處理的全部潛力,Spark NLP 是一個提供可擴展 LLM 的開源庫 入門 GitHub
- StarRocks 開源、高效能分析資料庫 | 快速、新鮮且靈活:毫不妥協的分析
- TensorFlow.js 可用 JavaScript 開發機器學習的程式庫 | 以 JavaScript 開發機器學習模型,並直接在瀏覽器或 Node.js 中使用機器學習。
- vLLM 透過 PagedAttention 輕鬆、快速、便宜地提供 LLM 服務
- Weaviate 最簡單的建置方法和 規模化人工智慧應用 Weaviate 是一個開源的 AI 原生向量資料庫,可協助 開發人員創建直覺且可靠的人工智慧應用程式。
- Zig 用於維護健壯、最佳化和可重複使用軟體的通用程式語言和工具鏈。
原文對每個選擇都有詳細的介紹且有的還有影片幫助你更清楚了解。 想進一步了解請點入原文閱讀。
也許你會有興趣
- ★英語學習地圖 – 練好英文是最大的學習槓桿
- 如何找工作學習地圖 – 找工作不要靠運氣!
- 從 Soft & Share 各種社團頻道挑選你喜歡的加入
發表迴響