資料介紹
軟件簡介
OpenMLDB是一個面向機器學習應用提供正確、高效數據供給的開源數據庫。除了超過10倍的機器學習數據開發效率的提升,OpenMLDB也提供了統一的計算與存儲引擎減少開發運維的復雜性與總體成本。
系統特性
-
一致性
OpenMLDB首先保證在線和離線特征計算一致性,科學家使用OpenMLDB建模生成的特征,可規避特征穿越等問題,上線后使用相同LLVM IR進行編譯優化,保證與在線特征計算邏輯一致。其次保證數據存儲一致性,數據從離線到在線進行實時同步,用戶不需要為離線和在線管理不同數據源,也避免數據不一致對特征和模型帶來的影響。
-
高性能
OpenMLDB基于C++和LLVM實現了原生SQL編譯器,內置了數十種物理計劃和表達式優化過程,可針對不同硬件環境動態生成二進制碼,內存結構針對特征存儲優化。最終特征存儲空間和成本比同類產品可降低9倍,在線實時特征計算性能提升9倍,離線批處理計算性能比同類產品也提升6倍以上。
-
高可用
OpenMLDB的大規模并行計算服務和數據庫存儲服務,都支持多節點分布式高可用特性,可以自動Failover避免單點故障。
-
SQL支持
OpenMLDB支持用戶友好的SQL接口,兼容大部分ANSI SQL語法以及針對AI場景拓展了新的SQL特性。以時序特征抽取為例,支持標準SQL的Over Window語法,還針對AI場景需求進行拓展,支持基于樣本表滑窗的Window Union語法,實時計算引擎支持基于當前行的Request Mode窗口聚合計算。
-
AI優化
OpenMLDB以面向ML應用開發優化為目標,架構設計以及實現上都針對AI進行大量優化。在存儲方面以高效的數據結構存儲特征數據,無論是內存利用率還是實時查詢效率都比同類型產品高數倍,而計算方面提供了機器學習場景常用的特殊拼表操作以及特征抽取相關UDF/UDAF支持,基本滿足生產環境下機器學習特征抽取和上線的應用需求。
-
低門檻
OpenMLDB使用門檻與普通數據庫接近,無論是建模科學家還是應用開發者都可以使用熟悉的SQL進行開發,并且同時支持ML應用落地所必須的離線大數據批處理服務以及在線特征計算服務,使用一個數據庫產品就可以低成本實現AI落地閉環。
快速開始
使用OpenMLDB快速開發和上線ML應用,以Kaggle比賽Predict Taxi Tour Duration項目為例。
# 啟動docker鏡像 docker run -it 4pdosc/openmldb:0.1.0 bash # 初始化環境 sh init.sh # 導入行程歷史數據到OpenMLDB python3 import.py # 使用行程數據進行模型訓練 python3 train.py ./fe.sql /tmp/model.txt # 使用訓練的模型搭建鏈接OpenMLDB的實時推理HTTP服務 sh start_predict_server.sh ./fe.sql 8887 /tmp/model.txt # 通過http請求發送一個推理請求 python3 predict.py
系統架構
- 面向機器學習的高可用、高并發數據庫:OpenMLDB 0次下載
- ACS數據庫與RSC數據庫比較研究
- 面向NoSQL數據庫的JSON文檔異常檢測模型 20次下載
- 創建新的數據庫和更改SQL Server CE數據庫中的數據操作教程免費下載 5次下載
- 數據庫教程之數據庫的設計過程資料說明 10次下載
- 數據庫學習入門資料之關系數據庫標準語言SQL的詳細資料概述 20次下載
- 數據庫學習教程之數據庫的發展狀況如何數據庫有什么新發展 5次下載
- 數據庫學習入門資料之如何進行數據庫設計 14次下載
- 數據庫教程之數據庫的創建與管理詳細資料免費下載 18次下載
- 數據庫教程之如何進行數據庫設計 21次下載
- 如何進行數據庫設計?數據庫設計介紹和需求分析及結構設計資料概述 0次下載
- 數據庫學習入門之如何進行數據庫設計詳細分析概述資料免費下載 14次下載
- 基于面向對象數據庫的CIM應用曹帥 0次下載
- 面向對象數據庫的關鍵技術和實現
- 基于面向對象的GIS數據庫的構建技術
- 數據庫優化那些事 462次閱讀
- 什么是數據庫 1190次閱讀
- MongoDB開源文檔數據庫的安裝 965次閱讀
- 常見的數據庫管理 1916次閱讀
- 云數據庫和自建數據庫的區別及應用 4412次閱讀
- 關于數據庫安全技術的概述 1785次閱讀
- 一文看懂數據庫原理與應用 11.7w次閱讀
- 數據庫引擎是什么 1.1w次閱讀
- 常用的數據庫引擎有哪些_數據庫引擎分類 2.1w次閱讀
- 多維數據庫有哪些 7031次閱讀
- 什么是數據庫技術_數據庫技術的基礎知識 1.3w次閱讀
- 目前流行的數據庫_構建數據庫系統的流程 7076次閱讀
- 數據庫的基本概念和應用領域 2781次閱讀
- 機器學習與數據挖掘的關系 4186次閱讀
- SQL Server數據庫學習總結 4577次閱讀
下載排行
本周
- 1山景DSP芯片AP8248A2數據手冊
- 1.06 MB | 532次下載 | 免費
- 2RK3399完整板原理圖(支持平板,盒子VR)
- 3.28 MB | 339次下載 | 免費
- 3TC358743XBG評估板參考手冊
- 1.36 MB | 330次下載 | 免費
- 4DFM軟件使用教程
- 0.84 MB | 295次下載 | 免費
- 5元宇宙深度解析—未來的未來-風口還是泡沫
- 6.40 MB | 227次下載 | 免費
- 6迪文DGUS開發指南
- 31.67 MB | 194次下載 | 免費
- 7元宇宙底層硬件系列報告
- 13.42 MB | 182次下載 | 免費
- 8FP5207XR-G1中文應用手冊
- 1.09 MB | 178次下載 | 免費
本月
- 1OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234315次下載 | 免費
- 2555集成電路應用800例(新編版)
- 0.00 MB | 33566次下載 | 免費
- 3接口電路圖大全
- 未知 | 30323次下載 | 免費
- 4開關電源設計實例指南
- 未知 | 21549次下載 | 免費
- 5電氣工程師手冊免費下載(新編第二版pdf電子書)
- 0.00 MB | 15349次下載 | 免費
- 6數字電路基礎pdf(下載)
- 未知 | 13750次下載 | 免費
- 7電子制作實例集錦 下載
- 未知 | 8113次下載 | 免費
- 8《LED驅動電路設計》 溫德爾著
- 0.00 MB | 6656次下載 | 免費
總榜
- 1matlab軟件下載入口
- 未知 | 935054次下載 | 免費
- 2protel99se軟件下載(可英文版轉中文版)
- 78.1 MB | 537798次下載 | 免費
- 3MATLAB 7.1 下載 (含軟件介紹)
- 未知 | 420027次下載 | 免費
- 4OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234315次下載 | 免費
- 5Altium DXP2002下載入口
- 未知 | 233046次下載 | 免費
- 6電路仿真軟件multisim 10.0免費下載
- 340992 | 191187次下載 | 免費
- 7十天學會AVR單片機與C語言視頻教程 下載
- 158M | 183279次下載 | 免費
- 8proe5.0野火版下載(中文版免費下載)
- 未知 | 138040次下載 | 免費
評論
查看更多