介紹磚機器學習:Data-native的、協作的、完整的ML生命周期解決方案beplay娱乐ios
2021年5月27日 在Beplay体育安卓版本平台的博客
今天,我們宣布啟動磚機器學習,第一個企業data-native毫升溶液,協作,支持完整的ML生命周期。beplay娱乐ios這次發射引入了一個新的專用產品在磚表麵專門為機器學習(ML)彙集了現有的功能,如MLflow管理,並介紹了新組件,如AutoML和特色商店。磚毫升為毫升全生命周期提供了一種解決方案通過支持任何數據類型在任何規模,使得用戶培訓毫升與ML框架模型的選擇和管理模型部署生命周期——從大規模批量得分低延遲的在線服務。
困難的部分是人工智能的數據
許多毫升平台是短Beplay体育安卓版本視的,因為他們忽略了一個關鍵的挑戰在ML:他們認為高質量的數據準備和提供培訓。需要數據團隊整合解決方案,擅長數據但不是AI,與他人,擅長人工智能而不是數據。讓事情更加複雜的是,人們負責數據平台和管道(數據工程師)不同於那些火車毫升模型(數據科學家),不同於那些部署產品應用(工程團Beplay体育安卓版本隊的業務應用程序)。結果,毫升的解決方案需要橋之間的差距數據和人工智能,所需的工具和涉及的人員。
答案是data-native完整毫升和協作解決方案生命周期beplay娱乐ios
Data-native
毫升模型是“編譯”的結果數據和代碼為機器學習模型。然而,現有的工具用於軟件開發不足處理數據和代碼之間的這種相互依存關係。磚毫升lakehouse之上構建一個開放的數據基礎上,這使得它第一個data-native毫升的解決方案。功能包括:
- 任何類型的數據,在任何規模,從任何來源:與機器學習運行時,用戶能夠接收和處理圖像、音頻、視頻、表格或任何其他類型的數據——從CSV文件到tb的流物聯網傳感器數據。與連接器的一個開源生態係統,數據從任何數據源可攝入,穿過雲層,從06或物聯網傳感器。
- 內置的數據版本控製、血統和治理:集成與時間旅行特征,三角洲湖,磚毫升的自動跟蹤的具體版本數據用於訓練模型。結合其他血統MLflow記錄的信息,這提供了完整的端到端治理促進強勁毫升管道。
beplay娱乐ios
完全productionizing毫升的模型需要的貢獻數據工程師,數據科學家和應用工程師。磚毫升促進協作數據團隊的所有成員都支持他們的工作流在磚和通過提供內置的傳遞過程。主要特點包括:
- 多語言筆記本:磚的筆記本支持Python、SQL、R和Scala在相同的筆記本。這為個人提供了靈活性想混合和匹配,以及個人喜歡不同語言間的協作。
- 進行協作的特點:beplay娱乐ios磚的筆記本可以實時共享,共同工作。用戶可以看到誰是活躍在一個筆記本co-presence指示器和觀察他們的實時變化。內置的評論進一步促進合作。
- 模型生命周期管理:模型注冊表是一個協作中心團隊可以共享毫升模型,從beplay娱乐ios實驗到在線測試和生產協作,與批準和管理工作流集成,監控毫升部署和他們的表現。
- 共享和管理訪問:啟用安全協作,磚提供細粒度訪問控製的所有類型的對象(筆記本、實驗、模型等)。
完整的ML生命周期
MLOps結合DataOps, DevOps ModelOps。MLops吧,有一個巨大的生態係統需要集成的工具。磚毫升采用獨特的方法支持完整的ML MLOps生命周期和正確。
- DataOps:通過其data-native自然,磚毫升是唯一毫升的平台,提供了內置的數據版本控製和治理。Beplay体育安卓版本確切的版本的數據記錄每毫升模型訓練數據磚。
- DevOps:磚毫升與Git提供商提供本地集成通過其回購功能,使數據團隊遵循最佳實踐與CI / CD係統和集成。
- ModelOps:與托管MLflow磚毫升提供一套完整的功能從跟蹤毫升模型與它們相關的參數和指標,管理部署生命周期,所有模式的部署模型(批在線評分)在任何平台(AWS, Azure GCP、on-prem或設備上)。Beplay体育安卓版本
- 完整的再現性:提供一個完整解決方案毫升全生命周期意味著磚毫升的工作完全重現:數據、參數、指標、模型、計算配置和代碼,庫版本都隨時跟蹤,可以複製。
新的儀表盤persona-based導航和機器學習
為了簡化毫升全生命周期數據磚,我們引入一個新的persona-based導航。機器學習是一種新的選擇,與數據科學與工程和SQL。通過選擇機器學習,用戶獲得的所有工具和功能訓練、管理和部署毫升模型。我們還提供了一個新的ML著陸頁表麵最近訪問毫升資產(如模型、功能試驗)和ML-related資源。
存儲和AutoML介紹:功能
最新增加磚機器學習的進一步強調data-native和協作平台的獨特屬性:beplay娱乐iosBeplay体育安卓版本
特色商店
存儲是存儲第一個特性,我們的特性是協同設計數據和MLops平台。Beplay体育安卓版本它促進重用的功能集中的功能注冊表和消除在線/離線傾斜的風險提供了一致的訪問離線功能(用於培訓和批得分)和在線服務(模型)。
- 為了方便端到端血統和lineage-based搜索,功能注冊跟蹤所有功能表,生產他們的代碼,源數據用於計算特性和所有消費者的特性(例如模型和端點)。這提供了完整的家族從原始數據,功能表根據原始數據計算,和哪個模型使用哪個功能表。
- 來確保培訓和服務功能一致性,消除離線/在線傾斜,功能提供者使特性在高吞吐量和低延遲。功能提供者還集成了MLflow,簡化模型部署過程。MLflow模型格式存儲信息功能模型從功能存儲消耗,和在部署模型負責查找功能,允許客戶機應用程序調用模型完全忽略的存在特性
閱讀更多關於我們的特性存儲產品功能存儲發布博客。
AutoML
AutoML產品采用玻璃箱的方法,為公民提供了一個基於ui的工作流數據科學家建議部署模型。AutoML還生成訓練數據科學家會寫代碼,自己如果他們開發了相同的模型。這種透明度是高度監管的關鍵環境和與專家合作數據科學家。
- 在高度監管的環境中,可審核性和再現性通常是一個艱難的要求。大多數AutoML產品opaque-boxes隻提供模型工件,因此很難滿足監管要求提供什麼類型的可見性模型訓練,等。因為磚AutoML生成完整的Python筆記本培訓代碼,我們為監管部門提供完整的可見性。
- 為與專家合作數據科學家,生成的代碼是一個起點,可以用來調整模型使用專業領域。在實踐中,AutoML通常用於一個基線模型,一旦模型顯示承諾,專家可以完善它。
了解更多關於我們的AutoML產品AutoML發布博客文章。
開始
磚機的學習是提供給所有磚客戶從今天開始。beplay体育app下载地址隻需點擊新角色切換器並選擇機器學習。新的導航欄將給你訪問所有毫升特性,和ML儀表板將指導您完成相關資源並提供訪問您最近使用毫升工件。了解更多我們的文檔AWS,Azure和GCP。