數據應用遷移到磚
本文介紹了現有的數據應用程序遷移到磚。磚提供了一個統一的方法,讓您的工作與數據從源係統在一個單一的平台。Beplay体育安卓版本
平台功能的概述,請參閱Beplay体育安卓版本磚是什麼?。
ETL作業遷移到磚
您可以遷移到Apache火花工作用於提取、轉換和加載數據從本地或原生雲實現磚隻有幾步。看到適應你的現有Apache為磚火花代碼。
磚火花SQL和預配置的功能延伸的開源集成合作夥伴集成和企業產品。如果你的ETL工作負載都寫在SQL或蜂巢,您可以遷移到磚用最小的重構。了解更多關於磚SQL服務:
為特定的指令從各種各樣的源係統遷移到磚上,看到的遷移ETL管道磚。
lakehouse取代您的企業數據倉庫
磚工作負載時的性能提供了最優值和數據存儲在lakehouse對齊。許多企業數據堆棧包括一個湖和一個企業數據倉庫,和組織創建複雜的ETL工作流盡量保持這些係統和數據同步。lakehouse允許您使用相同的數據,存儲在數據湖,在查詢和係統通常依賴於一個單獨的數據倉庫。更多lakehouse,見磚Lakehouse是什麼?。對數據倉庫數據磚,明白了數據倉庫是什麼磚?。
從企業數據倉庫遷移到lakehouse通常包括減少數據體係結構和工作流程的複雜性,但也有一些警告和最佳實踐完成這項工作時要牢記。看到你的數據倉庫到數據磚Lakehouse遷移。
統一你的ML,數據科學、和分析工作量
因為lakehouse提供了通過表查詢優化訪問基於雲的數據文件或文件路徑,你可以做ML,科學數據,分析數據的一個副本。磚,很容易將工作負載從開源和專用工具,並維護更新版本的許多分析師和數據科學家使用的開源庫。
大熊貓的工作負載在Jupyter筆記本可以同步和運行使用磚回購。磚提供本機支持大熊貓在所有磚運行時版本,並配置許多受歡迎的ML和深度學習庫磚毫升運行時。如果你當地的工作負載使用Git和同步文件在回購相同,您可以使用相對路徑的數據和自定義鄉鎮圖書館在你當地的環境。
請注意
默認情況下,磚維護.ipynb
與磚回購的擴展Jupyter筆記本同步,但自動轉換Jupyter筆記本時磚筆記本進口與UI。磚筆記本電腦保存的. py
擴展,因此可以與Jupyter筆記本一起生活在一個Git倉庫。