Databricks數據科學與工程指南
Databricks數據科學與工程是用於數據科學家,數據工程師和數據分析師之間協作的經典數據映環境。它還形成了Databricks機器學習環境。
筆記
如果您是主要使用SQL查詢和BI工具的數據分析師,則可能更喜歡Databricks SQL基於角色的環境。
Databricks數據科學與工程指南提供了如何幫助您充分利用Databricks協作分析平台。beplay娱乐iosBeplay体育安卓版本有關入門教程和介紹性信息,請參見開始使用Databricks和Databricks簡介。
-
導航工作區
了解如何瀏覽數據快速工作區並訪問工作區中可用的資產。
-
數據範圍和數據集
了解如何在Databricks中使用Apache Spark DataFrames和數據集。
-
結構化流
了解如何使用Apache Spark結構化流媒體來表達數據映中流數據的計算。
-
運行時間
了解Databricks Runtimes和運行時內容的類型。
-
集群
了解有關數據串群以及如何創建和管理它們。
-
筆記本
了解如何管理和使用Databricks中的筆記本。
-
工作流程
了解如何使用數據處理中的數據處理工具和框架。
-
庫
了解如何使用和管理Databricks中的庫。
-
與Databricks Repos集成的GIT集成
了解如何使用git作為共存的databricks存儲庫來管理數據串筆記本和工作區文件夾。
-
Databricks文件係統(DBFS)
了解有關數據磁計文件係統(DBFS),這是一個安裝在數據串件工作區中的分布式文件係統,並在Databricks群集上找到
-
移民
了解如何將工作負載遷移到數據映。
-
應用:基因組學
了解如何使用Databricks和Glow處理基因組數據。