Databricks數據科學與工程指南

Databricks數據科學與工程是用於數據科學家,數據工程師和數據分析師之間協作的經典數據映環境。它還形成了Databricks機器學習環境

筆記

如果您是主要使用SQL查詢和BI工具的數據分析師,則可能更喜歡Databricks SQL基於角色的環境。

Databricks數據科學與工程指南提供了如何幫助您充分利用Databricks協作分析平台。beplay娱乐iosBeplay体育安卓版本有關入門教程和介紹性信息,請參見開始使用DatabricksDatabricks簡介

  • 導航工作區

    了解如何瀏覽數據快速工作區並訪問工作區中可用的資產。

  • 數據範圍和數據集

    了解如何在Databricks中使用Apache Spark DataFrames和數據集。

  • 結構化流

    了解如何使用Apache Spark結構化流媒體來表達數據映中流數據的計算。

  • 運行時間

    了解Databricks Runtimes和運行時內容的類型。

  • 集群

    了解有關數據串群以及如何創建和管理它們。

  • 筆記本

    了解如何管理和使用Databricks中的筆記本。

  • 工作流程

    了解如何使用數據處理中的數據處理工具和框架。

  • 了解如何使用和管理Databricks中的庫。

  • 與Databricks Repos集成的GIT集成

    了解如何使用git作為共存的databricks存儲庫來管理數據串筆記本和工作區文件夾。

  • Databricks文件係統(DBFS)

    了解有關數據磁計文件係統(DBFS),這是一個安裝在數據串件工作區中的分布式文件係統,並在Databricks群集上找到

  • 移民

    了解如何將工作負載遷移到數據映。

  • 應用:基因組學

    了解如何使用Databricks和Glow處理基因組數據。