Apache Spark API參考

Databricks構建在Apache Spark之上,Apache Spark是一個用於大數據和機器學習的統一分析引擎。有關更多信息,請參見Apache Spark -什麼是Spark在Databricks網站上。

Apache Spark為大型數據集提供了易於使用的api。這包括用於轉換數據的超過100個操作符的集合,以及用於操作半結構化數據的熟悉的數據幀api。這些api包括:

要了解如何在Databricks上使用Apache Spark api,請參見: