比較Apache火花TM和磚


Apache Spark的功能提供了速度、易用性和廣泛的使用優勢,包括支持一係列用例的api:

  • 數據集成和ETL
  • 互動分析
  • 機器學習和高級分析
  • 實時數據處理

v


Databricks構建於Spark之上,並添加:

  • 高可靠性和高性能的數據管道
  • 大規模的生產性數據科學

想了解更多嗎?訪問我們的Beplay体育安卓版本平台頁麵

特征比較

磚

了解更多

是的 沒有
運行多個Spark版本 是的 沒有
內置為雲存儲訪問優化的文件係統(AWS S3, Redshift, Azure Blob) 是的 沒有
無服務器池為SQL和Python工作負載提供自動配置資源 是的 沒有
spark本地細粒度資源共享,以實現最佳利用 是的 沒有
計算資源故障隔離 是的 沒有
更快地寫入S3 是的 沒有
在連接和過濾器期間進行計算優化 是的 沒有
快速的發布周期 是的 沒有
伸縮計算 是的 沒有
伸縮本地存儲 是的 沒有
集群的高可用性 是的 沒有
多用戶共享集群 是的 沒有
在現貨和按需實例之間自動遷移 是的 沒有
第二級計費 是的 沒有

是的 沒有

ACID事務 是的 沒有
模式管理 是的 沒有
批處理/流讀/寫支持 是的 沒有
數據版本控製 是的 沒有
性能優化 是的 沒有

是的 沒有
交互式筆記本,支持多種語言(SQL, Python, R和Scala) 是的 沒有
實時協作 是的 沒有
筆記本修訂曆史和GitHub集成 是的 沒有
一鍵式可視化 是的 沒有
將筆記本發布為交互式儀表板 是的 沒有

是的 沒有
Spark作業監視警報 是的 沒有
從筆記本電腦到Spark Jobs的一鍵式部署 是的 沒有
在筆記本中構建工作流的api 是的 沒有
帶監控的生產流 是的 沒有

了解更多

是的 沒有
對筆記本、集群、作業和結構化數據的訪問控製 是的 沒有
審計日誌 是的 沒有
支持SAML 2.0的SSO 是的 沒有
數據加密(靜態和動態) 是的 沒有
符合標準(HIPAA, SOC 2 2型) 是的 沒有

是的 沒有
通過認證的ODBC/JDBC連接其他BI工具(Tableau, Looker等) 是的 沒有
REST API 是的 沒有
數據源連接 是的 沒有

是的 沒有
Spark工程師的提交者的幫助和支持 是的 沒有
SQL支持 是的 沒有

額外的資源

雲環境下的大數據SQL平台基準測試Beplay体育安卓版本

博客

Hotels.com是如何在不出現性能問題的情況下將數據分析提高20倍的

客戶的故事

管理三角洲湖:最好的數據湖、倉庫和流係統。

演示