Apache火花™
Apache是一個閃電般的火花統一的分析引擎大數據和機器學習。它最初是2009年在加州大學伯克利分校的開發。
最大的開源項目數據處理。
自發布以來,Apache火花,統一分析引擎,快速采用跨廣泛的行業企業。Netflix等互聯網巨頭、雅虎和易趣在大規模部署的火花,共同處理多個pb的數據在超過8000個節點的集群上。它迅速成為最大的開源社區在大數據,超過1000貢獻者來自250 +組織。
團隊開始的火花在加州大學伯克利分校的研究項目在2013年創立磚。
開放源碼Apache火花是100%,在獨立於供應商的Apache軟件基金會主辦。在磚,我們完全致力於維護這開放的發展模式。一起火花社區,磚繼續貢獻大量的Apache星火項目,通過發展和社區傳福音。
Apache火花——Apache火花的好處是什麼
速度
自底向上的設計性能,火花100倍的速度比Hadoop進行大規模數據處理通過利用在內存中計算和其他優化。火花也快當數據是存儲在磁盤上,和目前擁有的世界紀錄大規模磁盤排序。
易用性
火花易於使用的api操作大型數據集。這包括超過100個運營商轉換數據的集合和熟悉的數據幀api操縱半結構化數據。
一個統一的引擎
火花一起打包的高級庫,包括支持SQL查詢,流媒體數據,機器學習和圖像處理。這些標準庫提高開發人員的生產力,可以無縫地結合創建複雜的工作流。