跳轉到主要內容

Apache火花™教程:開始使用Apache火花磚

歡迎

這個自學指南是Apache的“Hello World”教程使用磚火花。在接下來的教程模塊,您將學習創造火花工作的基本知識,加載數據和處理數據。你也會得到一個介紹運行機器學習算法和處理流媒體數據。磚允許您開始編寫火花立刻查詢,這樣你就可以專注於你的數據問題。

懸停在上方的導航欄,你會看到六個階段開始使用Apache火花磚。本指南將首先提供一個快速啟動如何使用開放源碼的Apache火花,然後利用這些知識來學習如何使用火花DataFrames火花SQL。我們還將討論如何使用數據集,現在DataFrames和數據集是如何統一。導遊也快速啟動機器學習和流媒體,這樣你就可以輕鬆地將它們應用到你的數據問題。這些模塊是指獨立使用scenarios-including物聯網和房屋銷售與筆記本電腦和數據集,這樣你就可以跳過,如果你感覺很舒服。

介紹Apache火花

火花的標誌

Apache火花是一個功能強大的開源處理引擎建立在速度、易用性和複雜的分析。

“在磚,我們正努力使火花更容易使用和運行,通過我們的努力在火花代碼庫和支持材料。我們所有的工作在火花是開放源代碼的,直接到Apache的。”

副總裁馬泰Zaharia, Apache火花,創始人和首席技術專家,磚

關於火花的更多信息,您還可以參考:

火花是什麼

最新的火花概述

把磚

是一個統一的分析平台Beplay体育安卓版本Apache的火花,加速創新通過統一數據科學、工程和業務。與我們的完全管理的火花在雲中集群,您可以輕鬆地提供集群隻需要點擊幾下。磚包含了一個集成的探索和可視化的工作區中,這樣用戶可以學習,工作,和合作在一個單一的,易於使用的環境。你可以安排任何現有的筆記本或本地開發火花代碼從原型到生產沒有再造。

此外,磚包括:

  • 我們的獲獎大規模網絡公開課程,”介紹大數據與Apache火花“迄今為止已登記了76000名參與者!
  • 網絡公開課大規模網絡公開課(),包括機器學習與Apache火花
  • 分析管道樣本R和Scala

發現在所有可用的課程//m.eheci.com/learn/training/home

額外的資源

網絡研討會

演示

更多的

繼續下一個模塊:

Baidu
map