Apache火花結構化流是什麼?

Apache火花結構化流是一個實時處理引擎,提供端到端容錯僅一次處理保證使用熟悉的火花api。結構化的流媒體數據流可以表達計算你以同樣的方式表達對靜態數據批處理計算。結構化流引擎執行計算的增量,不斷更新結果流數據的到來。結構化流的概述,請參閱Apache火花結構化流編程指南

使用結構化流信息的統一目錄,看看使用統一的目錄和結構化流

結構化流用於磚嗎?

結構化流對緊密與三角洲湖為增量數據處理提供增強的功能在磚Lakehouse規模。結構化流是核心技術的核心數據磚自動加載程序,以及三角洲生活表。

什麼流源和彙磚支持嗎?

磚建議使用自動加載程序來攝取從雲支持文件類型對象存儲到三角洲湖。對ETL管道磚建議使用三角洲生活表(使用三角洲表和結構化流)。您還可以配置增量ETL工作負載由三角洲湖流和表。

除了三角洲湖和自動加載程序,結構化流可以連接到消息傳遞服務例如Apache卡夫卡。

你也可以使用foreachBatch編寫任意數據彙

結構化流生產的最佳實踐是什麼?

磚支持許多邊緣特性沒有找到在Apache火花,幫助客戶獲得最佳性能的結構化流。beplay体育app下载地址了解更多關於這些特性和其他建議生產注意事項結構化流

例子

介紹性的筆記本電腦和筆記本電腦演示示例用例,明白了在磚結構化流模式

API參考

結構化流信息供參考,磚建議以下Apache火花API參考: