取消
顯示的結果
而不是尋找
你的意思是:

建議需要一個協調器/調度器調度和執行工作以自動化的方式

BkP
貢獻者

你好朋友,

我們有一個應用程序,它從各種表提取dat Azure磚,我們提取的postgres表(postgres安裝在Azure vm)。提取我們應用變換後的數據集在postgres表的幫助下火花在木星的筆記本和編寫的程序加載數據Neo4j圖形數據庫(Neo4j安裝在另一個Azure VM)。現在我們正在做提取通過SQL查詢和轉換Postgres我們利用Python(火花)計劃。有很多的表(超過100),有依賴性,不可能所有手動運行。因此,我們正在尋找一個協調器和調度器可以創建我們的工作執行工作流和安排他們運行在一個特定的時間框架。你能推薦一個嗎?提前感謝。我將該應用程序的架構,在這篇文章。

圖像

15日回複15

匿名
不適用

Apache氣流似乎是標準的工具。

謝謝你回複@Joseph Kambourakis,將探索更多關於Apache氣流和嚐試

User16764241763
尊敬的貢獻者

您還應該能夠使用Azure數據工廠編製和安排管道。

https://azure.microsoft.com/en-in/services/data-factory/

謝謝你的響應@Arvind強奸

歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map