@Morten Stakkeland:
是的,它是可以配置多個位置的自動裝卸機讀。
您可以定義多個CloudFiles源自動裝卸機,每個指向不同的集裝箱在同一存儲賬戶。在你的情況中,因為文件的模式是相同的,您可以使用相同的模式的來源。下麵是一個例子,你可以定義多個源自動裝卸機配置:
{“格式”:“三角洲”,“模式”:“追加”,“cloudFiles”: {" cloudStorage ":{“超時”:“1 h”、“帳號名稱”:“< storage-account-name >”,“accountKey”:“< storage-account-access-key >”},“useIncrementalListing”:真的,“maxConcurrentFileCount”: 20,“源”:[{“路徑”:“container1 /”、“globPattern”:“*。csv”、“遞歸”:真正的},{“路徑”:“container2 /”、“globPattern”:“*。csv”、“遞歸”:真正}]}}
在這個例子中,我們定義了兩個來源,一個用於container1 /目錄和一個用於container2 /目錄中。globPattern參數指定,我們隻想負載CSV文件,並遞歸參數告訴自動裝卸機遞歸搜索子目錄中的文件。
注意,您還可以使用不同模式的兩個來源如果必要,隻要他們有相同的列名稱和數據類型。
@Morten Stakkeland:
是的,它是可以配置多個位置的自動裝卸機讀。
您可以定義多個CloudFiles源自動裝卸機,每個指向不同的集裝箱在同一存儲賬戶。在你的情況中,因為文件的模式是相同的,您可以使用相同的模式的來源。下麵是一個例子,你可以定義多個源自動裝卸機配置:
{“格式”:“三角洲”,“模式”:“追加”,“cloudFiles”: {" cloudStorage ":{“超時”:“1 h”、“帳號名稱”:“< storage-account-name >”,“accountKey”:“< storage-account-access-key >”},“useIncrementalListing”:真的,“maxConcurrentFileCount”: 20,“源”:[{“路徑”:“container1 /”、“globPattern”:“*。csv”、“遞歸”:真正的},{“路徑”:“container2 /”、“globPattern”:“*。csv”、“遞歸”:真正}]}}
在這個例子中,我們定義了兩個來源,一個用於container1 /目錄和一個用於container2 /目錄中。globPattern參數指定,我們隻想負載CSV文件,並遞歸參數告訴自動裝卸機遞歸搜索子目錄中的文件。
注意,您還可以使用不同模式的兩個來源如果必要,隻要他們有相同的列名稱和數據類型。