Azure宇宙DB
Azure宇宙DB是微軟的全球分布,多模型數據庫。Azure宇宙DB使您能夠獨立彈性和吞吐量規模和存儲在任意數量的Azure的地理區域。它提供了吞吐量、延遲、可用性和一致性的保證全麵的服務水平協議(sla)。Azure宇宙DB為下列數據模型提供了api,可以使用sdk在多種語言:
SQL API
MongoDB API
卡桑德拉的API
圖(小鬼)API
表API
這篇文章解釋了如何讀取數據,寫入數據使用磚Azure宇宙DB。更多最新的細節Azure宇宙DB,明白了加快大數據分析利用Apache火花Azure宇宙DB連接器。
重要的
這個連接器支持宇宙Azure DB的核心(SQL) API。MongoDB的宇宙DB API,使用MongoDB火花連接器。對於宇宙DB卡桑德拉API,使用卡桑德拉火花連接器。
創建和連接所需的庫
下載最新azure-cosmosdb-spark圖書館運行的版本的Apache火花。
上傳下載的JAR文件磚後的指令上傳一個Jar, Python雞蛋,或Python輪。
安裝上傳圖書館到你的磚集群。
使用Azure宇宙DB火花連接器
以下Scala筆記本提供了一個簡單的例子,如何寫數據到宇宙從宇宙DB DB和讀取數據。看到Azure宇宙DB火花連接器項目的詳細文檔。