Azure宇宙DB

Azure宇宙DB是微軟的全球分布,多模型數據庫。Azure宇宙DB使您能夠獨立彈性和吞吐量規模和存儲在任意數量的Azure的地理區域。它提供了吞吐量、延遲、可用性和一致性的保證全麵的服務水平協議(sla)。Azure宇宙DB為下列數據模型提供了api,可以使用sdk在多種語言:

  • SQL API

  • MongoDB API

  • 卡桑德拉的API

  • 圖(小鬼)API

  • 表API

這篇文章解釋了如何讀取數據,寫入數據使用磚Azure宇宙DB。更多最新的細節Azure宇宙DB,明白了加快大數據分析利用Apache火花Azure宇宙DB連接器

重要的

這個連接器支持宇宙Azure DB的核心(SQL) API。MongoDB的宇宙DB API,使用MongoDB火花連接器。對於宇宙DB卡桑德拉API,使用卡桑德拉火花連接器

創建和連接所需的庫

  1. 下載最新azure-cosmosdb-spark圖書館運行的版本的Apache火花。

  2. 上傳下載的JAR文件磚後的指令上傳一個Jar, Python雞蛋,或Python輪

  3. 安裝上傳圖書館到你的磚集群。

使用Azure宇宙DB火花連接器

以下Scala筆記本提供了一個簡單的例子,如何寫數據到宇宙從宇宙DB DB和讀取數據。看到Azure宇宙DB火花連接器項目的詳細文檔。

Azure宇宙DB筆記本

在新標簽頁打開筆記本