取消
顯示的結果
而不是尋找
你的意思是:

從Azure存儲讀取數據

bchaubey
貢獻者

嗨,團隊,

我可以知道如何閱讀Azure存儲的數據通過Python磚。

1接受解決方案

接受的解決方案

Kaniz
社區經理
社區經理

嗨@Bhagwan Chaubey,一旦你將你的文件上傳到blob容器,

步驟1:將憑證磚必須連接到您的blob容器

從你的Azure門戶,您需要導航到所有的資源然後選擇你的blob存儲賬戶和下設置選擇賬戶的鑰匙。一旦有,關鍵在Key1複製到一個本地記事本。

步驟2:配置磚來讀取文件

開始讀數據,首先,您需要配置您的火花blob容器會話使用的憑證。這可以簡單地通過spark.conf。設置命令。

storage_account_name = ' nameofyourstorageaccount ' storage_account_access_key = thekeyfortheblobcontainer spark.conf.set (“fs.azure.account.key。”+ storage_account_name +“.blob.core.windows.net”, storage_account_access_key)

一旦完成,我們需要建立blob容器的文件路徑和讀取文件引發數據幀。

blob_container = ' yourblobcontainername ' filePath =“wasbs: / /”+ blob_container + + storage_account_name + ".blob.core.windows.net/Sales/SalesFile.csv“@ salesDf = spark.read.format (csv)。負載(filePath inferSchema = True,頭= True)

恭喜,做完了。

您可以使用顯示命令我們的數據先睹為快。

下麵是我的代碼的快照。

截圖2022-01-06 5.24.47點

在原帖子查看解決方案

17日回複17

Kaniz
社區經理
社區經理

你好@bchaubey!我的名字叫Kaniz,我這裏的技術主持人。很高興認識你,謝謝你的問題!看看你的同行在社區中有一個回答你的問題。否則我將盡快給你回電。謝謝。

Kaniz
社區經理
社區經理

嗨@Bhagwan Chaubey,您可以使用python通過下文提及的代碼來訪問你的文件。

#一旦你安裝一個Blob存儲容器容器內的一個或一個文件夾通過代碼:——dbutils.fs。山(源= " wasbs: / / <容器名稱> @ < storage-account-name > .blob.core.windows.net”, mount_point =“/ mnt / < mount-name >”, extra_configs = {" < conf-key > ": dbutils.secrets。get(範圍= " < scope-name >”,關鍵=“<鍵名>”)})#讀取csv數據df = spark.read.csv (“dbfs: / mnt / % s / ....”% ) display(df)

bchaubey
貢獻者

@Kaniz Fatma找到如何掛載點的價值=“/ mnt / < mount-name >”

嗨@Bhagwan Chaubey,

< mount-name >是DBFS路徑代表的Blob存儲容器或容器內部的一個文件夾中指定(源)將安裝在DBFS。

創建文件夾在您的blob容器嗎?如果不是,你將簡單-掛載點“dbfs: / mnt / dataset.csv”

你可以在下麵的截圖中看到:-

如果我想讀country_classification.csv文件,在我的例子中掛載點將“dbfs: / mnt / country_classification。csv”我沒有創建任何文件夾或目錄在我的團。

截圖2022-01-05 6.51.11點添加我的臨時代碼:-

截圖2022-01-05 6.55.11點請讓我知道如果你有任何疑問。

歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map