我通常建議人們將數據存儲在一個單獨的存儲賬戶(安裝或者直接使用),不要使用的內部存儲空間的任務。主要原因,這是更容易與其他工作區共享這些數據,或其他係統如果是必要的。應該主要用於內部存儲臨時文件、庫、init腳本等。
有很多有用的指南可以幫助:
https://github.com/Azure/AzureDatabricksBestPractices/blob/master/toc.md
https://github.com/hurtn/datalake-ADLS-access-patterns-with-Databricks
我通常建議人們將數據存儲在一個單獨的存儲賬戶(安裝或者直接使用),不要使用的內部存儲空間的任務。主要原因,這是更容易與其他工作區共享這些數據,或其他係統如果是必要的。應該主要用於內部存儲臨時文件、庫、init腳本等。
有很多有用的指南可以幫助:
https://github.com/Azure/AzureDatabricksBestPractices/blob/master/toc.md
https://github.com/hurtn/datalake-ADLS-access-patterns-with-Databricks