嘿,夥計們,
我們正在考慮三角洲湖作為我們的項目的存儲,有幾個問題。第一個是定價的三角洲湖——似乎無法找到一個頁麵說x數量成本y。
第二個問題是更多的技術——如果我們想使用python庫訪問我們的三角洲湖數據而不是火花,我們要把熊貓dataframe三角洲湖?這個博客似乎這麼說//m.eheci.com/blog/2020/12/22/natively-query-your-delta-lake-with-scala-java-and-python.htm..。。我們關心的是三角洲湖將許多gb的數據,它不適合在一個熊貓dataframe。
周傑倫
由於@Werner Stinckens——你會推薦處理三角洲湖數據磚/火花嗎?
嗨@Jay艾倫,
隻是一個友好的後續。做任何反應幫助你解決你的問題嗎?如果是,請其標記為最好。否則,請讓我們知道如果你還需要幫助。