取消
顯示的結果
而不是尋找
你的意思是:

如何讓所有的表名與一個特定的列或列在數據庫?

ramankr48
因素二世

假設有一個數據庫db中有700個表,我們需要找到所有列的表的名字“project_id”存在。

隻是一個例子ubderstanding問題。

1接受解決方案

接受的解決方案

匿名
不適用
數據庫名= "數據庫" desiredColumn =“project_id”數據庫=火花。sql (f{數據庫名}“顯示表”).collect表名()=[]行數據庫:關口= spark.table (row.tableName)。列如果desiredColumn關口:tablenames.append (row.tableName)

接近這應該工作。

在原帖子查看解決方案

5回複5

匿名
不適用
數據庫名= "數據庫" desiredColumn =“project_id”數據庫=火花。sql (f{數據庫名}“顯示表”).collect表名()=[]行數據庫:關口= spark.table (row.tableName)。列如果desiredColumn關口:tablenames.append (row.tableName)

接近這應該工作。

謝謝josephk這工作

Hubert_Dudek1
尊敬的貢獻者三世

其他可能的解決方案:

  • 使用新磚搜索,
  • 對於那些遷移,在統一目錄使用血統,
  • 使用血統Pureview(有與蜂巢metastore集成)

Being-UK
新的貢獻者二世

由於@Joseph Kambourakis

但是代碼似乎呈現錯誤在我結束:

com.immuta.spark.exceptions。NoSuchDataSourceException:數據源和表名& # 39;‘v_table_name & # 39;不存在,不是在當前的項目中,或由當前用戶無法訪問。

我改變了原來的表名“v_table_name”,因為它內表名是第一個表的模式,所以看起來代碼搜索模式,但由於某種原因失敗在第一個表。謝謝

歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map