更新後的2023年4月20日,何塞·岡薩雷斯

不能選擇一個磚當使用三角洲生活表管道運行時版本

問題你想選擇一個特定的磚的運行時版本的使用與三角洲住表(DLT)管道,但你不能找到一個選項在UI或API。直接導致三角洲住表不允許您配置數據磚運行時版本。三角洲生活表集群上運行一個定製版本的磚運行時t…

0分鍾的閱讀時間
更新後的2022年5月19日,何塞·岡薩雷斯

流工作卡住寫作檢查點

問題你是監測流工作,注意,它似乎被困在處理數據。檢查日誌時,發現工作卡住當寫入數據到一個檢查站。信息HDFSBackedStateStoreProvider:刪除文件對於381160歲以上的HDFSStateStoreProvider [id = (op = 0 = 89), dir = dbfs: / FileStore R_CHECKPOINT5 /聖……

0分鍾的閱讀時間
更新5月23日,2022年由何塞·岡薩雷斯

寫一個DataFrame與失蹤的紅移表列

問題編寫紅移表時,如果目標表列比源Apache火花DataFrame你可能得到一個複製錯誤。複製失敗與錯誤(亞馬遜):(亞馬遜紅移)(1203)錯誤發生在試圖執行一個查詢:錯誤:加載到表的表名失敗了。檢查“stl_load_errors”係統表的詳細信息。“12…

0分鍾的閱讀時間
2023年5月10日更新了何塞·岡薩雷斯

三角洲生活表工作失敗當使用收集()

問題你使用收集()三角洲生活表(DLT)管道代碼,你得到一個錯誤。當你回顧堆棧跟蹤,你看到一個DataFrame。收集錯誤,函數是很快就會被棄用。“消息”:“筆記本:/道路/ /你/筆記本使用的DataFrame。收集的函數,它很快就會被棄用。請修複notebo…

0分鍾的閱讀時間
更新2022年10月12日,何塞·岡薩雷斯

顯式路徑自動加載程序所需數據定義或模式

本文信息適用於磚運行時9.1 LTS及以上。問題你是對你的英語教學使用自動加載程序來攝取數據管道,當你得到一個IllegalArgumentException:請提供源目錄路徑和選擇“路徑”的錯誤消息。你得到這個錯誤當你開始一個汽車裝載機工作,如果路徑數據或數據……

1分鍾的閱讀時間
更新2022年5月24日,何塞·岡薩雷斯

顯示數據庫命令返回意想不到的列名

問題你使用顯示數據庫命令,它返回一個意想不到的列名。導致返回的列名稱顯示數據庫命令改變磚7.0運行時。磚6.4運行時擴展支持下麵:顯示數據庫返回名稱空間作為列名稱。磚運行時7.0及以上:顯示數據庫返回dat……

0分鍾的閱讀時間
更新5月23日,2022年由何塞·岡薩雷斯

管理三角洲表的大小

δ表比傳統的表有什麼不同。三角洲表包括ACID事務和時間旅行的特性,這意味著他們維護事務日誌和陳舊的數據文件。這些附加功能需要存儲空間。在本文中,我們討論的建議可以幫助你管理三角洲表的大小。使文件係統已經……

1分鍾的閱讀時間
更新後的2022年4月1日,何塞·岡薩雷斯

Apache在DBConnect引發會話是null

問題你想使用磚連接運行您的代碼(AWS | Azure | GCP)當你得到一個sparkSession零錯誤消息。. lang。AssertionError:斷言失敗:sparkSession零而試圖executeCollectResult scala.Predef . assert (Predef.scala: 170)美元org.apache.spark.sql.execution.SparkPlan.executeCollectResult (…

1分鍾的閱讀時間
更新5月31日,2022年由何塞·岡薩雷斯

刪除表底層S3 bucket時刪除

問題表你想放棄或改變當你得到一個錯誤。錯誤的SQL語句:IOException: Bucket_name…不存在你可以複製錯誤刪除表或ALTER TABLE命令。% sql DROP TABLE < database-name.table-name >;% sql ALTER TABLE <數據庫名稱。表名稱>設置位置“<文件係統的位置>”;…

0分鍾的閱讀時間
2022年5月10日更新了何塞·岡薩雷斯

工作筆記本集群限製輸出

問題是工作的集群上運行一個筆記本,你得到一個錯誤消息,表明輸出太大。筆記本太大的輸出。原因:rpc響應(20975548字節)超過20971520字節的限製導致這個錯誤消息可能發生在集群工作隻要筆記本輸出大於20 MB。如果你是你…

0分鍾的閱讀時間
2022年5月10日更新了何塞·岡薩雷斯

轉換從鋪到三角洲湖失敗

問題要拚花文件轉換為三角洲湖文件。包含鑲花的目錄文件包含一個或更多的子目錄。轉換失敗,錯誤信息:預計0分區列(s):[],但發現1分區列(s): [< column_name >]從解析文件名稱:< path_to_the_file_location >…

0分鍾的閱讀時間
加載更多