出現下麵的錯誤在GCP開始集群(手動和工作)。它導致我們的ETL和其他生產工作一周多次失敗。斷斷續續的,但是需要手動幹預重試計劃工作。
運行失敗與錯誤消息意想不到的失敗在等待集群(0817 - 041248 - m827uwd4)準備:集群0817 - 041248 m827uwd4是意想不到的狀態終止:SECRET_RESOLUTION_ERROR (SERVICE_FAULT): databricks_error_message:無法獲取機密稱為火花環境變量由於內部錯誤。
嗨@cmditch,基於錯誤消息,這個問題似乎是解決相關機密所引發的環境變量。
這個錯誤表明有一個內部錯誤當抓取這些秘密。
這裏有一些潛在的原因和解決方案:
1。* * * *:權限使用的服務帳戶(SA)磚工作區可能沒有正確的權限訪問機密。確保公司擁有必要的許可,如“計算存儲管理”、“磚服務我角色的工作空間”,“Kubernetes引擎管理”。
2。* *秘密存在* *:火花的秘密被稱為環境變量可能不存在或已被刪除。確認這些秘密存在,正確配置。
3所示。* * * *內部連通性問題:內部網絡連接問題可能防止秘密獲取。檢查你的網絡配置,確保有適當的連接。
不幸的是,提供一個更具體的解決方案沒有更詳細的日誌或信息設置挑戰性。如果問題仍然存在,可以考慮聯係磚支持通過文件支持的票在這裏。