你好,
我麵臨一個問題,我的工作之一花這麼長時間從特定的時間,以前隻需要不到1小時運行一個批處理工作負載json數據和截斷和加載到三角洲表,但自從6月2日,它變得這麼長時間需要超過2小時(甚至3的某個時候),直到它完成。
我很好奇它是如何可能發生因為我不改變任何代碼和數據是每天增加大約5%。我懷疑的事情之一是可能是因為列的數量(90 +),我對數據不適合柱狀三角洲表的方法嗎?CMIIW。
我附上圖片,之前第一次2是典型的運行時在6月2日之前,最後2是典型的電流運行時自6月2日。
請讓我知道如果你有任何想法丫。
謝謝你!