我們有一個火花流媒體應用程序寫在Pyspark與Datadog我們想監控。默認情況下,datadog收集幾流指標如spark.structured_streaming.processing_rate”和“spark.structured_streaming.latency”。然而,經過設置的logs_enabled:真”和“spark.sql.streaming。metricsEnabled = true“集群中的init腳本。我們仍然無法看到任何datadog流指標。在一些研究中,似乎我們需要實現一個新類的StreamingQueryListener從引發流做這項工作。這個假設是正確的嗎?如果是這樣的話,有可能實現這個在Python中而不是Scala ?我還沒有看到任何Python實現任何地方。我會很感激如果有人能指出我任何例子如果可能的話。任何幫助將不勝感激!
@Liz張,請參考以下文檔包含pyspark streamingQueryListener的實現
//m.eheci.com/blog/2022/05/27/how-to-monitor-streaming-queries-in-pyspark.html
@Liz張,請參考以下文檔包含pyspark streamingQueryListener的實現
//m.eheci.com/blog/2022/05/27/how-to-monitor-streaming-queries-in-pyspark.html