取消
顯示的結果
而不是尋找
你的意思是:

無法讀取數據從ElasticSearch使用磚(AWS)不能檢測ES的版本——造成的:org.elasticsearch.hadoop.rest。EsHadoopNoNodesLeftException:連接錯誤(檢查網絡和/或代理設置)——所有節點失敗;試(IP:端口)

naveenprabhun
新的貢獻者三世

我試圖從ElasticSearch讀取數據(ES版本8.5.2)上使用PySpark磚(13.0(包括Apache火花3.4.0,Scala 2.12))。生態係統在AWS上。

我能在磚筆記本上運行curl命令ES ip:港口和獲取數據。(告訴我訪問是可用的)

但是,無法讀取相同的通過PySpark ES。

下麵是代碼

罐子

org.elasticsearch: elasticsearch-spark-30_2.12:8.5.2

org.elasticsearch: elasticsearch-hadoop: 8.5.2

- - - - - - - - - - - - - - - - - -

df = (spark.read

.format (“org.elasticsearch.spark。sql”)

.option (“spark.es.nodes.wan.only”,“真正的”)

.option (“spark.es.nodes”、“es01-nonprod.office.io”)

# .option (“es.net.ssl”,“真正的”)

.option (“spark.es.net.http.auth.user”,用戶名)

.option (“spark.es.net.http.auth.pass”,密碼)

.option (“spark.es.port”,端口)

# .option (“es.net.ssl.protocol”、“https”)

.option (“spark.es.nodes.discovery”,“假”)

# .option (“es.nodes.client。隻”、“假”)

# .option (“spark.es.scheme”、“https”)

# .option(“火花。序列化器”、“org.apache.spark.serializer.KryoSerializer”)

# .option (“spark.es.http.timeout”,“10米”)

# .option (“es.net.ssl.keystore.type”、“CRT”)

# .option (“es.net.ssl.truststore.location”、“/ etc / ssl /證書/ ca-certificates.crt”)

.load (f“{指數}”)

)

顯示器(df)

- - - - - - - - - - - - - - - - -

錯誤截圖

ErrorScreenshot

Curl命令就可以了截圖2023-06-01 1.25.29點

我試過了

添加所有火花配置集群創建期間。

改變org.elasticsearch jar: elasticsearch-hadoop: 8.5.2

決議將不勝感激。

1接受解決方案

接受的解決方案

naveenprabhun
新的貢獻者三世

你可以試著將證書添加到信任存儲區和存儲在集群上。然後在火花提供信任存儲庫路徑es.net.ssl.keystore.locationes.net.ssl.truststore.location參數

在原帖子查看解決方案

2回答2

Hoviedo
新的貢獻者二世

我也有同樣的問題,你找到任何解決方案嗎?謝謝

naveenprabhun
新的貢獻者三世

你可以試著將證書添加到信任存儲區和存儲在集群上。然後在火花提供信任存儲庫路徑es.net.ssl.keystore.locationes.net.ssl.truststore.location參數

歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map