以下命令失敗
df1 = sqlContext.read.format (“xml”) .load (loadPath)
df2 = sqlContext.read.format (com.databricks.spark.xml) .load (loadPath)
用以下錯誤信息:
. lang。ClassNotFoundException:沒有找到數據源:xml。請找到包http://spark.apache.org/third-party-projects.html
我讀了幾篇文章在這個論壇上但沒有解決。我認為磚已經安裝的XML庫。這是在DBC集群”4.2(包括Apache火花2.3.1,Scala 2.11)”