取消
顯示的結果
而不是尋找
你的意思是:

解決方案——“PythonException:”ModuleNotFoundError:沒有模塊命名為“寬大的”

Vicky1215
新的貢獻者二世

我試圖從文本列中提取形容詞和名詞短語在火花數據幀的我寫的udf和應用清潔文本列。然而,我得到這個錯誤。

從pyspark.sql。功能導入udf

從pyspark.sql。類型進口ArrayType StringType

進口寬大的

#負載寬大的模型

nlp = spacy.load (“en_core_web_sm”)

#定義UDF來提取關鍵短語

def extract_adjective_noun_key_phrases(文本):

醫生= nlp(文本)

key_phrases = []

令牌的醫生:

如果令牌。pos_ = =“調節”和token.nbor ()。pos_ = =“名詞”)或(令牌。pos_ = =“名詞”和token.nbor ()。pos_ = =“的”):

key_phrases.append(令牌。文本+ " " + token.nbor ()。text)

返回key_phrases

extract_adjective_noun_key_phrases_udf = udf (extract_adjective_noun_key_phrases ArrayType (StringType ()))

# DataFrame UDF適用於文本列

pqms = pqms。withColumn (“adjective_noun_key_phrases extract_adjective_noun_key_phrases_udf (col (“cleaned_text”)))

#打印結果DataFrame

顯示器(pqms)

預期的輸出來提取短語和創建一個新的列相同的引發數據幀。任何幫助或建議,這將是一個偉大的幫助。

謝謝,

7回複7

謝爾
重視貢獻二世

@Aditya辛格

轉到集群計算點擊你需要單擊庫選項卡並選擇PyPI。

輸入一個PyPI包名稱。安裝一個特定版本的庫庫使用這種格式:

<圖書館> = = <版本>例如,寬大的= = 3.4.4。

Aviral-Bhardwaj
尊敬的貢獻者三世

隻有init腳本將在這裏工作

Kaniz
社區經理
社區經理

嗨@Aditya辛格(客戶),我們一直沒有收到你的最後回應@Aviral Bhardwaj @sherbin w,我檢查看看他們的建議幫助你。

否則,如果你有任何解決方案,請與社區分享,因為它可以幫助別人。

同時,請別忘了點擊“選擇最佳”按鈕時提供的信息幫助解決你的問題。

歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map