你好,
我建立一個webscraper得到某些EAN的從亞馬遜網站的價格。因此我使用硒產品鏈接。之後我寫了te函數productlinks基於EAN的:
def getProductLinkAmazonPY (EAN): startURL = ' https://www.amazon.nl ' driver.get (startURL)元素= driver.find_element_by_id (twotabsearchtextbox) element.send_keys (EAN) element.send_keys (Keys.RETURN);productPage = [elem.get_attribute elem (“href”)的驅動程序。find_elements_by_xpath (" / / * [@class = ' a-link-normal a-text-normal“]”)]如果productPage ! = []: productPage = productPage[0]返回(productPage, EAN)
有人知道如何運行這個函數並行使用一個UDF pyspark嗎?
謝謝