我下載多個文件默認網頁抓取和存儲在/ tmp
我可以複製一個文件通過提供文件名和路徑
% fs cp文件:/ tmp / 2020 - 12 - 14 - _listings.csv。廣州dbfs: / tmp
但是當我試圖複製多個文件我得到一個錯誤
% fs cp文件:/ tmp / * _listings * dbfs: / tmp
錯誤
FileNotFoundException:文件文件:/ tmp /_listings不存在
希望有人見過與dbutils目前不支持通配符。你可以移動整個目錄:
dbutils.fs。mv(“文件:/ tmp /測試”、“dbfs: / tmp / test2”,遞歸= True)
或者隻是一個文件:
dbutils.fs.mv(“文件:/ tmp /測試/測試。csv”、“dbfs: / tmp / test2 test2.csv”)
自從通配符不允許,我們需要以這種方式使其工作(文件列表,然後移動或複製-輕微的傳統方式)
導入操作係統def db_list_files (file_path file_prefix): file_list =[文件。路徑文件dbutils.fs.ls (file_path)如果os.path.basename (file.path) .startswith (file_prefix)]返回file_list文件= db_list_files(“文件:/你/ src_dir”、“foobar”)的文件文件:dbutils.fs。cp(文件,os.path。加入(dbfs: / / tgt_dir, os.path.basename(文件)))