磚SDK R
在本文中,您將了解如何在磚自動化業務工作區和相關資源磚SDK R。
開始使用的磚SDK的R
讓你的磚工作空間的URL和個人訪問令牌用於R項目的腳本。例如,您可以添加以下R項目
.Renviron
文件。取代< your-workspace-url >
與你的工作區實例URL例如,https://1234567890123456.7.gcp.m.eheci.com
。取代< your-personal-access-token >
例如,和你的磚個人訪問令牌dapi12345678901234567890123456789012
。DATABRICKS_HOST = < your-workspace-url > DATABRICKS_TOKEN = < your-personal-access-token >
其他方式提供磚工作區URL和個人訪問令牌,看到的身份驗證在GitHub磚SDK為R庫。
重要的
不添加
.Renviron
文件版本控製係統,這種風險暴露敏感信息如磚個人訪問令牌。安裝磚SDK R包。例如,在RStudio桌麵控製台視圖(視圖>焦點轉移到控製台),運行以下命令,一次:
install.packages(“devtools”)圖書館(devtools)install_github(“databrickslabs / databricks-sdk-r”)
請注意
R包不可用的磚SDK的凹口。
添加代碼來參考磚SDK R和列出所有的集群磚工作區。例如,在一個項目的
main.r
文件,代碼可能如下:需要(磚)客戶端< -DatabricksClient()clustersList(客戶端)(“cluster_name”]
運行腳本。例如,在RStuidio桌麵,與項目的腳本編輯器
main.r
文件活躍,單擊源>源或源與呼應。集群列表中出現。例如,在RStudio桌麵,這是控製台視圖。
代碼示例
下麵的代碼示例演示如何使用R的磚SDK創建和刪除集群,並創造就業機會。
創建一個集群
這段代碼示例創建一個集群與指定的磚和集群節點類型運行時版本。這個集群有一個工人,和集群自動終止後15分鍾的空閑時間。
需要(磚)客戶端< -DatabricksClient()響應< -clustersCreate(客戶端=客戶端,cluster_name=“my-cluster”,spark_version=“12.2.x-scala2.12”,node_type_id=“n2-highmem-4”,autotermination_minutes=15,num_workers=1)#讓工作區URL中使用以下結果消息。get_client_debug< -strsplit(客戶端美元debug_string(),分裂="主機= ")get_host< -strsplit(get_client_debug[[1]][2),分裂=”、“)主機< -get_host[[1]][1]#確保工作區URL以斜杠結束。如果(endsWith(主機,“/”)){}其他的{主機< -粘貼(主機,“/”,9月=”“)}打印(粘貼(“查看集群”,主機,“#設置/集群”,響應美元cluster_id,“/配置”,9月=”“))
永久刪除一個集群
這段代碼示例永久刪除集群與集群ID指定的工作區。
需要(磚)客戶端< -DatabricksClient()cluster_id< -readline(集群的“ID刪除(例如,1234 - 567890 ab123cd4):“)clustersPermanentDelete(客戶端,cluster_id)
創建一個工作
這個代碼示例創建了一個磚工作,可用於指定集群上運行指定的筆記本。這段代碼運行,現有筆記本的路徑,現有集群ID和相關工作設置從用戶控製台。
需要(磚)客戶端< -DatabricksClient()job_name< -readline(“一些短名稱的工作(例如,我的工作):“)描述< -readline(“一些簡短描述的工作(例如,我的工作):“)existing_cluster_id< -readline(“ID在工作區中現有的集群上運行的工作(例如,1234 - 567890 ab123cd4):“)notebook_path< -readline(“工作區路徑的筆記本運行(例如,/用戶/ someone@example.com/my-notebook):“)task_key< -readline(“一些關鍵的申請工作的任務(例如,我的鑰匙):“)打印(“試圖創建工作。請稍等……”)notebook_task< -列表(notebook_path=notebook_path,源=“工作區”)job_task< -列表(task_key=task_key,描述=描述,existing_cluster_id=existing_cluster_id,notebook_task=notebook_task)響應< -jobsCreate(客戶端,的名字=job_name,任務=列表(job_task))#讓工作區URL中使用以下結果消息。get_client_debug< -strsplit(客戶端美元debug_string(),分裂="主機= ")get_host< -strsplit(get_client_debug[[1]][2),分裂=”、“)主機< -get_host[[1]][1]#確保工作區URL以斜杠結束。如果(endsWith(主機,“/”)){}其他的{主機< -粘貼(主機,“/”,9月=”“)}打印(粘貼(“查看工作”,主機,“#工作/”,響應美元job_id,9月=”“))