磚SDK R

請注意

本文涵蓋了磚的磚SDK R的實驗室,在一個實驗狀態。提供反饋,問問題,和報告問題,使用問題選項卡中數據磚SDK R在GitHub庫。

在本文中,您將了解如何在磚自動化業務工作區和相關資源磚SDK R

請注意

磚SDK R在磚不支持的自動化業務賬戶。打電話給帳戶層麵操作,使用不同的磚SDK,例如:

在你開始之前

在你開始使用磚SDK為R,您的開發機必須有:

  • 一個磚個人訪問令牌為目標數據磚工作區要自動化。

    請注意

    R的磚SDK的支持隻磚個人訪問令牌的身份驗證。

  • R,選擇一個R-compatible集成開發環境(IDE)。磚建議RStudio桌麵並使用它在本文的指令。

開始使用的磚SDK的R

  1. 讓你的磚工作空間的URL和個人訪問令牌用於R項目的腳本。例如,您可以添加以下R項目.Renviron文件。取代< your-workspace-url >與你的工作區實例URL例如,https://dbc-a1b2345c-d6e7.cloud.m.eheci.com。取代< your-personal-access-token >例如,和你的磚個人訪問令牌dapi12345678901234567890123456789012

    DATABRICKS_HOST = < your-workspace-url > DATABRICKS_TOKEN = < your-personal-access-token >

    其他方式提供磚工作區URL和個人訪問令牌,看到的身份驗證在GitHub磚SDK為R庫。

    重要的

    不添加.Renviron文件版本控製係統,這種風險暴露敏感信息如磚個人訪問令牌。

  2. 安裝磚SDK R包。例如,在RStudio桌麵控製台視圖(視圖>焦點轉移到控製台),運行以下命令,一次:

    install.packages(“devtools”)圖書館(devtools)install_github(“databrickslabs / databricks-sdk-r”)

    請注意

    R包不可用的磚SDK的凹口。

  3. 添加代碼來參考磚SDK R和列出所有的集群磚工作區。例如,在一個項目的main.r文件,代碼可能如下:

    需要()客戶端< -DatabricksClient()clustersList(客戶端)(“cluster_name”]
  4. 運行腳本。例如,在RStuidio桌麵,與項目的腳本編輯器main.r文件活躍,單擊源>源源與呼應

  5. 集群列表中出現。例如,在RStudio桌麵,這是控製台視圖。

代碼示例

下麵的代碼示例演示如何使用R的磚SDK創建和刪除集群,並創造就業機會。

創建一個集群

這段代碼示例創建一個集群與指定的磚和集群節點類型運行時版本。這個集群有一個工人,和集群自動終止後15分鍾的空閑時間。

需要()客戶端< -DatabricksClient()響應< -clustersCreate(客戶端=客戶端,cluster_name=“my-cluster”,spark_version=“12.2.x-scala2.12”,node_type_id=“i3.xlarge”,autotermination_minutes=15,num_workers=1)#讓工作區URL中使用以下結果消息。get_client_debug< -strsplit(客戶端美元debug_string(),分裂="主機= ")get_host< -strsplit(get_client_debug[[1]][2),分裂=”、“)主機< -get_host[[1]][1]#確保工作區URL以斜杠結束。如果(endsWith(主機,“/”)){}其他的{主機< -粘貼(主機,“/”,9月=”“)}打印(粘貼(“查看集群”,主機,“#設置/集群”,響應美元cluster_id,“/配置”,9月=”“))

永久刪除一個集群

這段代碼示例永久刪除集群與集群ID指定的工作區。

需要()客戶端< -DatabricksClient()cluster_id< -readline(集群的“ID刪除(例如,1234 - 567890 ab123cd4):“)clustersPermanentDelete(客戶端,cluster_id)

創建一個工作

這個代碼示例創建了一個磚工作,可用於指定集群上運行指定的筆記本。這段代碼運行,現有筆記本的路徑,現有集群ID和相關工作設置從用戶控製台。

需要()客戶端< -DatabricksClient()job_name< -readline(“一些短名稱的工作(例如,我的工作):“)描述< -readline(“一些簡短描述的工作(例如,我的工作):“)existing_cluster_id< -readline(“ID在工作區中現有的集群上運行的工作(例如,1234 - 567890 ab123cd4):“)notebook_path< -readline(“工作區路徑的筆記本運行(例如,/用戶/ someone@example.com/my-notebook):“)task_key< -readline(“一些關鍵的申請工作的任務(例如,我的鑰匙):“)打印(“試圖創建工作。請稍等……”)notebook_task< -列表(notebook_path=notebook_path,=“工作區”)job_task< -列表(task_key=task_key,描述=描述,existing_cluster_id=existing_cluster_id,notebook_task=notebook_task)響應< -jobsCreate(客戶端,的名字=job_name,任務=列表(job_task))#讓工作區URL中使用以下結果消息。get_client_debug< -strsplit(客戶端美元debug_string(),分裂="主機= ")get_host< -strsplit(get_client_debug[[1]][2),分裂=”、“)主機< -get_host[[1]][1]#確保工作區URL以斜杠結束。如果(endsWith(主機,“/”)){}其他的{主機< -粘貼(主機,“/”,9月=”“)}打印(粘貼(“查看工作”,主機,“#工作/”,響應美元job_id,9月=”“))

額外的資源

有關更多信息,請參見: