設置Databricks回購
了解如何設置Databricks回購版本控製。一旦設置了Databricks Repos,就可以使用它來執行常見的Git操作,比如克隆、簽出、提交、推送、拉取和分支管理。當您在Databricks中使用筆記本和文件進行開發時,還可以看到更改的差異。
配置用戶設置
Databricks Repos使用個人訪問令牌(PAT)或等效憑證與Git提供者進行身份驗證,以執行克隆、推送、拉取等操作。要使用Repos,您首先需要將您的Git PAT和Git提供商用戶名添加到Databricks。看到獲取一個Git訪問令牌,並連接一個遠程回購到Databricks.
您可以在沒有Git憑據(個人訪問令牌和用戶名)的情況下克隆公共遠程存儲庫。要修改公共遠程存儲庫,或克隆或修改私有遠程存儲庫,您必須擁有一個Git提供者用戶名和個人訪問令牌,對遠程存儲庫具有讀寫權限。
將Git憑據添加到Databricks
點擊設置在屏幕的右上方,然後選擇用戶設置.
單擊Git集成選項卡。
如果您以前已輸入憑據,請單擊改變設置按鈕。
在Git提供程序下拉菜單中,選擇提供程序名稱。
從Git提供者獲取個人訪問令牌(PAT)或其他憑證。詳細信息請參見獲取一個Git訪問令牌,並連接一個遠程回購到Databricks
重要的
Databricks建議為所有個人訪問令牌設置有效期。
對於Azure DevOps, Git集成不支持Azure Active Directory令牌。您必須使用Azure DevOps個人訪問令牌。
如果您的組織在GitHub中啟用了SAML SSO,請確保已啟用為SSO授權您的個人訪問令牌.
將Git提供程序PAT令牌粘貼到令牌字段。
中輸入您的用戶名Git提供者用戶名字段,單擊保存.
也可以將Git PAT令牌和用戶名保存到DatabricksDatabricks回購API.
Databricks Repos和Git提供者之間的網絡連接
Databricks Repos需要網絡連接到Git提供商才能正常工作。通常情況下,這是通過互聯網和工作的開箱即用。但是,您可能已經在Git提供程序上設置了額外的限製來控製訪問。例如,您可能有一個IP允許列表,或者您可能托管自己的私有Git服務器(通過GitHub Enterprise(GHE)、Bitbucket Server(BBS)或Gitlab self -managed等服務),而您的Git服務器可能無法通過互聯網訪問。
請注意
例如,如果你的Git服務器可以通過互聯網訪問,但是有一個IP允許列表GitHub允許列表時,需要將Databricks控製平麵NAT IP添加到Git服務器的IP允許列表中。按區域劃分的控製平麵NAT IP地址列表請參見數據雲和區域.使用Databricks工作區所在區域的IP。
如果您正在私人托管一個Git服務器,請與Databricks代表聯係,以獲得訪問的登錄說明。
限製使用允許列表中的url
管理員可以限製用戶可以從哪些遠程存儲庫進行克隆以及提交和推送。這有助於防止代碼泄露,例如,如果您打開了允許列表限製,用戶就不能將代碼推入任意存儲庫。還可以通過將克隆操作限製在允許的存儲庫列表中來防止用戶使用未經許可的代碼。
設置允許列表:
去管理控製台.
單擊工作空間設置選項卡。
在回購節,從中選擇一個選項回購Git允許列表:
禁用(無限製):沒有針對允許列表的檢查。
限製克隆、提交和推送到允許的Git存儲庫:克隆、提交、推送操作隻允許在允許列表中的存儲庫url進行。
隻限製提交和推送到允許的Git存儲庫:僅允許在allow列表中的存儲庫url進行Commit和push操作。克隆和拉操作不受限製。
在旁邊的田野裏Repos Git URL允許列表:空列表,輸入以逗號分隔的URL前綴列表。
點擊保存.
若要允許訪問所有存儲庫,請選擇禁用(無限製).
請注意
保存的列表將覆蓋現有保存的URL前綴集。
更改最多需要15分鍾才能生效。
在工作區中控製對Repo的訪問
為Repo設置權限以控製訪問。回購的權限適用於該回購中的所有內容。菜單選項包括可以管理,可以編輯,可以運行而且可以查看.
當你創建回購時,你有可以管理許可。這允許您修改Repo中的內容,執行Git操作或修改遠程存儲庫。用戶應該在自己獨立的Repo中進行開發,並通過Git分支和pr在共享代碼庫上進行協作。因此,您不應該給其他用戶可以編輯或可以管理訪問您的開發回購。
審計日誌記錄
當審計日誌記錄啟用,則在與Databricks回購交互時記錄審計事件。例如,當您創建、更新或刪除Databricks回購、列出與工作空間關聯的所有Databricks回購以及在Databricks回購和遠程Git回購之間同步更改時,將記錄審計事件。