最佳實踐:集群政策

集群政策提供管理員控製創建集群的資源在一個磚工作區。有效利用集群政策允許管理員:

  • 執行標準化的集群配置。

  • 防止過度使用資源和控製支出。

  • 確保準確退款通過正確標記集群。

  • 便於分析和處理,為用戶提供預配置的集群配置針對特定工作負載。

介紹集群政策和配置建議,把磚集群政策的視頻:

結合有效的新員工培訓、批準和退款流程,集群政策可能是一個基本組件在磚平台的治理。Beplay体育安卓版本本指南提供了建議和最佳實踐來幫助您創建一個成功的計劃將集群政策集成到您的治理框架。

因為治理是獨一無二的每個組織的需求和現有治理基礎設施,本文首先覆蓋,通常適用於集群的政策建議。本文的最後部分討論了特定的策略來解決挑戰你可能會看到在您的環境中。

本文討論以下最佳實踐和建議,以確保一個成功的集群治理推出:

  • 創建一個計劃引入集群政策階段來幫助用戶管理過渡到一個環境。

  • 創建一個溝通計劃更改為每個階段的集群政策推出。

  • 確定集群治理的挑戰和實現策略來應對這些挑戰。

集群政策推出

實施集群政策可以呈現出顯著變化的用戶體驗。磚建議分階段方法來幫助指導用戶完成的轉變:

  • 即將到來的變化,並提供用戶交流的機會測試集群配置。

  • 執行一個柔軟的推出。

  • 不斷的引入進一步的政策變化。

  • 執行一個很難完全治理環境的轉換。

分階段推出允許用戶熟悉新政策,防止中斷現有的工作負載。下圖是這種推薦過程的一個例子:

集群政策推出計劃

以下部分提供更詳細的信息在這些階段:

通信和測試集群政策

開始交流的過程對用戶即將到來的變化。溝通計劃應該包括:

  • 細節的變化。

  • 為什麼這些變化正在發生。

  • 用戶需要做些什麼來確保成功過渡的工作負載。

  • 如何提供反饋修改。

  • 的每個階段推出時間表。

  • 在每個階段的逐步推廣,進一步的細節溝通相關的階段。

下圖提供了一個示例溝通計劃分階段推出:

集群政策的溝通計劃

你的計劃可能會根據您的環境和集群不同階段的政策策略。這個例子包括四個階段:

  • 第一階段包括溝通計劃用戶和測試的開始。用戶必須有機會測試他們當前和預期的工作負載集群,符合新政策。你想要及早發現任何問題與現有和計劃工作負載。

  • 第二階段繼續測試以及集群標簽政策的推出。

  • 第三階段引入了集群類型,在本例中指定集群使用t恤尺寸,例如,小,大,或超大集群類型。

  • 第四階段是最後的集群政策的推出和完整的用戶文檔。

用戶也應該有機會測試他們的工作負載集群配置計劃的初始階段。這種測試可以幫助識別現有工作負載的運行問題提出政策。

考慮引入集群政策

在規劃時考慮你當前的管理政策的初始部署集群政策。特別是,考慮是否你從一個環境中,用戶從創建集群或限製一個更加開放的環境。

嚴格的環境

在一個環境中,用戶沒有權限創建集群,首先推出限製性政策以及為用戶實施計劃。實施計劃可能是基於計算機的培訓、研討會或文檔。為用戶提供指導配置集群的最佳實踐將改善他們充分利用平台的能力。Beplay体育安卓版本政策可以輕鬆為用戶演示合規和能力的平台。Beplay体育安卓版本

不受限製的環境

運用政策可以在一個不受限製的環境更具挑戰性。一些現有的用例和集群將幾乎總是超出新政策的約束,所以識別這些測試或軟推廣階段是至關重要的。

集群創建權限或訪問用戶提供無限製的政策將維持他們的訪問整個軟推出這個政策,確保所有工作負載繼續函數。用戶應使用軟推出來測試他們所有的工作負載的新政策將可用。

一定要給用戶一個地方提交反饋有關政策。與用戶合作,完善政策或定義新的政策出現問題時。

最後推出

刪除訪問不受限製的政策限製用戶截止日期。集群政策的推出現在應該完成了。

具體挑戰與策略

下麵是應用集群政策應對特定挑戰的例子。這些策略可以使用同時但需要應用程序的每個策略在所有政策。例如,如果使用標簽執行戰略和t恤的大小,每個t恤政策還需要一個custom_tag。*政策。

標簽執行

挑戰

用戶可以自由創建集群,沒有機製來執行,他們應用所需的標記。

解決方案

  1. 撤銷集群創建權限從用戶。

  2. 添加一個集群標記規則的任何適用的集群政策。添加集群標簽規則政策,使用custom_tags。<標記名稱>屬性。一個下的值可以是任何東西無限的政策,也可以是受限製的固定,允許列表,塊列表,正則表達式,或範圍政策。例如,以確保正確的退款和成本歸因,執行COST_CENTER標簽在每個政策限製的列表允許成本中心值:

    {“custom_tags.COST_CENTER”:{“類型”:“allowlist”,“價值觀”:【“9999”,“9921”,“9531”]}}

    任何用戶使用該策略必須填寫COST_CENTER標簽與9999、9921或9531的集群啟動。

  3. 集群政策分配給用戶應該能夠指控這三個成本中心。政策可以通過指定一個用戶或組水平集群政策UI或者是補丁/權限/ cluster-policies / {cluster_policy_id}端點。下麵的示例請求主體分配銷售部門的政策:

    {“access_control_list”:({“user_name”:“user@mydomain.com”,“all_permissions”:({“permission_level”:“CAN_USE”}]},{“group_name”:“銷售”,“all_permissions”:({“permission_level”:“CAN_USE”}]}]}

沒有經驗的用戶

挑戰

用戶不熟悉集群或雲基礎設施供應或不知所措集群創建選項。

解決方案

使用集群政策來定義“t恤”大小的集群配置,例如,小,中型或大型集群。

  1. 創建一個策略對於每一個t恤的大小。t恤集群政策表示一個相對大小的用戶,可以靈活的模板或零選項配置。零政策往往會選擇或低選項固定和隱藏的策略規則。下麵的例子定義了一個政策DBR 7.3的固定值spark_version。設置隱藏的國旗為真時將確保這個選項對用戶來說是不可見的。

    {“spark_version”:{“類型”:“固定”,“價值”:“汽車:latest-ml”,“隱藏”:真正的}}

    當定義靈活的模板,您可以使用範圍,塊列表,塊列表,正則表達式,無限的政策政策製定上邊界,可選的字段和semi-restricted策略元素。下麵的例子定義了一個政策,允許自動定量節點最多25。您可以使用這個定義每個t恤上邊界大小,同時提供一些靈活性。看到更多的細節,一個集群模板方法,明白了過度的資源使用情況

    {“autoscale.max_workers”:{“類型”:“範圍”,“執行”:“25”,“defaultValue”:5}}
  2. 分配政策應該允許用戶創建的t恤的集群。政策可以被指定在一個用戶或組級別通過集群政策UI API或集群政策權限。例如,將這一政策分配給所有用戶通過UI:

    1. 集群政策和選擇編輯

    2. 選擇權限選項卡。

    3. 選擇所有用戶選擇下下拉。

      為所有用戶分配政策
  3. 撤銷訪問組的不受限製的政策,必須使用這些新政策。一旦使用的集群政策,獲得“集群創建”權限給用戶訪問不受限製的政策。撤銷這允許用戶很重要,不應該。

    撤銷集群創建權限,明白了配置集群創建權限

用例具體政策

挑戰

一些工作負載或分析不符合現行政策,或用戶不知道正確的集群配置對某些工作負載類型。

解決方案

如果你覺得工作不好的工作負載與現有政策,通常是更好的創建新的政策專門針對這些工作負載,而不是擴大現有的政策。

幫助用戶創建集群使用這些策略,它能幫助創建策略針對特定的用例。描述性名稱分配給這些政策來幫助用戶識別它們。例如,如果工作負載將查詢數據源支持謂詞下推,一個最佳實踐是建立一個特定的政策,執行自動定量較低或零工人最低。這一政策將確保雲提供商和磚的成本不不必要的增長在等待數據源來計算查詢的下推組件。

  1. 創建一個策略,強製使用特定的最佳實踐。這個例子定義了一個政策,有一個固定的值0最小數量的工人。這一政策同時執行,集群將自動定量,滿足謂詞下推的例子的最佳實踐。

    {“autoscale.min_workers”:{“類型”:“固定”,“價值”:“0”,“隱藏”:}}
  2. 分配政策以用戶需要為這些用例構建集群。你可以在用戶或組分配政策的水平集群政策UI或者是權限API 2.0。例如,分配這一政策通過UI數據科學家小組:

    1. 集群政策和選擇編輯

    2. 選擇權限選項卡。

    3. 分配政策到一個特定的團隊,選擇團隊的名字選擇用戶或組下拉。

      分配政策

過度的資源使用情況

挑戰

用戶創建不必要的大型集群,消費過度和昂貴的資源。這通常是由於:

  • 未能激活自動定量。

  • 不正確的使用汽車終端窗口。

  • 高最低工人節點計數。

  • 昂貴的實例類型。

解決方案

集群政策搭配內部審批流程將使控製資源,必要時還提供大型計算資源。

  1. 建立一個審查過程授予訪問更大或更靈活的政策。評審過程應該攝入形式,收集信息,支持更大或更靈活的集群配置的必要性。平台所有Beplay体育安卓版本權團隊應該評估這些信息來決定如何支持工作負載需求。下圖展示了一個例子使用t恤分級審批流程:

    政策調整的過程
  2. 創造更靈活的用更少的約束和政策關注控製治理標簽之類的東西。一個靈活的政策的例子:

    . .aws:

    ' ' ' json{”自動定量。min_workers”:{“類型”:“範圍”、“執行”:20,“defaultValue”: 2},“自動定量。max_workers”:{“類型”:“範圍”、“執行”:100年,“defaultValue”: 8},“autotermination_minutes ":{“類型”:“範圍”、“執行”:120年,“defaultValue”: 60},“node_type_id”:{“類型”:“過濾清單”,“值”:[" z1d。12個超大”、“z1d。6 xlarge”、“r5d。16個超大”、“r5a。24 xlarge”、“i4i。32 xlarge”),“defaultValue”:“i3。超大“}”,driver_node_type_id”:{“類型”:“過濾清單”,“值”:[" z1d。12個超大”、“z1d。6 xlarge”、“r5d。16個超大”、“r5a。24 xlarge”、“i4i。32 xlarge”),“defaultValue”:“i3。超大“}”,spark_version”:{“類型”:“固定”,“價值”:“汽車:latest-ml”、“隱藏”:真正的},“enable_elastic_disk ":{“類型”:“固定”,“價值”:真的,“隱藏”:真正的},“custom_tags。團隊”:{“類型”:“固定”,“價值”:“產品”}}’‘. .azure:: ' ' ' json{”自動定量。min_workers": { "type": "range", "maxValue": 20, "defaultValue": 2 }, "autoscale.max_workers": { "type": "range", "maxValue": 100, "defaultValue": 8 }, "autotermination_minutes": { "type": "range", "maxValue": 120, "defaultValue": 60 }, "node_type_id": { "type": "blocklist", "values": ["Standard_E16s_v3", "Standard_E64as_v4", "Standard_E96as_v4", "Standard_E48as_v4"], "defaultValue": "Standard_L8s" }, "driver_node_type_id": { "type": "blocklist", "values": ["Standard_E16s_v3", "Standard_E64as_v4", "Standard_E96as_v4", "Standard_E48as_v4"], "defaultValue": "Standard_L8s_v2" }, "spark_version": { "type": "fixed", "value": "auto:latest-ml", "hidden": true }, "enable_elastic_disk": { "type": "fixed", "value": true, "hidden": true }, "custom_tags.team": { "type": "fixed", "value": "product" } } ```
  3. 文檔升級和審批流程,與用戶分享。也有助於發布指導識別類型的工作負載,可能需要更大的靈活性或更大的集群。

  4. 一旦批準了一個用戶,分配政策。政策可以在用戶或組分配的水平集群政策UI或提交一個請求權限API 2.0:

    {“access_control_list”:{“user_name”:“users_email@yourdomain.com”,“permission_level”:“CAN_USE”}}

了解更多

了解更多關於集群政策在磚上,看到的管理集群政策和我們的博客集群政策:允許簡單的集群創建完整的管理控製使用集群政策