取消
顯示的結果
而不是尋找
你的意思是:

AutoML與分層抽樣

jaredaw
新的貢獻者二世

有可能使用分層抽樣策略火車/測試/驗證分裂automl圖書館嗎?我們正在在一個上下文,我們需要隔離某些群體的訓練集和測試集,看看我們的模型推廣這些組織的水平。

一個黑客,我認為試圖扭轉我們的訂購我們的團體分類模型為預測模型,然後利用time_col參數,但這絕對是錯誤的。有人有什麼見解嗎?

謝謝你!

1接受解決方案

接受的解決方案

匿名
不適用

韋伯@Jared:

是的,它是可以使用分層抽樣策略火車/測試/驗證AutoML庫中的分裂。azureml.train AutoMLConfig類。automl包允許您指定一個

featurization配置,其中包括一個stratification_column_names參數,您可以使用它來指定列(s)分層。這是一個例子的代碼片段,展示了如何使用分層抽樣AutoML:

從azureml。核心從azureml.train進口數據集。automl進口AutoMLConfig #加載數據集AzureML注冊數據集的數據集=數據集。get_by_name(工作區,dataset_name) #指定列(s)分層stratification_columns =(“集團”)# AutoML配置為使用分層抽樣automl_config = AutoMLConfig(任務=“分類”,primary_metric =“準確性”,training_data =數據集,label_column_name =“標簽”,featurization =‘汽車’,n_cross_validations = 5, stratification_column_names = stratification_columns compute_target = compute_target max_concurrent_iterations = 4, experiment_timeout_minutes = 30, enable_early_stopping = True) #運行AutoML automl_run = experiment.submit (automl_config)

在這個例子中,stratification_columns列名列表使用分層。您可以包括盡可能多的列需要得到所需的水平的分層。

注意,您需要確保您使用的stratification_columns存在分層的數據集和有適當的值。同時,請記住,分層永遠是不可能的或可取的取決於你的用例和數據分布,所以你應該仔細考慮是否適合於您的具體情況。

在原帖子查看解決方案

2回答2

匿名
不適用

韋伯@Jared:

是的,它是可以使用分層抽樣策略火車/測試/驗證AutoML庫中的分裂。azureml.train AutoMLConfig類。automl包允許您指定一個

featurization配置,其中包括一個stratification_column_names參數,您可以使用它來指定列(s)分層。這是一個例子的代碼片段,展示了如何使用分層抽樣AutoML:

從azureml。核心從azureml.train進口數據集。automl進口AutoMLConfig #加載數據集AzureML注冊數據集的數據集=數據集。get_by_name(工作區,dataset_name) #指定列(s)分層stratification_columns =(“集團”)# AutoML配置為使用分層抽樣automl_config = AutoMLConfig(任務=“分類”,primary_metric =“準確性”,training_data =數據集,label_column_name =“標簽”,featurization =‘汽車’,n_cross_validations = 5, stratification_column_names = stratification_columns compute_target = compute_target max_concurrent_iterations = 4, experiment_timeout_minutes = 30, enable_early_stopping = True) #運行AutoML automl_run = experiment.submit (automl_config)

在這個例子中,stratification_columns列名列表使用分層。您可以包括盡可能多的列需要得到所需的水平的分層。

注意,您需要確保您使用的stratification_columns存在分層的數據集和有適當的值。同時,請記住,分層永遠是不可能的或可取的取決於你的用例和數據分布,所以你應該仔細考慮是否適合於您的具體情況。

Vidula_Khanna
主持人
主持人

嗨@Jared韋伯

謝謝你發布你的問題在我們的社區!我們很高興幫助你。

幫助我們為您提供最準確的信息,請您花一些時間來回顧反應和選擇一個最好的回答了你的問題嗎?

這也將有助於其他社區成員可能也有類似的問題在未來。謝謝你的參與,讓我們知道如果你需要任何進一步的援助!

歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map