韋伯@Jared:
是的,它是可以使用分層抽樣策略火車/測試/驗證AutoML庫中的分裂。azureml.train AutoMLConfig類。automl包允許您指定一個
featurization配置,其中包括一個stratification_column_names參數,您可以使用它來指定列(s)分層。這是一個例子的代碼片段,展示了如何使用分層抽樣AutoML:
從azureml。核心從azureml.train進口數據集。automl進口AutoMLConfig #加載數據集AzureML注冊數據集的數據集=數據集。get_by_name(工作區,dataset_name) #指定列(s)分層stratification_columns =(“集團”)# AutoML配置為使用分層抽樣automl_config = AutoMLConfig(任務=“分類”,primary_metric =“準確性”,training_data =數據集,label_column_name =“標簽”,featurization =‘汽車’,n_cross_validations = 5, stratification_column_names = stratification_columns compute_target = compute_target max_concurrent_iterations = 4, experiment_timeout_minutes = 30, enable_early_stopping = True) #運行AutoML automl_run = experiment.submit (automl_config)
在這個例子中,stratification_columns列名列表使用分層。您可以包括盡可能多的列需要得到所需的水平的分層。
注意,您需要確保您使用的stratification_columns存在分層的數據集和有適當的值。同時,請記住,分層永遠是不可能的或可取的取決於你的用例和數據分布,所以你應該仔細考慮是否適合於您的具體情況。
韋伯@Jared:
是的,它是可以使用分層抽樣策略火車/測試/驗證AutoML庫中的分裂。azureml.train AutoMLConfig類。automl包允許您指定一個
featurization配置,其中包括一個stratification_column_names參數,您可以使用它來指定列(s)分層。這是一個例子的代碼片段,展示了如何使用分層抽樣AutoML:
從azureml。核心從azureml.train進口數據集。automl進口AutoMLConfig #加載數據集AzureML注冊數據集的數據集=數據集。get_by_name(工作區,dataset_name) #指定列(s)分層stratification_columns =(“集團”)# AutoML配置為使用分層抽樣automl_config = AutoMLConfig(任務=“分類”,primary_metric =“準確性”,training_data =數據集,label_column_name =“標簽”,featurization =‘汽車’,n_cross_validations = 5, stratification_column_names = stratification_columns compute_target = compute_target max_concurrent_iterations = 4, experiment_timeout_minutes = 30, enable_early_stopping = True) #運行AutoML automl_run = experiment.submit (automl_config)
在這個例子中,stratification_columns列名列表使用分層。您可以包括盡可能多的列需要得到所需的水平的分層。
注意,您需要確保您使用的stratification_columns存在分層的數據集和有適當的值。同時,請記住,分層永遠是不可能的或可取的取決於你的用例和數據分布,所以你應該仔細考慮是否適合於您的具體情況。