我只有一个数据框,并且想将Featuretools用于自动要素工程部分。我能够使用规范化实体功能来做到这一点。代码段如下:
es = ft.EntitySet(id = ‘obs_data’)
es = es.entity_from_dataframe(entity_id = ‘obs’, dataframe = X_train,
variable_types = variable_types, make_index = True, index = “Id”)
for feat in interaction: # interaction columns are found using xgbfir
es = es.normalize_entity(base_entity_id=’obs’, new_entity_id=feat, index=feat)
features, feature_names = ft.dfs(entityset = es,
target_entity = ‘obs’,
max_depth = 2)
它的创建功能,现在我想对X_test做同样的事情。我读过有关此的博客,他们建议结合使用X_train和X_test,然后执行相同的过程。假设X_test中有5个obs,并且如果我将其与X_train结合使用,则每个观察(来自X_test)也将具有其他4个观察(X_test)的效果,这不是一个好主意。任何人都可以建议如何使用Featuretools对新数据进行特征工程?