作者:天若无雨666 | 来源:互联网 | 2023-02-04 08:34
如果我有以下熊猫DataFrame
:
pd.DataFrame(columns=['name', 'tags'], data=[
['Rob', ['a', 'c']],
['Erica', ['b', 'c']]
])
表:
Name tags
Rob ['a', 'c']
Erica ['b', 'c']
我如何将其转换为:
Name tags_a tags_b tags_c
Rob 1 0 1
Erica 0 1 1
如果每行只能包含1个标记,则可以使用此标记,pd.get_dummies(df, columns=['tags'])
但当tags
是时,此标记将不起作用List
。
1> piRSquared..:
str.get_dummies
df.tags.str.join('|').str.get_dummies().add_prefix('tags_')
tags_a tags_b tags_c
0 1 0 1
1 0 1 1
包括 join
df[['name']].join(df.tags.str.join('|').str.get_dummies().add_prefix('tags_'))
name tags_a tags_b tags_c
0 Rob 1 0 1
1 Erica 0 1 1