我有一个数据集,df,有两个变量,x和y.我想编写一个执行以下操作的函数:
x如果x> 100且y <50,则为y
我习惯于在STATA中进行数据分析,因此我对数据分析的熊猫相对较新.如果它有帮助,在stata中它看起来像:
替换x = cond(x> 100&y <50,x,y)
换句话说,该函数以df中的两列为条件,并且将根据条件是否满足从每个行中的一个变量或另一个变量返回一个值.
到目前为止,我一直在通过以下新功能创建新变量:
df.dummyVar = df.x.apply(lambda x:1,如果x> 100,则为0)
使用StackOverflow和文档我只能找到如何将依赖于单个变量的函数应用于多个列(使用axis选项).请帮忙.