我有一个数据框,其中有投票和政党标签
dat <- data.frame( v1=c(25, 0, 70), v2=c(75, 100, 20), v3=c(0, 0, 10), l1=c("pA", ".", "pB"), l2=c("pB", "pC", "pC"), l3=c(".", ".", "pD") )
这样每行就是一个分析单位.只有投票方才需要考虑,此功能可以提取正面投票或相应的标签
getpos <- function(vector, vorl="v"){ # change to "l" to report labels vot <- vector[grep( "v", colnames(vector) )]; lab <- vector[grep( "l", colnames(vector) )]; if (vorl=="v") {vot[vot>0]} else {lab[vot>0]}; } getpos(dat[1,]) # votes for obs 1 getpos(dat[1,], vorl="l") # labels for obs 1
我希望在数据帧dat的每一行中运行函数getpos,以便生成具有不同长度的投票/标签向量的列表.应用该函数不会返回我期望的内容:
apply(X=dat, MARGIN=1, FUN=getpos, vorl="l")
谁能发现问题?相关,这可以更有效地实现吗?
这里发生的是数据框中的行在被提取后不再具有列名apply
(但它们确实有names
):
尝试:
getpos <- function(x, vorl="v"){ vot <- x[grep( "v", names(x) )] ; lab <- x[grep( "l", names(x) )]; if (vorl=="v") {vot[vot>0]} else {lab[vot>0]}; } > apply(dat, MARGIN=1, FUN=function(x2) getpos(x2, vorl="l") ) #------------- [[1]] l1 "pA" [[2]] l2 "pC" [[3]] l1 l3 "pB" "pD"