作者:唱记_665 | 来源:互联网 | 2023-05-24 21:37
我试图从我的data.frame的最后一列删除所有以模式"Gm"开头的字符
我的data.frame看起来像这样
level logp chr start end CNA Genes
3 1.4 3 100 110 gain Gm5852,Gm5773,Tdpoz4,Tdpoz3,Gm911
4 18.10 3 962 966 gain Fcgr1,Terc,Gm5703
结果看起来应该是这样的
level logp chr start end CNA Genes
3 1.4 3 100 110 gain Tdpoz4,Tdpoz3
4 18.10 3 962 966 gain Fcgr1,Terc
G. Grothendi..
5
这使用单个gsub
删除不需要的部分:
Genes <- c("Gm5852,Gm5773,Tdpoz4,Tdpoz3,Gm911", "Fcgr1,Terc,Gm5703") # test data
gsub(",?Gm[^,]*,?", "", Genes)
赠送:
[1] "Tdpoz4,Tdpoz3" "Fcgr1,Terc"
这是正则表达式的可视化:
,?Gm[^,]*,?
Debuggex演示
1> G. Grothendi..:
这使用单个gsub
删除不需要的部分:
Genes <- c("Gm5852,Gm5773,Tdpoz4,Tdpoz3,Gm911", "Fcgr1,Terc,Gm5703") # test data
gsub(",?Gm[^,]*,?", "", Genes)
赠送:
[1] "Tdpoz4,Tdpoz3" "Fcgr1,Terc"
这是正则表达式的可视化:
,?Gm[^,]*,?
Debuggex演示