删除R中字符串中的重复单词

 欧阳羽昌53 发布于 2023-02-13 19:44

只是为了帮助那些刚刚自愿删除问题的人,按照他试过的代码请求和其他评论.我们假设他们尝试过这样的事情:

str <- "How do I best try and try and try and find a way to to improve this code?"
d <- unlist(strsplit(str, split=" "))
paste(d[-which(duplicated(d))], collapse = ' ')

并希望学习更好的方法.那么从字符串中删除重复单词的最佳方法是什么?

1 个回答
  • 如果您仍然对替代解决方案感兴趣,则可以使用unique它来稍微简化您的代码。

    paste(unique(d), collapse = ' ')
    

    根据Thomas的评论,您可能确实希望删除标点符号。R gsub具有一些不错的内部模式,您可以使用它们代替严格的正则表达式。当然,如果要执行一些更完善的正则表达式,则始终可以指定特定实例。

    d <- gsub("[[:punct:]]", "", d)
    

    2023-02-13 19:46 回答
撰写答案
今天,你开发时遇到什么问题呢?
立即提问
热门标签
PHP1.CN | 中国最专业的PHP中文社区 | PNG素材下载 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有