问

删除R中字符串中的重复单词

欧阳羽昌53 发布于 2023-02-13 19:44

只是为了帮助那些刚刚自愿删除问题的人,按照他试过的代码请求和其他评论.我们假设他们尝试过这样的事情:

str <- "How do I best try and try and try and find a way to to improve this code?"
d <- unlist(strsplit(str, split=" "))
paste(d[-which(duplicated(d))], collapse = ' ')



并希望学习更好的方法.那么从字符串中删除重复单词的最佳方法是什么？



        
        1 个回答
        
                        
                如果您仍然对替代解决方案感兴趣，则可以使用unique它来稍微简化您的代码。

paste(unique(d), collapse = ' ')


根据Thomas的评论，您可能确实希望删除标点符号。R gsub具有一些不错的内部模式，您可以使用它们代替严格的正则表达式。当然，如果要执行一些更完善的正则表达式，则始终可以指定特定实例。

d <- gsub("[[:punct:]]", "", d)

        
                
                    2023-02-13 19:46  回答
                       nzwznet_355
                
            
                    
    
    
    
        撰写答案
        
            
                
                    回答问题...



    
    
        今天，你开发时遇到什么问题呢？
        立即提问
    

    
        热门标签