作者:chenyanni1030_430 | 来源:互联网 | 2022-12-07 10:14
1> phiver..:
该代码应该仍然有效。您得到警告,而不是错误。当您使用语料库而不是VCorpus时,只有结合使用基于VectorSource的语料库时,才会出现此警告。
原因是在基础代码中进行了检查,以查看语料库内容的名称数量是否与语料库内容的长度匹配。将文本作为矢量读取时,没有文档名称,并且会弹出此警告。这只是一个警告,没有文档被丢弃。
看到两个例子之间的区别
library(tm)
text <- c("this is my text with some other text and some more")
# warning based on Corpus and Vectorsource
text_corpus <- Corpus(VectorSource(text))
# warning appears running following line
tm_map(text_corpus, content_transformer(tolower))
<>
Metadata: corpus specific: 1, document level (indexed): 0
Content: documents: 1
Warning message:
In tm_map.SimpleCorpus(text_corpus, content_transformer(tolower)) :
transformation drops documents
# Using VCorpus
text_corpus <- VCorpus(VectorSource(text))
# warning doesn't appear
tm_map(text_corpus, content_transformer(tolower))
<>
Metadata: corpus specific: 0, document level (indexed): 0
Content: documents: 1
tm_map(text_corpus, content_transformer(tolower))