我正在使用lucene版本4.4与这些分析仪:
worddelimeter, patternFilter, synonyms, lowercase, stopwords, kStemFilter, shingle, trimfilter.
分析仪按我使用它们的顺序列出.当我尝试添加文档时,我得到以下异常:
startOffset must be non-negative, and endOffset must be >= startOffset, startOffset=37571,endOffset=37569
仅对特定文件发生此异常.但是当我改变顺序并放置stopwords
过滤器之前worddelimeter
它工作正常.但这不是正确的做法!
为什么会这样?在什么情况下过滤器会以某种方式改变数据以导致异常?