我有一个基于django的应用程序与干草堆和嗖嗖的搜索引擎.我想提供一个重音和特殊字符独立搜索,这样我就可以通过使用没有特殊字符的单词找到带有特殊字符的索引数据:
索引是:
'café'
搜索词:
'cafe' 'café'
我写了一个特定的FoldingWhooshSearchBackend,它使用a StemmingAnalyzer
和a CharsetFilter(accent_map)
,如下面的文档所述:
https://gist.github.com/gregplaysguitar/1727204
然而,搜索仍然没有像预期的那样工作,即我无法搜索'cafe'并找到'café'.我用以下方法研究了搜索索引:
from whoosh.index import open_dir ix = open_dir('myservice/settings/whoosh_index') searcher = ix.searcher() for doc in searcher.documents(): print doc
特殊字符仍在索引中.
我还需要做些什么吗?是关于改变索引模板?