对你有用的东西之一就是检查Lucene
索引文件
手动。
我怀疑最重要的是Term Dictionary文件(* .tim)
我已将文档编入索引,没有存储的值和术语 -
test@test.com
在现场电子邮件(
文本域
同
标准
分析器)和
John
在字段名称(
StringField
)
在这之后,我用十六进制编辑器打开了tim文件,并且能够看到如下内容:
你可以清楚地看到它的价值
test, test, com
这是标准的一个标记,你也可以看到约翰仍然保持不变,因为我用过
StringField
。在我的其他例子中,我也能看到小写的工作。
提醒一下,如果你想重复它 - 默认情况下,小型索引Lucene会将所有内容都放入复合文件中,我不喜欢这个特定的调试。你可以通过禁用它
setUseCompoundFile(假)