Lucene索引 - 导出/查询“已编入索引”的文本字段值未“存储”


無口君哦哦
2025-03-17 08:42:18 (5天前)


我有一个Lucene索引,文档文本是“索引”但不是“存储”。

我正在使用Luke v7.6.0,它非常适合’可视化’索引。

显然是因为我的文档文本已编入索引但未…

2 条回复
  1. 0# 易米烊光 | 2019-08-31 10-32



    对你有用的东西之一就是检查Lucene

    索引文件

    手动。



    我怀疑最重要的是Term Dictionary文件(* .tim)



    我已将文档编入索引,没有存储的值和术语 -

    test@test.com

    在现场电子邮件(

    文本域



    标准

    分析器)和

    John

    在字段名称(

    StringField




    在这之后,我用十六进制编辑器打开了tim文件,并且能够看到如下内容:








    你可以清楚地看到它的价值

    test, test, com

    这是标准的一个标记,你也可以看到约翰仍然保持不变,因为我用过

    StringField

    。在我的其他例子中,我也能看到小写的工作。



    提醒一下,如果你想重复它 - 默认情况下,小型索引Lucene会将所有内容都放入复合文件中,我不喜欢这个特定的调试。你可以通过禁用它

    setUseCompoundFile(假)


登录 后才能参与评论