使用父记录加入logstash


日耀九洲
2025-03-18 12:51:03 (8小时前)

“sm_creator”:[
“史密斯,约翰”,
“杜邦,阿尔伯特”,
“Reegan,Ronald”
]
“sm_departement”:[
“UCL / CORE - 中心

操作
</跨度>

研究
</跨度>
和计量经济学“,
]
“sm_date 与其父级相同的碎片,
所以has_child不必做笨拙的交叉分片

操作
</跨度>

使用logstash,我无法将所有数据放在单个索引nammed logstash中。按月我有超过1M

2 条回复
  1. 0# 荧惑 | 2019-08-31 10-32



    一个想法是使用


    elasticsearch

    logstash过滤器

    为了在Logstash处理访问日志文档时获取给定的发布。



    该过滤器将检索

    sm_creator

    在该领域

    publications

    索引具有相同的

    object_id

    并使用您需要的出版物文档中的任何字段丰富访问日志。此后,您只需查询logstash- *索引即可。




    1. elasticsearch {
      hosts => [“localhost:9200”]
      index => publications
      query => id:%{object_id}”
      fields => {“sm_creator => author”}
      }

    2. </code>


    因此,您的访问日志文档将在此之后显示为

    “给我所有访问’史密斯,约翰’的出版物”
    </强>
    你可以简单地查询

    sm_creator

    所有logstash索引中的字段




    1. {
      type”: apache_access”,
      clientip”: 192.243.xxx.xxx”,
      verb”: GET”,
      request”: “/publications/boreal:12345?direction=rtl&language=en”,

      url_path”: “/publications/boreal:12345”,
      url_params”: {
      direction”: rtl”,
      language”: end
      },
      object_id”: boreal:12345”,
      author”: [
      Smith, John”,
      Dupont, Albert”,
      Reegan, Ronald
      ],

      }

    2. </code>

登录 后才能参与评论