2019-12-13
Shay 开源了这套给老婆搜索食谱用的系统。Compass 也改名为了 Elasticsearch. Shay 在把 Compass 重写为 Elasticsearch 时。分片有「主分片」和「副本分片」。
|
2019-03-13
即按文档得分取查询结果集的TopK COMPLETE。在SkipList的索引节点中。如果对整个Postings中所有的文档都进行评分计算的话。比如通过该查询的候选文档的评分取TopK。
|
2020-08-18
需要优化其建索引的性能。然后再合并到 solr 的索引中去。4、 调用 HTTP 的合并结构后会将 Lucene 新建的索引目录合并到 Solr 的索引中去。可以将索引直接写到 solr 的索引目录里面去。
|
2019-08-17
然后详细描述新数据写入 ES 和 Lucene 的流程和原理。Elasticsearch 不仅仅是 Lucene 和全文搜索。为了将 segment 数据写到磁盘 文档经过 refresh 后。
|
2022-02-21
查询时就直接搜索到对应的索引文件。🐖 分词的目的是为了索引。会对字段域中的 value 进行分词。nice to meet you 的字段域进行过分词。FST 在 Lucene 中被大量使用。
|
2019-12-29
(lucene 索引存储结构概念图) 上图大概可以这样理解。索引(Index) – 段(segment) – 文档(Document) – 域(Field) – 词(Term)。
|
2020-09-02
生成新的 segment 以及一个 Commit point 提交点。cache 内的 segment 被 fsync 刷新到磁盘。在 ES 后台会有一个线程进行 segment 合并。
|
2017-02-13
这个过程就需要对fdx/fdt文件进行读操作。lucene源代码学习之LZ4压缩算法在lucene中应用 1.1 fdx/fdt文件的创建。表示当前Block中每个Chunk的doc个数。
|
