Robuta

https://docs.infinilabs.com/easysearch/main/docs/deployment/install-guide/operator/node_scale/ 节点扩容 | INFINI Easysearch (main) | 分布式搜索型数据库 节点扩容 # Easysearch Operator 支持通过修改 YAML 配置实现快速水平扩容。 操作步骤 # 修改 Operator YAML 文件中的 replicas 字段值。例如,将集群从 3 节点扩容到 5 节点: # 修改前 replicas: 3 # 修改后 replicas: 5 应用修改:... infini easysearchmain https://docs.infinilabs.com/easysearch/main/docs/features/multimodal-search/ 多模态搜索 | INFINI Easysearch (main) | 分布式搜索型数据库 跨越文本边界,支持图片、音频、视频等多种数据形态的统一向量检索。 infini easysearchmain https://docs.infinilabs.com/easysearch/main/docs/features/mapping-and-analysis/text-analysis/token-filters/predicate-token-filter/ 谓词分词过滤器(Predicate Token Filter) | INFINI Easysearch (main) | 分布式搜索型数据库 Predicate Token Filter 分词过滤器 # predicate_token_filter 分词过滤器会根据自定义脚本中定义的条件来评估词元是应该保留还是丢弃。词元的评估是在分析谓词上下文中进行的。此过滤器仅支持内联 Painless 脚本。 相关指南(先读这些) # 文本分析:识别词元... infini easysearchtokenmain https://docs.infinilabs.com/easysearch/main/docs/features/mapping-and-analysis/mapping-parameters/term_vector/ 词向量参数(Term Vector) | INFINI Easysearch (main) | 分布式搜索型数据库 Term Vector 参数 # term_vector 参数控制是否为字段存储词条向量(Term Vector)信息。词条向量包含词条及其位置、偏移量等信息,供高亮和 More Like This 查询使用。 相关指南 # 全文搜索 analyzer 参数 可选值 # 值 说明 no 默认值。不存储词条向量。... infini easysearchmain https://docs.infinilabs.com/easysearch/main/docs/management/security/create-role/ 新增角色 | INFINI Easysearch (main) | 分布式搜索型数据库 在 Easysearch UI 中创建新角色并配置权限。 infini easysearchmain https://docs.infinilabs.com/easysearch/main/docs/features/mapping-and-analysis/mapping-parameters/ignore_malformed/ 忽略格式错误参数(Ignore Malformed) | INFINI Easysearch (main) | 分布式搜索型数据库 Ignore Malformed 参数 # ignore_malformed 参数控制在写入格式错误的数据时,是否忽略该值而不是拒绝整个文档。 默认情况下,写入一个类型不匹配的值(如向数值字段写入字符串)会导致整个文档被拒绝。启用 ignore_malformed... infini easysearchmain https://docs.infinilabs.com/easysearch/main/docs/features/data-retention/ 数据保留与生命周期 | INFINI Easysearch (main) | 分布式搜索型数据库 索引生命周期管理、快照备份、数据清理、时序优化等数据生命周期全流程指南与 API。 infini easysearchmain https://docs.infinilabs.com/easysearch/main/docs/features/ingest-pipelines/simulate-ingest/ 模拟管道 | INFINI Easysearch (main) | 分布式搜索型数据库 infini easysearchmain https://docs.infinilabs.com/easysearch/main/docs/management/lifecycle/ 生命周期 | INFINI Easysearch (main) | 分布式搜索型数据库 通过 Easysearch UI 管理索引生命周期策略。 infini easysearchmain https://docs.infinilabs.com/easysearch/main/docs/features/ingest-pipelines/index-processors/join/ 连接处理器 | INFINI Easysearch (main) | 分布式搜索型数据库 连接处理器 # join 处理器将数组中的元素连接成一个单独的字符串值,每个元素之间使用指定的分隔符。如果提供的输入不是数组,则抛出异常。 以下是为 join 处理器提供的语法: { infini easysearchmain https://docs.infinilabs.com/easysearch/main/docs/features/mapping-and-analysis/text-analysis/token-filters/pattern-capture/ 正则捕获分词过滤器(Pattern Capture) | INFINI Easysearch (main) | 分布式搜索型数据库 Pattern Capture 分词过滤器 # pattern_capture 分词过滤器是一种功能强大的过滤器,它使用正则表达式根据特定模式来捕获和提取文本的部分内容。当你想要提取词元的特定部分,例如电子邮件域名、话题标签或数字,并将其重新用于进一步的分析或索引编制时,这个过滤器会非常有用。 相关指南(先读这些)... infini easysearchmain https://docs.infinilabs.com/easysearch/main/docs/best-practices/data-modeling/mapping-patterns/ Mapping 模式与最佳实践 | INFINI Easysearch (main) | 分布式搜索型数据库 实用映射模式:多字段、keyword/text 策略、数组、对象与归一化。 infini easysearchmappingmain https://docs.infinilabs.com/easysearch/main/docs/fundamentals/write-and-storage/ 写入与存储机制 | INFINI Easysearch (main) | 分布式搜索型数据库 文档从写入请求到可被搜索再到持久化落盘的全过程:内存缓冲、refresh、translog、flush 与段合并。 infini easysearchmain https://docs.infinilabs.com/easysearch/main/docs/fundamentals/concurrency-and-versioning/ 并发控制与版本 | INFINI Easysearch (main) | 分布式搜索型数据库 infini easysearchmain https://docs.infinilabs.com/easysearch/main/docs/features/mapping-and-analysis/mapping-parameters/norms/ 评分规范参数(Norms) | INFINI Easysearch (main) | 分布式搜索型数据库 Norms 参数 # norms 参数控制是否存储字段长度归一化因子,用于相关性评分计算。 在 BM25 评分算法中,字段长度是一个重要因素:短字段中的匹配通常比长字段中的匹配更相关。norms 存储的就是这个字段长度信息。 相关指南(先读这些) # 映射基础 评分基础 参数选项 # 字段类型 默认值 说明 text... infini easysearchmain https://docs.infinilabs.com/easysearch/main/docs/deployment/config/configuration_file/ 配置说明 | INFINI Easysearch (main) | 分布式搜索型数据库 配置文件 # 可以在每个 Easysearch 节点上找到 easysearch.yml ,通常位于 Easysearch 安装目录下 config/easysearch.yml。 配置文件一览 # Easysearch 主要有以下几类配置文件:... infini easysearchmain https://docs.infinilabs.com/easysearch/main/docs/features/aggregations/metric-aggregations/geobounds/ 地理边界聚合(Geo Bounds) | INFINI Easysearch (main) | 分布式搜索型数据库 地理边界聚合 # geo_bounds 聚合是一个多值指标聚合,用于计算包含一组 geo_point 或 geo_shape 对象的地理边界框。边界框以十进制编码的经纬度(lat-lon)对形式返回,作为矩形的左上角和右下角顶点。 相关指南(先读这些) # 聚合基础 地理位置搜索 Geo 场景实践 参数说明 #... infini easysearchmain https://docs.infinilabs.com/easysearch/main/docs/features/mapping-and-analysis/text-analysis/token-filters/reverse/ 反转分词过滤器(Reverse) | INFINI Easysearch (main) | 分布式搜索型数据库 Reverse 分词过滤器 # reverse 分词过滤器会反转每个词元中字符的顺序,这样在分析过程中,后缀信息就会位于反转后词元的开头。 相关指南(先读这些) # 文本分析:识别词元 部分匹配 文本分析基础 这对于基于后缀的搜索很有用: 反转分词过滤器在你需要进行基于后缀的搜索时很有帮助,例如以下场景:... infini easysearchmain https://docs.infinilabs.com/easysearch/main/docs/management/data-explorer/add-filter/ 新增过滤条件 | INFINI Easysearch (main) | 分布式搜索型数据库 在 Easysearch UI 数据探索中新增过滤条件。 infini easysearchmain https://docs.infinilabs.com/easysearch/main/docs/features/query-dsl/match-all/ Match All 查询 | INFINI Easysearch (main) | 分布式搜索型数据库 Match All 查询 # match_all 查询返回所有文档。如果需要返回整个文档集,这个查询在测试大量文档集时很有用。 相关指南(先读这些) # 查询 DSL 基础 结构化搜索 GET _search { infini easysearchmatchmain https://docs.infinilabs.com/easysearch/main/docs/operations/cluster-admin/cluster/ 集群管理 | INFINI Easysearch (main) | 分布式搜索型数据库 集群状态、节点管理、分片分配、设置管理。 infini easysearchmain https://docs.infinilabs.com/easysearch/main/docs/deployment/config/hardware/ 硬件配置 | INFINI Easysearch (main) | 分布式搜索型数据库 生产环境硬件配置推荐 # 在生产环境部署 Easysearch 时,高可用性(HA)是必须满足的核心要求。为实现完整的 HA 保障,您至少需要部署 3 个节点组成 Easysearch 集群。为获得最佳运维体验,建议配合使用 INFINI Console 和... infini easysearchmain https://docs.infinilabs.com/easysearch/main/docs/features/mapping-and-analysis/text-analysis/token-filters/limit/ 限制分词过滤器(Limit) | INFINI Easysearch (main) | 分布式搜索型数据库 Limit 分词过滤器 # limit 分词过滤器用于限制分词链通过的词元数量。 相关指南(先读这些) # 文本分析:规范化 文本分析:识别词元 参数说明 # 限制分词过滤器可以使用以下参数进行配置。 参数 必填/可选 数据类型 描述 max_token_count 可选 整数 要生成的词元的最大数量。默认值为 1。... infini easysearchmain https://docs.infinilabs.com/easysearch/main/docs/features/mapping-and-analysis/mapping-parameters/index_prefixes/ 前缀索引(Index Prefixes) | INFINI Easysearch (main) | 分布式搜索型数据库 前缀索引(Index Prefixes) # 启用前缀查询的优化。当启用此参数时,Easysearch 会为前缀查询构建额外的索引结构。 基本用法 # PUT my-index { infini easysearchmain https://docs.infinilabs.com/easysearch/main/docs/features/mapping-and-analysis/field-types/object-field-type/nested/ 嵌套字段类型(Nested) | INFINI Easysearch (main) | 分布式搜索型数据库 Nested 字段类型 # nested 字段类型是一种特殊的 对象字段类型,用于将数组中的对象作为独立文档索引,避免扁平化导致的 infini easysearchmain https://docs.infinilabs.com/easysearch/main/docs/features/mapping-and-analysis/text-analysis/token-filters/porter-stem/ Porter 词干分词过滤器(Porter Stem) | INFINI Easysearch (main) | 分布式搜索型数据库 Porter Stem 分词过滤器 # porter_stem 分词过滤器会将单词还原为其基本(或词干)形式,并去除单词中常见的后缀,这有助于通过单词的词根来匹配相似的单词。例如,单词 infini easysearchportermain https://docs.infinilabs.com/easysearch/main/docs/management/security/delete-role/ 删除角色 | INFINI Easysearch (main) | 分布式搜索型数据库 在 Easysearch UI 中删除角色。 infini easysearchmain https://docs.infinilabs.com/easysearch/main/docs/features/mapping-and-analysis/text-analysis/token-filters/condition/ 条件分词过滤器(Condition) | INFINI Easysearch (main) | 分布式搜索型数据库 Condition 分词过滤器 # condition... infini easysearchmain https://docs.infinilabs.com/easysearch/main/docs/features/mapping-and-analysis/field-types/object-field-type/join/ 父子关系字段类型(Join) | INFINI Easysearch (main) | 分布式搜索型数据库 Join 字段类型 # join 字段类型用于在同一索引中的文档之间建立父/子关系。 相关指南(先读这些) # Parent-Child 建模 映射模式 代码样例 # 模拟创建一个映射来建立一个产品和其品牌之间的父/子关系: PUT testindex1 { infini easysearchmain https://docs.infinilabs.com/easysearch/main/docs/features/mapping-and-analysis/field-types/ 字段类型 | INFINI Easysearch (main) | 分布式搜索型数据库 Easysearch 支持的所有字段类型及其适用场景 infini easysearchmain https://docs.infinilabs.com/easysearch/main/docs/features/aggregations/pipeline-aggregations/bucket-selector/ 桶选择器聚合(Bucket Selector) | INFINI Easysearch (main) | 分布式搜索型数据库 桶选择器聚合 # bucket_selector 聚合是一个父管道聚合,它评估脚本以确定直方图(或 date_histogram)聚合返回的存储分组是否应包含在最终结果中。 与创建新值的管道聚合不同,bucket_selector... infini easysearchmain https://docs.infinilabs.com/easysearch/main/docs/features/mapping-and-analysis/mapping-parameters/scaling_factor/ 缩放因子(Scaling Factor) | INFINI Easysearch (main) | 分布式搜索型数据库 缩放因子(Scaling Factor) # 缩放比因子用于将浮点值转换为长整数以获得更高的精度。 基本用法 # PUT my-index { infini easysearchmain https://docs.infinilabs.com/easysearch/main/docs/features/ingest-pipelines/index-processors/rename/ 重命名处理器 | INFINI Easysearch (main) | 分布式搜索型数据库 重命名处理器 # rename 处理器用于重命名现有字段,也可以用来将字段从一个对象移动到另一个对象或根级别。 语法 # 以下是为 rename 处理器提供的语法: { infini easysearchmain https://docs.infinilabs.com/easysearch/main/docs/features/query-dsl/span/span-multi-term/ Span Multi Term 查询 | INFINI Easysearch (main) | 分布式搜索型数据库 Span Multi Term 查询 # span_multi 查询允许您将多词查询(如 wildcard、fuzzy、prefix、range 或 regexp)包装为 span 查询。这使您能够在其他 span 查询中使用这些更灵活的匹配查询。 例如,您可以使用 span_multi 查询来:... infini easysearchspanmultitermmain https://docs.infinilabs.com/easysearch/main/docs/management/dev-tools/quick-open-dev-tools/ 快速打开开发工具 | INFINI Easysearch (main) | 分布式搜索型数据库 在 Easysearch UI 中快速打开开发工具。 infini easysearchmain https://docs.infinilabs.com/easysearch/main/docs/features/ingest-pipelines/index-processors/csv/ CSV 处理器 | INFINI Easysearch (main) | 分布式搜索型数据库 CSV 处理器 # csv 处理器用于解析 CSV 文件并将它们作为单独的字段存储在文档中。该处理器会忽略空字段。 语法 # 以下是为 csv 处理器提供的语法: { infini easysearchcsvmain https://docs.infinilabs.com/easysearch/main/docs/features/query-dsl/term-based-query/regexp/ Regexp 查询 | INFINI Easysearch (main) | 分布式搜索型数据库 Regexp 查询 # 使用 regexp 查询来搜索符合正则表达式的词项。有关编写正则表达式的更多信息,请参见正则表达式语法。 相关指南(先读这些) # 部分匹配 结构化搜索 以下查询搜索以任何大写或小写字母开头的任何词项 amlet : GET shakespeare/_search { infini easysearchregexpmain https://docs.infinilabs.com/easysearch/main/docs/features/query-dsl/term-based-query/term/ Term 查询 | INFINI Easysearch (main) | 分布式搜索型数据库 Term 查询 # 使用 term 查询在字段中搜索确切的词项。例如,以下查询搜索包含确切的行号的行: 相关指南(先读这些) # 结构化搜索 Query DSL 基础 GET shakespeare/_search { infini easysearchtermmain https://docs.infinilabs.com/easysearch/main/docs/management/dev-tools/copy-curl-command/ 复制 curl 命令 | INFINI Easysearch (main) | 分布式搜索型数据库 在 Easysearch UI 开发工具中复制 curl 命令。 infini easysearchcurlmain https://docs.infinilabs.com/easysearch/main/docs/features/query-dsl/joining/parent-id/ Parent ID 查询 | INFINI Easysearch (main) | 分布式搜索型数据库 Parent ID 查询 # parent_id 查询返回具有指定 ID 的父文档的子文档。您可以通过使用连接字段类型在相同索引中的文档之间建立父子关系。 相关指南(先读这些) # Parent-Child 建模 关联查询(Joining) 参考样例 # 在您运行一个 parent_id... infini easysearchparentidmain https://docs.infinilabs.com/easysearch/main/docs/features/query-dsl/collapse/ 结果折叠 | INFINI Easysearch (main) | 分布式搜索型数据库 Field Collapsing:按字段值对搜索结果去重折叠,每组只展示 Top-N。 infini easysearchmain https://docs.infinilabs.com/easysearch/main/docs/management/data-explorer/switch-index/ 切换索引 | INFINI Easysearch (main) | 分布式搜索型数据库 在 Easysearch UI 数据探索中切换目标索引。 infini easysearchmain https://docs.infinilabs.com/easysearch/main/docs/features/query-dsl/sort/ 排序 | INFINI Easysearch (main) | 分布式搜索型数据库 字段排序、多级排序、地理距离排序、脚本排序、missing 值处理的 API 与参数说明。 infini easysearchmain https://docs.infinilabs.com/easysearch/main/docs/features/aggregations/metric-aggregations/scripted-metric/ 脚本指标聚合(Scripted Metric) | INFINI Easysearch (main) | 分布式搜索型数据库 脚本指标聚合 # scripted_metric 聚合是一个多值指标聚合,它返回根据指定脚本计算的指标。脚本有四个阶段:init、map、combine 和 reduce,每个聚合按顺序运行这些阶段,组合来自文档的结果。 相关指南(先读这些) # 聚合基础 聚合场景实践 所有四个脚本共享一个可变对象,称为... infini easysearchmain https://docs.infinilabs.com/easysearch/main/docs/features/query-dsl/span/span-containing/ Span Containing 查询 | INFINI Easysearch (main) | 分布式搜索型数据库 Span Containing 查询 # span_containing 查询会在较大的文本模式(如短语或一组单词)的边界内查找包含较小文本模式的匹配项。可以将其视为仅在特定更大的上下文中出现时才查找单词或短语。 例如,您可以使用 span_containing 查询来执行以下搜索: 查找单词 infini easysearchspancontainingmain https://docs.infinilabs.com/easysearch/main/docs/operations/data-management/index-rollover/ 索引滚动(Rollover) | INFINI Easysearch (main) | 分布式搜索型数据库 当索引达到年龄、文档数或大小阈值时,自动滚动到新索引。 infini easysearchmain https://docs.infinilabs.com/easysearch/main/docs/fundamentals/nlp/ NLP 自然语言处理 | INFINI Easysearch (main) | 分布式搜索型数据库 NLP 自然语言处理 # 搜索引擎的核心挑战是理解人类语言。本文介绍 NLP(Natural Language Processing)在 Easysearch 中的应用,从基础的分词到高级的向量语义搜索。 NLP 在搜索中的角色 # 用户输入: infini easysearchnlpmain https://docs.infinilabs.com/easysearch/main/docs/features/aggregations/bucket-aggregations/range/ 范围聚合(Range) | INFINI Easysearch (main) | 分布式搜索型数据库 范围聚合 # range 聚合允许你为每个分组定义范围。 相关指南(先读这些) # 聚合基础 聚合场景实践 例如,你可以找到在 1000 和 2000 之间、2000 和 3000 之间以及 3000 和 4000 之间的字节数。在 range 参数中,你可以将范围定义为数组对象。 GET... infini easysearchmain https://docs.infinilabs.com/easysearch/main/docs/integrations/third-party/bboss/ Bboss 集成 | INFINI Easysearch (main) | 分布式搜索型数据库 Bboss 与 Easysearch 原生集成,一个高性能高兼容性的 Elasticsearch/Easysearch/Opensearch Java 客户端框架 infini easysearchmain https://docs.infinilabs.com/easysearch/main/docs/management/data-explorer/export-csv/ 导出 CSV 数据 | INFINI Easysearch (main) | 分布式搜索型数据库 在 Easysearch UI 数据探索中导出查询结果为 CSV 文件。 infini easysearchcsvmain https://docs.infinilabs.com/easysearch/main/docs/features/query-dsl/highlight/ 高亮 | INFINI Easysearch (main) | 分布式搜索型数据库 高亮命中词的 API 参数、高亮器类型选择、自定义标签、片段控制。 infini easysearchmain https://docs.infinilabs.com/easysearch/main/docs/features/mapping-and-analysis/text-analysis/tokenizers/icu-tokenizer/ ICU 分词器(ICU Tokenizer) | INFINI Easysearch (main) | 分布式搜索型数据库 ICU Tokenizer # icu_tokenizer 分词器使用 ICU 的 Unicode 文本分割算法,对多语言文本(尤其是亚洲语言混合文本)提供比 standard 分词器更好的分词效果。 需要安装 analysis-icu 插件。 示例 # PUT my_index { infini easysearchicumain https://docs.infinilabs.com/easysearch/main/docs/features/aggregations/bucket-aggregations/filters/ 多过滤器聚合(Filters) | INFINI Easysearch (main) | 分布式搜索型数据库 多过滤器聚合 # filters 聚合与 filter 聚合相同,但它允许你使用多个过滤器聚合。filter 聚合结果为一个分组,而 filters 聚合会返回多个分组,每个定义的过滤器对应一个分组。 相关指南(先读这些) # 聚合基础 聚合场景实践 要为所有未匹配任何过滤器查询的文档创建一个分组,将... infini easysearchmain https://docs.infinilabs.com/easysearch/main/docs/features/aggregations/bucket-aggregations/nested/ 嵌套聚合(Nested) | INFINI Easysearch (main) | 分布式搜索型数据库 嵌套聚合 # nested 聚合让你能够对嵌套对象内的字段进行聚合。nested 类型是对象数据类型的特殊版本,它允许对象数组以独立于彼此的方式进行索引,从而可以独立于彼此进行查询。 相关指南(先读这些) # 聚合基础 Nested 建模 聚合场景实践 使用 object... infini easysearchmain https://docs.infinilabs.com/easysearch/main/docs/features/mapping-and-analysis/text-analysis/analyzers/stconvert-analyzer/ 简繁转换分析器(STConvert) | INFINI Easysearch (main) | 分布式搜索型数据库 STConvert 分析器 # stconvert 分析器可在索引与查询阶段将简体中文与繁体中文之间进行双向转换,解决两种文字体系混合检索的问题。 相关指南(先读这些) # 文本分析基础 文本分析:规范化 参数说明 # 参数 说明 默认值 convert_type 转换方向,可选:s2t(简 → 繁),t2s(繁 →... infini easysearchmain https://docs.infinilabs.com/easysearch/main/docs/deployment/install-guide/tencent-cloud/ 腾讯云部署 | INFINI Easysearch (main) | 分布式搜索型数据库 腾讯云部署指南 # 本文介绍在腾讯云 CVM 上部署 Easysearch 集群的推荐配置与实践。 推荐实例规格 # 节点角色 实例族 规格示例 说明 Master(专用) 标准型 S6 S6.LARGE16 (4C16G) 轻量计算 Data 高 IO 型 IT5 IT5.4XLARGE64 (16C64G) 本地... infini easysearchmain https://docs.infinilabs.com/easysearch/main/docs/features/query-dsl/term-based-query/range/ Range 查询 | INFINI Easysearch (main) | 分布式搜索型数据库 infini easysearchrangemain https://docs.infinilabs.com/easysearch/main/docs/features/mapping-and-analysis/text-analysis/analyzers/latvian-analyzer/ 拉脱维亚语分析器(Latvian) | INFINI Easysearch (main) | 分布式搜索型数据库 Latvian 分析器 # latvian 分析器是为拉脱维亚语文本特别设计的语言分析器。 分析器组成 # 该分析器由以下分词器和分词过滤器组成: standard 分词器:标准的文本分割 lowercase 分词过滤器:转换为小写 stop 分词过滤器:过滤拉脱维亚语停用词 latvian_stem... infini easysearchmain https://docs.infinilabs.com/easysearch/main/docs/features/mapping-and-analysis/text-analysis/token-filters/indic-normalization/ 印度语系归一化过滤器(Indic Normalization) | INFINI Easysearch (main) | 分布式搜索型数据库 印度语系归一化过滤器 # indic_normalization 词元过滤器对印度语系(Indic)文本进行 Unicode 归一化,统一各印度语系脚本中字符的多种表示形式。它是孟加拉语、印地语等语言归一化的基础层。 归一化规则 # 处理 说明 Unicode 分解与合成 将组合字符序列转为标准的预组合形式(NFC... infini easysearchmain https://docs.infinilabs.com/easysearch/main/docs/features/fulltext-search/partial-matching/ 部分匹配 | INFINI Easysearch (main) | 分布式搜索型数据库 前缀查询、通配符、正则表达式、match_phrase_prefix 等部分匹配查询。 infini easysearchmain https://docs.infinilabs.com/easysearch/main/docs/features/mapping-and-analysis/metadata-field/meta/ 元信息字段(_meta) | INFINI Easysearch (main) | 分布式搜索型数据库 _meta 元数据字段 # _meta 字段是一个映射属性,允许您为索引映射附加自定义元数据。您的应用程序可以使用这些元数据来存储与您的用例相关的信息,如版本控制、所有权、分类或审计。 相关指南(先读这些) # 映射基础 元数据字段 用法 # 您可以在创建新索引或更新现有索引的映射时定义 _meta... infini easysearchmain https://docs.infinilabs.com/easysearch/main/docs/management/service-management/join-cluster/ 加入已有集群 | INFINI Easysearch (main) | 分布式搜索型数据库 infini easysearchmain https://docs.infinilabs.com/easysearch/main/docs/features/ingest-pipelines/conditional-execution/complex-conditionals/ 复杂逻辑 | INFINI Easysearch (main) | 分布式搜索型数据库 infini easysearchmain https://docs.infinilabs.com/easysearch/main/docs/features/mapping-and-analysis/text-analysis/token-filters/word-delimiter/ 单词分隔分词过滤器(Word Delimiter) | INFINI Easysearch (main) | 分布式搜索型数据库 Word Delimiter 分词过滤器 # word_delimiter 分词过滤器用于根据预定义的字符拆分词元,还能根据可定制规则对词元进行可选的规范化处理。 注意:我们建议尽可能使用 word_delimiter_graph 过滤器而非 word_delimiter 过滤器,因为 word_delimiter... infini easysearchmain https://docs.infinilabs.com/easysearch/main/docs/operations/configuration/ 集群配置 | INFINI Easysearch (main) | 分布式搜索型数据库 节点与集群核心配置项——生产环境必须关注的设置。 infini easysearchmain https://docs.infinilabs.com/easysearch/main/docs/operations/security/access-control/users-roles/ 用户与角色 | INFINI Easysearch (main) | 分布式搜索型数据库 infini easysearchmain https://docs.infinilabs.com/easysearch/main/docs/features/aggregations/bucket-aggregations/ip-range/ IP 范围聚合(IP Range) | INFINI Easysearch (main) | 分布式搜索型数据库 IP 范围聚合 # ip_range 聚合用于 IP 地址。它适用于 ip 类型字段。您可以在 CIDR 表示法中定义 IP 范围和掩码。 相关指南(先读这些) # 聚合基础 聚合场景实践 GET sample_data_logs/_search { infini easysearchipmain https://docs.infinilabs.com/easysearch/main/docs/deployment/install-guide/aws/ AWS 部署 | INFINI Easysearch (main) | 分布式搜索型数据库 AWS 部署指南 # 本文介绍在 AWS EC2 上部署 Easysearch 集群的推荐配置与实践。 推荐实例类型 # 节点角色 实例族 规格示例 说明 Master(专用) m6i / m7i m6i.xlarge (4C16G) 轻量计算 Data i3 / i3en i3.2xlarge (8C61G) 本地... infini easysearchawsmain https://docs.infinilabs.com/easysearch/main/docs/features/ingest-pipelines/index-processors/grok/ Grok 处理器 | INFINI Easysearch (main) | 分布式搜索型数据库 Grok 处理器 # grok 处理器用于通过模式匹配解析和结构化非结构化数据。您可以使用 grok 处理器从日志消息、Web 服务器访问日志、应用程序日志和其他遵循一致格式的日志数据中提取字段。 Grok 基础 # grok... infini easysearchgrokmain https://docs.infinilabs.com/easysearch/main/docs/features/aggregations/bucket-aggregations/sampler/ 采样聚合(Sampler) | INFINI Easysearch (main) | 分布式搜索型数据库 采样聚合 # 如果你正在聚合大量文档,可以使用 sampler 聚合将范围缩小到一小部分文档,从而获得更快的响应。sampler 聚合通过选择得分最高的文档来选取样本。 结果是大致的,但能很好地反映真实数据的分布。sampler 聚合显著提高了查询性能,但估计的响应并不完全可靠。 相关指南(先读这些) # 聚合基础... infini easysearchmain https://docs.infinilabs.com/easysearch/main/docs/release-notes/ 版本历史 | INFINI Easysearch (main) | 分布式搜索型数据库 infini easysearchmain https://docs.infinilabs.com/easysearch/main/docs/management/backup/restore-backup/ 还原备份 | INFINI Easysearch (main) | 分布式搜索型数据库 在 Easysearch UI 中还原索引备份。 infini easysearchmain https://docs.infinilabs.com/easysearch/main/docs/integrations/plugins/getting-started/ 插件开发入门 | INFINI Easysearch (main) | 分布式搜索型数据库 基于官方模板快速完成第一个插件的完整闭环。 infini easysearchmain https://docs.infinilabs.com/easysearch/main/docs/features/ingest-pipelines/index-processors/text-embedding/ 文本向量化处理器 | INFINI Easysearch (main) | 分布式搜索型数据库 文本向量化处理器 # 需要 AI 插件和 KNN 插件 text_embedding 处理器在文档写入时自动调用外部 Embedding 模型服务,将文本字段转换为向量并存储到指定的向量字段中,实现 infini easysearchmain https://docs.infinilabs.com/easysearch/main/docs/features/fulltext-search/fulltext-search/ 全文检索 | INFINI Easysearch (main) | 分布式搜索型数据库 match/match_phrase/multi_match 等全文检索查询的用法与注意事项。 infini easysearchmain https://docs.infinilabs.com/easysearch/main/docs/deployment/install-guide/ciip/kunpeng/ 鲲鹏平台安装 | INFINI Easysearch (main) | 分布式搜索型数据库 鲲鹏平台安装 # 鲲鹏平台介绍 # 鲲鹏平台基于 ARM 架构,由华为自主研发,提供高性能、低功耗的服务器处理器,广泛应用于信创、云计算、大数据和分布式存储等场景,全面适配国产操作系统与生态。 鲲鹏平台安装参考 # 目前,Easysearch... infini easysearchmain https://docs.infinilabs.com/easysearch/main/docs/deployment/config/node-settings/gateway/ 网关与恢复 | INFINI Easysearch (main) | 分布式搜索型数据库 网关与恢复配置 # 本页介绍 easysearch.yml 中与集群完全重启后分片恢复行为相关的配置项。这些都是静态设置,修改后需要重启节点生效。 分片恢复的限流参数(如 indices.recovery.max_bytes_per_sec)属于动态配置,通过 集群配置 API 修改。 为什么需要网关恢复设置? #... infini easysearchmain https://docs.infinilabs.com/easysearch/main/docs/features/mapping-and-analysis/text-analysis/token-filters/unique/ 唯一分词过滤器(Unique) | INFINI Easysearch (main) | 分布式搜索型数据库 Unique 分词过滤器 # unique 分词过滤器可确保在分词过程中仅保留唯一的词元,它会去除在单个字段或文本块中出现的重复词元。 相关指南(先读这些) # 文本分析:规范化 文本分析:识别词元 参数说明 # 唯一分词过滤器可以使用以下参数进行配置: 参数 必需/可选 数据类型 描述... infini easysearchmain https://docs.infinilabs.com/easysearch/main/docs/features/mapping-and-analysis/text-analysis/token-filters/dutch-stem/ 荷兰语词干过滤器(Dutch Stemmer) | INFINI Easysearch (main) | 分布式搜索型数据库 荷兰语词干过滤器 # dutch_stemmer 词元过滤器使用 Snowball 算法对荷兰语文本进行词干提取。 功能说明 # 荷兰语词干提取使用 Snowball 算法,结合词干覆盖字典处理不规则变形: 移除常见名词/动词后缀 荷兰语分析器额外使用 stemmer_override 字典处理不规则形式... infini easysearchmain https://docs.infinilabs.com/easysearch/main/docs/features/mapping-and-analysis/text-analysis/token-filters/decimal-digit/ 十进制数字分词过滤器(Decimal Digit) | INFINI Easysearch (main) | 分布式搜索型数据库 Decimal Digit 分词过滤器 # decimal_digit 分词过滤器用于将各种字符集中的十进制数字字符(0 到 9)规范化为它们对应的 ASCII 字符。当你希望在文本分析中确保所有数字都能被统一处理,而不管这些数字是以何种字符集书写时,这个过滤器就非常有用。 相关指南(先读这些) # 文本分析:规范化... infini easysearchmain https://docs.infinilabs.com/easysearch/main/docs/integrations/ingest/filebeat-fluentbit/ 轻量 Agent 接入:Filebeat / Fluent Bit | INFINI Easysearch (main) | 分布式搜索型数据库 使用轻量日志 Agent 将日志采集到 Easysearch 或其前置缓冲层的推荐实践。 fluent bitinfini easysearchagentmain https://docs.infinilabs.com/easysearch/main/docs/features/query-dsl/structured-search/ 结构化搜索 | INFINI Easysearch (main) | 分布式搜索型数据库 term/terms/range/exists 等结构化查询与过滤的最佳实践。 infini easysearchmain https://docs.infinilabs.com/easysearch/main/docs/api-reference/ API 手册 | INFINI Easysearch (main) | 分布式搜索型数据库 以 Easysearch API 为单位的说明,权限、参数、示例。 infini easysearchapimain https://docs.infinilabs.com/easysearch/main/docs/features/vector-search/vector-and-semantic-search/ 向量搜索与语义搜索 | INFINI Easysearch (main) | 分布式搜索型数据库 向量搜索、语义搜索、Hybrid 检索的定位区分与选择建议。 infini easysearchmain https://docs.infinilabs.com/easysearch/main/docs/features/mapping-and-analysis/text-analysis-stopwords/ 停用词 | INFINI Easysearch (main) | 分布式搜索型数据库 停用词的价值与代价:性能、精度、短语查询以及更现代的替代策略。 infini easysearchmain https://docs.infinilabs.com/easysearch/main/docs/features/mapping-and-analysis/mapping-parameters/store/ 存储参数(Store) | INFINI Easysearch (main) | 分布式搜索型数据库 Store 参数 # store 参数指定字段值是否应被独立存储,以便可以脱离 _source 单独检索。 默认情况下,字段值在 _source 中存储,但不会被独立存储。当你需要检索某个字段的值时,Easysearch 会加载整个 _source... infini easysearchmain https://docs.infinilabs.com/easysearch/main/docs/deployment/config/node-settings/path/ 路径配置 | INFINI Easysearch (main) | 分布式搜索型数据库 路径配置 # 本页介绍 easysearch.yml 中与文件存储路径相关的配置项。这些都是静态设置,修改后需要重启节点生效。 path.data # path.data: /data/easysearch/data 项目 说明 参数 path.data 默认值 $ES_HOME/data 属性 静态 说明... infini easysearchmain https://docs.infinilabs.com/easysearch/main/docs/features/ingest-pipelines/index-processors/uppercase/ 大写处理器 | INFINI Easysearch (main) | 分布式搜索型数据库 大写处理器 # uppercase 处理器将特定字段中的所有文本转换为大写字母。 语法 # 以下是为 uppercase 处理器提供的语法: { infini easysearchmain https://docs.infinilabs.com/easysearch/main/docs/features/fulltext-search/full-text/multi-match/ Multi Match 查询 | INFINI Easysearch (main) | 分布式搜索型数据库 Multi Match 查询 # multi_match 查询与 match 查询类似。您可以使用 multi_match 查询来搜索多个字段。 相关指南(先读这些) # 多字段搜索 全文搜索 字段权重 # ^ 会 infini easysearchmultimatchmain https://docs.infinilabs.com/easysearch/main/docs/features/mapping-and-analysis/mapping-parameters/enable_position_increments/ 位置增量启用(Enable Position Increments) | INFINI Easysearch (main) | 分布式搜索型数据库 位置增量启用(Enable Position Increments) # 确定是否在令牌计数中包含位置增量。 基本用法 # PUT my-index { infini easysearchpositionmain https://docs.infinilabs.com/easysearch/main/docs/deployment/config/ 参数配置 | INFINI Easysearch (main) | 分布式搜索型数据库 系统调优、JVM、Easysearch 配置等。 infini easysearchmain https://docs.infinilabs.com/easysearch/main/docs/features/data-retention/ilm/ 索引生命周期 | INFINI Easysearch (main) | 分布式搜索型数据库 索引生命周期管理 # 索引生命周期管理(Index Lifecycle Management, ILM)为您提供了一种集成化、自动化的方式来高效管理时序数据。 通过配置 ILM 策略,您可以根据性能、可用性与数据保留需求,自动执行索引的滚动、归档和清理等操作。 从 1.15.2... infini easysearchmain https://docs.infinilabs.com/easysearch/main/docs/operations/monitoring/ 集群监控 | INFINI Easysearch (main) | 分布式搜索型数据库 关键指标、健康检查、监控工具(Easysearch-UI、INFINI Console)。 infini easysearchmain https://docs.infinilabs.com/easysearch/main/docs/management/lifecycle/delete-policy/ 删除策略 | INFINI Easysearch (main) | 分布式搜索型数据库 在 Easysearch UI 中删除生命周期策略。 infini easysearchmain https://docs.infinilabs.com/easysearch/main/docs/features/mapping-and-analysis/text-analysis/analyzers/polish-analyzer/ 波兰语分析器(Polish) | INFINI Easysearch (main) | 分布式搜索型数据库 Polish 分析器 # polish 分析器是为波兰语文本特别设计的语言分析器。 分析器组成 # 该分析器由以下分词器和分词过滤器组成: standard 分词器:标准的文本分割 lowercase 分词过滤器:转换为小写 stop 分词过滤器:过滤波兰语停用词 polish_stem 分词过滤器:波兰语词干提取... infini easysearchmain https://docs.infinilabs.com/easysearch/main/docs/management/hot-threads/ 热点线程 | INFINI Easysearch (main) | 分布式搜索型数据库 通过 Easysearch UI 查看节点热点线程。 infini easysearchmain https://docs.infinilabs.com/easysearch/main/docs/management/data-explorer/auto-refresh/ 自动刷新数据 | INFINI Easysearch (main) | 分布式搜索型数据库 在 Easysearch UI 数据探索中配置数据自动刷新。 infini easysearchmain https://docs.infinilabs.com/easysearch/main/docs/features/query-dsl/span/span-within/ Span Within 查询 | INFINI Easysearch (main) | 分布式搜索型数据库 Span Within 查询 # span_within 查询匹配被另一个 span 查询所包围的跨度。它是 span_containing 的相反操作:span_containing 返回包含较小跨度的较大跨度,而 span_within 返回被较大跨度包围的较小跨度。 例如,您可以使用 span_within... infini easysearchspanwithinmain https://docs.infinilabs.com/easysearch/main/docs/management/service-management/login/ 服务管理登录 | INFINI Easysearch (main) | 分布式搜索型数据库 登录 Easysearch 服务管理平台。 infini easysearchmain https://docs.infinilabs.com/easysearch/main/docs/deployment/advanced-config/numa/ NUMA 配置 | INFINI Easysearch (main) | 分布式搜索型数据库 NUMA 配置指南 # 在多路服务器(2 路及以上 CPU)上部署 Easysearch 时,NUMA(Non-Uniform Memory Access)拓扑会显著影响性能。不当的配置可能导致跨节点内存访问,增加延迟 30%–50%。 NUMA 基础概念 # ┌──────────────┐... infini easysearchnumamain