Robuta

https://docs.infinilabs.com/easysearch/main/docs/management/data-explorer/ 数据探索 | INFINI Easysearch (main) | 分布式搜索型数据库 通过 Easysearch UI 探索和检索索引数据。 infini easysearch main https://docs.infinilabs.com/easysearch/main/docs/features/query-dsl/compound-query/function-score/ Function Score 查询 | INFINI Easysearch (main) | 分布式搜索型数据库 Function Score 查询 # 如果您需要更改结果中返回的文档的相关性评分,请使用 function_score 查询。function_score 查询定义了一个查询和一个或多个函数,这些函数可以应用于所有结果或结果的一部分,以重新计算它们的相关性评分。 相关指南(先读这些) # 查询 DSL 基础... infini easysearch mainfunctionscore https://docs.infinilabs.com/easysearch/main/docs/features/mapping-and-analysis/text-analysis/analyzers/whitespace-analyzer/ 空白分析器(Whitespace) | INFINI Easysearch (main) | 分布式搜索型数据库 Whitespace 分析器 # whitespace 分析器仅基于空白字符(例如,空格和制表符)将文本拆分为词元。比如转换为小写形式或移除停用词这样的转换操作,它都不会应用,因此文本的原始大小写形式会被保留,并且标点符号也会作为词元的一部分包含在内。 相关指南(先读这些) # 文本分析基础 文本分析:识别词元... infini easysearch main https://docs.infinilabs.com/easysearch/main/docs/best-practices/data-modeling/denormalization/ 反范式与权衡 | INFINI Easysearch (main) | 分布式搜索型数据库 为什么在搜索系统中常用反范式:一致性、更新成本与查询性能的取舍。 infini easysearch main https://docs.infinilabs.com/easysearch/main/docs/integrations/ai/ingest-text-embedding/ 写入数据文本向量化 | INFINI Easysearch (main) | 分布式搜索型数据库 写入数据文本向量化 # Easysearch 使用 Ingest 管道中的一系列处理器,可以对写入的数据进行处理,并且支持对文本进行向量化。本文档介绍如何在 Easysearch 中使用 text_embedding 处理器对写入数据进行向量化。 相关指南(先读这些) # 向量搜索 向量字段建模 AI 集成 先决条件... infini easysearch main https://docs.infinilabs.com/easysearch/main/docs/features/query-dsl/highlight/ 高亮 | INFINI Easysearch (main) | 分布式搜索型数据库 高亮命中词的 API 参数、高亮器类型选择、自定义标签、片段控制。 infini easysearch main https://docs.infinilabs.com/easysearch/main/docs/deployment/advanced-config/advanced-settings/ 高级配置参数 | INFINI Easysearch (main) | 分布式搜索型数据库 高级配置参数 # 本页面详细列举 Easysearch 的所有高级配置参数,包括集群、节点、索引等多层级配置。 概述 # Easysearch 配置涉及多个层级: 节点级:影响单个节点的行为(node., path., 等) 集群级:影响整个集群的行为(cluster., discovery., 等)... infini easysearch main https://docs.infinilabs.com/easysearch/main/docs/fundamentals/distributed-search/ 分布式搜索执行过程 | INFINI Easysearch (main) | 分布式搜索型数据库 理解 search 请求在集群内如何执行:query/fetch 两阶段、深分页成本与常用搜索选项。 infini easysearch main https://docs.infinilabs.com/easysearch/main/docs/features/mapping-and-analysis/mapping-parameters/meta/ 元数据参数(Meta) | INFINI Easysearch (main) | 分布式搜索型数据库 infini easysearch main https://docs.infinilabs.com/easysearch/main/docs/features/aggregations/metric-aggregations/percentile-ranks/ 百分位排名聚合(Percentile Ranks) | INFINI Easysearch (main) | 分布式搜索型数据库 百分位排名聚合 # percentile_ranks 聚合估计低于或等于给定阈值的观测值百分比。这对于了解特定值在值分布中的相对位置很有用。 例如,您可以使用百分位排名聚合来学习交易金额 45 与数据集中其他交易值相比如何。百分位排名聚合返回一个值,如 82.3,这意味着 82.3% 的交易额低于或等于 45。... infini easysearch main https://docs.infinilabs.com/easysearch/main/docs/features/query-dsl/term-based-query/terms/ Terms 查询 | INFINI Easysearch (main) | 分布式搜索型数据库 infini easysearch mainterms https://docs.infinilabs.com/easysearch/main/docs/features/mapping-and-analysis/text-analysis/token-filters/n-gram/ N-gram 分词过滤器(N-gram) | INFINI Easysearch (main) | 分布式搜索型数据库 N-gram 分词过滤器 # ngram 分词过滤器是一种强大的工具,用于将文本拆分为更小的组件,即 n-gram,这有助于提升部分匹配和模糊搜索能力。它通过将一个词元拆分成指定长度的子字符串来工作。这些过滤器在搜索应用程序中很常用,可用于支持自动补全、部分匹配以及容错拼写搜索。 相关指南(先读这些) # 部分匹配... infini easysearch maingram https://docs.infinilabs.com/easysearch/main/docs/features/query-dsl/term-based-query/fast-terms/ Fast Terms 查询 | INFINI Easysearch (main) | 分布式搜索型数据库 Fast Terms 查询 # Fast Terms 是 Easysearch 提供的高性能 terms 查询插件,专为大规模 terms 过滤场景优化。当需要在查询中使用大量 term 值进行过滤时(如数万甚至数十万个 ID),Fast Terms 可以提供比标准 terms 查询更好的性能。 适用场景 # 大规模... infini easysearch mainfastterms https://docs.infinilabs.com/easysearch/main/docs/features/query-dsl/sort/ 排序 | INFINI Easysearch (main) | 分布式搜索型数据库 字段排序、多级排序、地理距离排序、脚本排序、missing 值处理的 API 与参数说明。 infini easysearch main https://docs.infinilabs.com/easysearch/main/docs/deployment/install-guide/ciip/bclinux/ 移动云 BC-Linux 平台安装 | INFINI Easysearch (main) | 分布式搜索型数据库 移动云 BC-Linux 平台安装 # 移动云 BC-Linux 平台介绍 # 移动云 BC-Linux 是中国移动自主研发的企业级操作系统,基于 Linux 内核,专为云计算和大数据应用设计,具备高性能、高可靠性和强安全性,广泛应用于中国移动的云计算平台和数据中心。 移动云 BC-Linux 平台安装参考 #... infini easysearch mainbclinux https://docs.infinilabs.com/easysearch/main/docs/deployment/install-guide/test-env/ 测试环境部署 | INFINI Easysearch (main) | 分布式搜索型数据库 测试环境部署指南 # 用最少资源快速搭建一个可运行的 Easysearch 实例,适合功能验证、开发联调和学习使用。 最低硬件要求 # 项目 最低配置 建议配置 CPU 2 核 4 核 内存 4 GB 8 GB 磁盘 20 GB 50 GB SSD JDK 11+ 17+ 测试环境可使用 HDD,但 SSD... infini easysearch main https://docs.infinilabs.com/easysearch/main/docs/features/mapping-and-analysis/text-analysis/analyzers/keyword-analyzer/ 关键字分析器(Keyword) | INFINI Easysearch (main) | 分布式搜索型数据库 Keyword 分析器 # keyword 分析器根本不会对文本进行分词。相反,它将整个输入视为单个词元,不会将其拆分成单个的词项。keyword 分析器常用于包含电子邮件地址、网址或产品 ID 的字段,以及其他不需要进行分词的情况。 相关指南(先读这些) # 文本分析基础 文本分析:识别词元 参考样例 #... infini easysearch main https://docs.infinilabs.com/easysearch/main/docs/features/mapping-and-analysis/field-types/flat-object/ 扁平对象字段类型(Flat Object) | INFINI Easysearch (main) | 分布式搜索型数据库 扁平对象字段类型(Flat Object) # flat_object(也称为 flattened 类型)将整个 JSON 对象作为单个扁平化字段存储。它会将 JSON 对象中所有叶子节点的值提取为关键字(keyword),并支持对这些值进行基本查询。 适用场景 # flat_object 特别适合以下场景:... infini easysearch main https://docs.infinilabs.com/easysearch/main/docs/overview/ 产品概述 | INFINI Easysearch (main) | 分布式搜索型数据库 infini easysearch main https://docs.infinilabs.com/easysearch/main/docs/features/sql/functions/ 内置函数 | INFINI Easysearch (main) | 分布式搜索型数据库 内置函数 # Easysearch SQL 提供 80 多个内置函数,涵盖数学运算、字符串处理、日期时间、条件判断和类型转换等类别。 数学函数 # 函数 说明 示例 ABS(expr) 绝对值 ABS(-5) → 5 CEIL(expr) / CEILING(expr) 向上取整 CEIL(2.3) → 3... infini easysearch main https://docs.infinilabs.com/easysearch/main/docs/management/indices/ 索引 | INFINI Easysearch (main) | 分布式搜索型数据库 通过 Easysearch UI 管理索引的常见操作。 infini easysearch main https://docs.infinilabs.com/easysearch/main/docs/best-practices/data-lifecycle/ 数据生命周期与保留策略 | INFINI Easysearch (main) | 分布式搜索型数据库 从业务合规与成本出发,设计 Easysearch 中的冷热分层、保留窗口、归档与删除策略。 infini easysearch main https://docs.infinilabs.com/easysearch/main/docs/management/templates/delete-index-template/ 删除索引模板 | INFINI Easysearch (main) | 分布式搜索型数据库 在 Easysearch UI 中删除索引模板。 infini easysearch main https://docs.infinilabs.com/easysearch/main/docs/management/data-explorer/edit-filter/ 编辑过滤条件 | INFINI Easysearch (main) | 分布式搜索型数据库 在 Easysearch UI 数据探索中编辑已有的过滤条件。 infini easysearch main https://docs.infinilabs.com/easysearch/main/docs/features/mapping-and-analysis/text-analysis-synonyms/ 同义词 | INFINI Easysearch (main) | 分布式搜索型数据库 用同义词扩大召回:规则格式、索引时/查询时取舍、分析链顺序与多词同义词陷阱。 infini easysearch main https://docs.infinilabs.com/easysearch/main/docs/operations/monitoring/ 集群监控 | INFINI Easysearch (main) | 分布式搜索型数据库 关键指标、健康检查、监控工具(Easysearch-UI、INFINI Console)。 infini easysearch main https://docs.infinilabs.com/easysearch/main/docs/features/mapping-and-analysis/metadata-field/size/ 文档大小元数据字段(_size) | INFINI Easysearch (main) | 分布式搜索型数据库 文档大小元数据字段(_size) # _size 元数据字段记录每个文档的 _source 字段的原始未压缩大小(字节数)。启用后,可以按文档大小进行过滤、排序和聚合。 前置条件 # _size 字段由 mapper-size 插件提供,需要确认插件已安装: bin/easysearch-plugin list #... infini easysearch main https://docs.infinilabs.com/easysearch/main/docs/features/query-dsl/term-based-query/terms-set/ Terms Set 查询 | INFINI Easysearch (main) | 分布式搜索型数据库 Terms Set 查询 # 使用 terms_set 查询,您可以在指定字段中搜索匹配一定数量的精确词的文档。与 terms 查询类似,您可以指定返回文档所需的匹配词的最小数量。您可以直接在索引字段中指定这个数量,也可以通过脚本指定。 相关指南(先读这些) # 结构化搜索 查询 DSL 基础... infini easysearch maintermsset https://docs.infinilabs.com/easysearch/main/docs/features/document-operations/bulk-api/ Bulk API | INFINI Easysearch (main) | 分布式搜索型数据库 在单个请求中执行多个 index、create、update、delete 操作。 infini easysearch mainbulkapi https://docs.infinilabs.com/easysearch/main/docs/features/mapping-and-analysis/field-types/date-field-type/date/ 日期字段类型(Date) | INFINI Easysearch (main) | 分布式搜索型数据库 Date 字段类型 # 在 Easysearch 中,日期可以表示为以下几种形式: 一个长整型值,对应自纪元以来的毫秒数(必须为非负数)。日期在内部以此形式存储。 一个格式化的字符串。 一个整数值,对应自纪元以来的秒数(必须为非负数)。 要表示日期范围,可以使用 date range 字段类型。 代码样例 #... infini easysearch main https://docs.infinilabs.com/easysearch/main/docs/features/query-dsl/specialized/script/ Script 查询 | INFINI Easysearch (main) | 分布式搜索型数据库 Script 查询 # 使用 script 查询基于 Painless 脚本语言编写的自定义条件来过滤文档。此查询返回脚本评估结果为 true 的文档,从而实现无法使用标准查询表达的高级过滤逻辑。 相关指南(先读这些) # Query DSL 基础 结构化搜索 专业查询(Specialized queries)... infini easysearch mainscript https://docs.infinilabs.com/easysearch/main/docs/features/mapping-and-analysis/text-analysis/ 文本分析 | INFINI Easysearch (main) | 分布式搜索型数据库 文本分析组件、语言分析器选择与配置、分析器、分词器、过滤器参考。 infini easysearch main https://docs.infinilabs.com/easysearch/main/docs/deployment/install-guide/ciip/hygon/ 海光平台安装 | INFINI Easysearch (main) | 分布式搜索型数据库 海光平台安装 # 海光平台介绍 # 海光平台基于自主可控的 x86 架构(获 AMD 授权),提供高性能 CPU 和 DCU 产品,广泛应用于服务器、云计算及信创领域,兼容主流生态,支持国产操作系统与关键行业应用。 海光平台安装参考 # 目前,Easysearch... infini easysearch main https://docs.infinilabs.com/easysearch/main/docs/fundamentals/aggregations-data-analysis/ 聚合与数据分析 | INFINI Easysearch (main) | 分布式搜索型数据库 聚合的基本概念、桶聚合、指标聚合、管道聚合与数据分析。 infini easysearch main https://docs.infinilabs.com/easysearch/main/docs/features/mapping-and-analysis/text-analysis/tokenizers/simple-pattern/ 简单模式分词器(Simple Pattern) | INFINI Easysearch (main) | 分布式搜索型数据库 Simple Pattern 分词器 # simple_pattern 分词器使用正则表达式匹配文本,将匹配到的内容作为词元输出。它与 simple_pattern_split 的区别在于:simple_pattern 输出匹配的部分,而 simple_pattern_split 输出被分隔的部分。 该分词器使用... infini easysearch main https://docs.infinilabs.com/easysearch/main/docs/features/aggregations/metric-aggregations/cardinality/ 基数聚合(Cardinality) | INFINI Easysearch (main) | 分布式搜索型数据库 基数聚合 # cardinality 聚合是一种单值指标聚合,用于计算字段的唯一值或不同值的数量。 基数计数为近似值。有关更多信息,请参阅下面的控制精度。 相关指南(先读这些) # 聚合基础 聚合场景实践 参数说明 # cardinality 聚合采用以下参数。 参数 必需/可选 数据类型 描述 field 必需的... infini easysearch main https://docs.infinilabs.com/easysearch/main/docs/features/mapping-and-analysis/text-analysis/analyzers/icu-analyzer/ ICU 分析器(ICU) | INFINI Easysearch (main) | 分布式搜索型数据库 ICU 分析器 # icu 分析器是为多语言文本分析的分析器,基于 ICU(International Components for Unicode)实现,对亚洲语言混合文本提供比标准分析器更好的分词效果。 需要安装 analysis-icu 插件。 分析器组成 # 该分析器由以下分词器和分词过滤器组成:... infini easysearch mainicu https://docs.infinilabs.com/easysearch/main/docs/features/mapping-and-analysis/text-analysis/token-filters/truncate/ 截断分词过滤器(Truncate) | INFINI Easysearch (main) | 分布式搜索型数据库 Truncate 分词过滤器 # truncate 分词过滤器用于缩短超过指定长度的词元。它会将词元修剪至最大字符数,确保超过该限制的词元被截断。 相关指南(先读这些) # 文本分析:规范化 文本分析:识别词元 参数说明 # 截断分词过滤器可以使用以下参数进行配置: 参数 必需/可选 数据类型 描述 length... infini easysearch main https://docs.infinilabs.com/easysearch/main/docs/best-practices/data-modeling/parent-child/ Parent-Child 建模 | INFINI Easysearch (main) | 分布式搜索型数据库 infini easysearch mainparent child https://docs.infinilabs.com/easysearch/main/docs/features/mapping-and-analysis/text-analysis/analyzers/japanese-analyzer/ 日语分析器(Japanese) | INFINI Easysearch (main) | 分布式搜索型数据库 Japanese 分析器 # japanese 分析器是为日语文本设计的基础语言分析器,使用 CJK 二元组分词方式。 分析器组成 # 该分析器由以下分词器和分词过滤器组成: cjk 分词器:将 CJK(中日韩)字符分解为二元组(bigrams) lowercase 分词过滤器:转换为小写 cjk_width... infini easysearch main https://docs.infinilabs.com/easysearch/main/docs/management/aliases/ 别名 | INFINI Easysearch (main) | 分布式搜索型数据库 通过 Easysearch UI 管理索引别名。 infini easysearch main https://docs.infinilabs.com/easysearch/main/docs/features/fulltext-search/relevance/boosting/ 加权与调参 | INFINI Easysearch (main) | 分布式搜索型数据库 Boost、function_score 等常用手段与策略。 infini easysearch main https://docs.infinilabs.com/easysearch/main/docs/features/mapping-and-analysis/text-analysis/analyzers/hanlp-index-analyzer/ HanLP 索引分析器(HanLP Index) | INFINI Easysearch (main) | 分布式搜索型数据库 HanLP Index 分析器 # hanlp_index 分析器是为中文索引分词的分析器,使用 HanLP 索引分词模式,会对文本进行更细粒度的切分。 需要安装 analysis-hanlp 插件。 分析器组成 # 该分析器由以下分词器和分词过滤器组成: hanlp_index 分词器:使用 HanLP... infini easysearch mainhanlp https://docs.infinilabs.com/easysearch/main/docs/deployment/advanced-config/raid/ RAID 配置 | INFINI Easysearch (main) | 分布式搜索型数据库 RAID 配置指南 # 本文讨论 Easysearch 环境中 RAID 的选型与配置建议。 RAID 与 Easysearch 的关系 # Easysearch 自身通过副本机制实现数据冗余。因此 RAID 在 Easysearch 场景中的定位与传统数据库不同: 方案 数据冗余 性能 适用场景 无 RAID +... infini easysearch mainraid https://docs.infinilabs.com/easysearch/main/docs/operations/cluster-admin/cluster/ 集群管理 | INFINI Easysearch (main) | 分布式搜索型数据库 集群状态、节点管理、分片分配、设置管理。 infini easysearch main https://docs.infinilabs.com/easysearch/main/docs/features/ingest-pipelines/create-ingest/ 创建管道 | INFINI Easysearch (main) | 分布式搜索型数据库 infini easysearch main https://docs.infinilabs.com/easysearch/main/docs/features/mapping-and-analysis/mapping-parameters/normalizer/ 规范化器参数(Normalizer) | INFINI Easysearch (main) | 分布式搜索型数据库 Normalizer 参数 # normalizer 参数用于 keyword 字段,在索引和查询之前对值进行标准化处理(如转换为小写)。与 analyzer 不同,normalizer 不会对字符串进行分词,只做字符级别的变换。 完整指南 → 归一化与规范化器,包含概念介绍、自定义配置、兼容过滤器列表和最佳实践。... infini easysearch main https://docs.infinilabs.com/easysearch/main/docs/integrations/observability/opentelemetry/ OpenTelemetry 集成 | INFINI Easysearch (main) | 分布式搜索型数据库 将 OTel 指标、日志与 Trace 落地到 Easysearch,构建统一可观测性存储。 infini easysearch mainopentelemetry https://docs.infinilabs.com/easysearch/main/docs/features/aggregations/pipeline-aggregations/ 管道聚合 | INFINI Easysearch (main) | 分布式搜索型数据库 infini easysearch main https://docs.infinilabs.com/easysearch/main/docs/integrations/third-party/langchain/ LangChain 集成 | INFINI Easysearch (main) | 分布式搜索型数据库 LangChain 与 Easysearch 的 RAG 集成。 infini easysearch mainlangchain https://docs.infinilabs.com/easysearch/main/docs/deployment/config/configuration_file/ 配置说明 | INFINI Easysearch (main) | 分布式搜索型数据库 配置文件 # 可以在每个 Easysearch 节点上找到 easysearch.yml ,通常位于 Easysearch 安装目录下 config/easysearch.yml。 配置文件一览 # Easysearch 主要有以下几类配置文件:... infini easysearch main https://docs.infinilabs.com/easysearch/main/docs/deployment/install-guide/operator/deploy_operator/ 部署 Operator | INFINI Easysearch (main) | 分布式搜索型数据库 部署 Easysearch Operator # Easysearch Operator 只能在 k8s 环境下部署安装,请准备好一套 k8s 环境 部署前准备 # k8s 环境 要求Kubernetes 1.9以上版本,自 1.9... infini easysearch mainoperator https://docs.infinilabs.com/easysearch/main/docs/management/backup/delete-policy/ 删除策略 | INFINI Easysearch (main) | 分布式搜索型数据库 在 Easysearch UI 中删除备份策略。 infini easysearch main https://docs.infinilabs.com/easysearch/main/docs/features/sql/aggregations/ 聚合查询 | INFINI Easysearch (main) | 分布式搜索型数据库 聚合查询 # 聚合函数对一组文档进行计算并返回单个值。通常与 GROUP BY 子句组合使用,对数据进行分组后计算汇总统计量。 聚合函数 # 基本聚合函数 # 函数 说明 示例 COUNT(*) 计算所有行数 SELECT COUNT(*) FROM accounts COUNT(field) 计算非 NULL... infini easysearch main https://docs.infinilabs.com/easysearch/main/docs/features/mapping-and-analysis/text-analysis/analyzers/hindi-analyzer/ 印地语分析器(Hindi) | INFINI Easysearch (main) | 分布式搜索型数据库 Hindi 分析器 # hindi 分析器是为印地语文本特别设计的语言分析器,包含印度语系归一化处理。 分析器组成 # 该分析器由以下分词器和分词过滤器组成: standard 分词器:标准的文本分割 lowercase 分词过滤器:转换为小写 decimal_digit 分词过滤器:将各种 Unicode... infini easysearch main https://docs.infinilabs.com/easysearch/main/docs/features/mapping-and-analysis/field-types/object-field-type/nested/ 嵌套字段类型(Nested) | INFINI Easysearch (main) | 分布式搜索型数据库 Nested 字段类型 # nested 字段类型是一种特殊的 对象字段类型,用于将数组中的对象作为独立文档索引,避免扁平化导致的 infini easysearch main https://docs.infinilabs.com/easysearch/main/docs/features/mapping-and-analysis/mapping-parameters/enable_position_increments/ 位置增量启用(Enable Position Increments) | INFINI Easysearch (main) | 分布式搜索型数据库 infini easysearch mainposition https://docs.infinilabs.com/easysearch/main/docs/features/mapping-and-analysis/text-analysis-fuzzy/ 模糊匹配 | INFINI Easysearch (main) | 分布式搜索型数据库 用编辑距离处理拼写错误:fuzziness、fuzzy 查询、match 模糊与性能/相关性注意事项。 infini easysearch main https://docs.infinilabs.com/easysearch/main/docs/deployment/install-guide/aliyun/ 阿里云部署 | INFINI Easysearch (main) | 分布式搜索型数据库 阿里云部署指南 # 本文介绍在阿里云 ECS 上部署 Easysearch 集群的推荐配置与实践。 推荐实例规格 # 节点角色 实例族 规格示例 说明 Master(专用) 通用型 g7 ecs.g7.xlarge (4C16G) 轻量计算,稳定即可 Data 存储增强型 i3 / 本地 SSD 型... infini easysearch main https://docs.infinilabs.com/easysearch/main/docs/features/query-dsl/term-based-query/ 精确查询 | INFINI Easysearch (main) | 分布式搜索型数据库 Term、terms、range、prefix、wildcard、regexp、fuzzy 等精确查询类型。 infini easysearch main https://docs.infinilabs.com/easysearch/main/docs/features/mapping-and-analysis/mapping-parameters/similarity/ 相似度算法参数(Similarity) | INFINI Easysearch (main) | 分布式搜索型数据库 Similarity 参数 # similarity 参数指定字段使用的相关性评分算法。不同的算法适合不同类型的数据和搜索场景。 相关指南(先读这些) # 评分基础 映射基础 内置算法 # 值 算法 说明 BM25 Okapi BM25 默认值。适合大多数全文搜索场景。 boolean 布尔模型... infini easysearch main https://docs.infinilabs.com/easysearch/main/docs/features/aggregations/pipeline-aggregations/bucket-selector/ 桶选择器聚合(Bucket Selector) | INFINI Easysearch (main) | 分布式搜索型数据库 桶选择器聚合 # bucket_selector 聚合是一个父管道聚合,它评估脚本以确定直方图(或 date_histogram)聚合返回的存储分组是否应包含在最终结果中。 与创建新值的管道聚合不同,bucket_selector... infini easysearch main https://docs.infinilabs.com/easysearch/main/docs/features/mapping-and-analysis/text-analysis/tokenizers/hanlp-index/ HanLP Index 分词器 | INFINI Easysearch (main) | 分布式搜索型数据库 HanLP Index 分词器 # hanlp_index 分词器是 analysis-hanlp 插件 提供的索引模式分词器。它在标准分词的基础上对长词进行二次切分,生成更多子词项,适合索引时使用以提高召回率。 前提条件 # 需要安装 analysis-hanlp 插件: bin/easysearch-plugin... infini easysearch mainhanlpindex https://docs.infinilabs.com/easysearch/main/docs/features/mapping-and-analysis/text-analysis/analyzers/basque-analyzer/ 巴斯克语分析器(Basque) | INFINI Easysearch (main) | 分布式搜索型数据库 Basque 分析器 # basque 分析器是为巴斯克语文本特别设计的语言分析器。 分析器组成 # 该分析器由以下分词器和分词过滤器组成: standard 分词器:标准的文本分割 lowercase 分词过滤器:转换为小写 stop 分词过滤器:过滤巴斯克语停用词 snowball(Basque)... infini easysearch main https://docs.infinilabs.com/easysearch/main/docs/features/aggregations/metric-aggregations/minimum/ 最小值聚合(Min) | INFINI Easysearch (main) | 分布式搜索型数据库 最小值聚合 # min 聚合是一个单值指标聚合,返回字段的最小值。 相关指南(先读这些) # 聚合基础 聚合场景实践 min 聚合使用 double (双精度)表示来比较数值字段。对于包含 long 或 unsigned_long 且绝对值大于 2 53 的字段,结果应被视为近似值,因为 double... infini easysearch main https://docs.infinilabs.com/easysearch/main/docs/features/aggregations/metric-aggregations/sum/ 求和聚合(Sum) | INFINI Easysearch (main) | 分布式搜索型数据库 求和聚合 # sum 聚合是一种单值指标聚合,计算字段中匹配文档中提取的数值的总和。此聚合常用于计算诸如收入、数量或持续时间等指标的总计。 相关指南(先读这些) # 聚合基础 聚合场景实践 参数说明 # sum 聚合接受以下参数。 参数 必需/可选 数据类型 描述 field 必需 String... infini easysearch main https://docs.infinilabs.com/easysearch/main/docs/features/ingest-pipelines/index-processors/uppercase/ 大写处理器 | INFINI Easysearch (main) | 分布式搜索型数据库 infini easysearch main https://docs.infinilabs.com/easysearch/main/docs/fundamentals/concurrency-and-versioning/ 并发控制与版本 | INFINI Easysearch (main) | 分布式搜索型数据库 infini easysearch main https://docs.infinilabs.com/easysearch/main/docs/features/query-dsl/compound-query/ 复合查询 | INFINI Easysearch (main) | 分布式搜索型数据库 Bool、boosting、constant_score、dis_max、function_score 等复合查询。 infini easysearch main https://docs.infinilabs.com/easysearch/main/docs/features/aggregations/metric-aggregations/rate/ 速率聚合(Rate) | INFINI Easysearch (main) | 分布式搜索型数据库 速率聚合 # rate 聚合是一个指标聚合,用于计算文档或字段值在指定时间单位内的速率。它必须嵌套在 date_histogram(或 composite 中的 date_histogram 源)内部使用。 rate 聚合特别适合将不同时间粒度的数据统一到相同的速率单位进行对比。例如,当 date_histogram... infini easysearch main https://docs.infinilabs.com/easysearch/main/docs/features/query-dsl/specialized/wrapper/ Wrapper 查询 | INFINI Easysearch (main) | 分布式搜索型数据库 Wrapper 查询 # wrapper 查询允许您以 Base64 编码的 JSON 格式提交完整的查询。当查询必须嵌入到仅支持字符串值的上下文中时,它非常有用。 仅当需要管理系统约束时才使用此查询。为了提高可读性和可维护性,最好尽可能使用基于 JSON 的标准查询。 相关指南(先读这些) # Query DSL... infini easysearch mainwrapper https://docs.infinilabs.com/easysearch/main/docs/features/mapping-and-analysis/field-types/geo-field-type/geo-point/ 地理坐标点字段类型(Geo Point) | INFINI Easysearch (main) | 分布式搜索型数据库 地理坐标点字段类型(Geo Point) # geo_point 字段类型包含由纬度(latitude)和经度(longitude)指定的地理点。地理坐标点可以用来计算两个坐标间的距离,判断一个坐标是否在一个区域中,或在聚合中。 代码示例 # 创建一个带有 Geopoint 地理点字段类型的映射: PUT... infini easysearch main https://docs.infinilabs.com/easysearch/main/docs/features/mapping-and-analysis/text-analysis/token-filters/elision/ 省略词分词过滤器(Elision) | INFINI Easysearch (main) | 分布式搜索型数据库 Elision 分词过滤器 # elision 分词过滤器用于从某些语言的单词中去除省略的字符。省略现象通常出现在像法语这样的语言中,在这些语言里,单词常常会发生缩合,并与后面的单词结合,常见的方式是省略一个元音字母,并用一个撇号来替代。 注意:elision... infini easysearch main https://docs.infinilabs.com/easysearch/main/docs/features/mapping-and-analysis/text-analysis/token-filters/arabic-stem/ 阿拉伯语词干过滤器(Arabic Stemmer) | INFINI Easysearch (main) | 分布式搜索型数据库 阿拉伯语词干过滤器 # arabic_stemmer 词元过滤器使用 Lucene 的 ArabicStemmer 对阿拉伯语词元进行词干提取,去除常见的前缀和后缀。 词干规则 # 此词干提取器基于 Shereen Khoja 的轻量级方法,处理以下词缀: 类型 示例 定冠词前缀 ال (al-) 介词前缀 و... infini easysearch main https://docs.infinilabs.com/easysearch/main/docs/features/mapping-and-analysis/text-analysis/token-filters/multiplexer/ 多路复用分词过滤器(Multiplexer) | INFINI Easysearch (main) | 分布式搜索型数据库 Multiplexer 分词过滤器 # multiplexer 分词过滤器允许你通过应用不同的过滤器来创建同一词元的多个版本。当你想要以多种方式分析同一个词元时,这非常有用。例如,你可能希望使用不同的词干提取、同义词或 n-gram... infini easysearch main https://docs.infinilabs.com/easysearch/main/docs/quick-start/ 快速开始 | INFINI Easysearch (main) | 分布式搜索型数据库 15 分钟快速起步,安装、连接与核心功能体验。 infini easysearch main https://docs.infinilabs.com/easysearch/main/docs/deployment/install-guide/operator/node_scale/ 节点扩容 | INFINI Easysearch (main) | 分布式搜索型数据库 节点扩容 # Easysearch Operator 支持通过修改 YAML 配置实现快速水平扩容。 操作步骤 # 修改 Operator YAML 文件中的 replicas 字段值。例如,将集群从 3 节点扩容到 5 节点: # 修改前 replicas: 3 # 修改后 replicas: 5 应用修改:... infini easysearch main https://docs.infinilabs.com/easysearch/main/docs/management/data-explorer/switch-index/ 切换索引 | INFINI Easysearch (main) | 分布式搜索型数据库 在 Easysearch UI 数据探索中切换目标索引。 infini easysearch main https://docs.infinilabs.com/easysearch/main/docs/features/geo-search/geo-distance/ Geo Distance 查询 | INFINI Easysearch (main) | 分布式搜索型数据库 圆形距离过滤:参数、距离单位与计算方式。 infini easysearch maingeodistance https://docs.infinilabs.com/easysearch/main/docs/features/aggregations/bucket-aggregations/reverse-nested/ 反向嵌套聚合(Reverse Nested) | INFINI Easysearch (main) | 分布式搜索型数据库 反向嵌套聚合 # 您可以将嵌套文档中的值聚合到其父文档中;这种聚合称为 reverse_nested。您可以使用 reverse_nested 在按嵌套对象中的字段分组后,聚合父文档中的字段。reverse_nested 聚合将 infini easysearch main https://docs.infinilabs.com/easysearch/main/docs/operations/security/access-control/field-level-security/ 字段级权限 | INFINI Easysearch (main) | 分布式搜索型数据库 字段级权限 # 字段级权限允许您控制用户可以查看文档中的哪些字段。就像 文档级权限,可以通过角色配置中的索引块来控制访问。 相关指南(先读这些) # 权限控制总览 安全与多租户最佳实践 包括或排除字段 # 配置字段级权限时,有两个选项:包括或排除字段。如果包含字段,则用户在检索文档时 只能看到... infini easysearch main https://docs.infinilabs.com/easysearch/main/docs/best-practices/data-modeling/mapping-patterns/ Mapping 模式与最佳实践 | INFINI Easysearch (main) | 分布式搜索型数据库 实用映射模式:多字段、keyword/text 策略、数组、对象与归一化。 infini easysearch mainmapping https://docs.infinilabs.com/easysearch/main/docs/features/mapping-and-analysis/text-analysis/analyzers/estonian-analyzer/ 爱沙尼亚语分析器(Estonian) | INFINI Easysearch (main) | 分布式搜索型数据库 Estonian 分析器 # estonian 分析器是为爱沙尼亚语文本特别设计的语言分析器。 分析器组成 # 该分析器由以下分词器和分词过滤器组成: standard 分词器:标准的文本分割 lowercase 分词过滤器:转换为小写 stop 分词过滤器:过滤爱沙尼亚语停用词 snowball(Estonian)... infini easysearch main https://docs.infinilabs.com/easysearch/main/docs/deployment/install-guide/production-env/ 生产环境部署 | INFINI Easysearch (main) | 分布式搜索型数据库 生产环境部署指南 # 本文提供 Easysearch 生产环境部署的完整建议,涵盖硬件选型、节点规划、高可用架构与上线前检查清单。 硬件推荐 # 组件 CPU 内存 JVM 堆 磁盘 高可用实例数 Easysearch 16 核+ 64 GB+ 31 GB SSD ≥ 3 INFINI Console 8 核 16... infini easysearch main https://docs.infinilabs.com/easysearch/main/docs/features/mapping-and-analysis/field-types/object-field-type/flattened/ 扁平化字段类型(Flattened) | INFINI Easysearch (main) | 分布式搜索型数据库 Flattened 字段类型 # 在 Easysearch 中,您不需要在索引文档之前指定映射。如果您不指定映射,Easysearch 会使用动态映射自动映射文档中的每个字段及其子字段。当您摄取诸如日志之类的文档时,您可能事先不知道每个字段的子字段名称和类型。在这种情况下,动态映射所有新的子字段可能会快速导致 infini easysearch main https://docs.infinilabs.com/easysearch/main/docs/fundamentals/mapping-analysis-intro/ Mapping 与文本分析 | INFINI Easysearch (main) | 分布式搜索型数据库 精确值与全文、映射类型、分析器原理与语言分析器选择。 infini easysearch mainmapping https://docs.infinilabs.com/easysearch/main/docs/fundamentals/document-model/ 文档建模 | INFINI Easysearch (main) | 分布式搜索型数据库 面向搜索的数据建模:字段设计、范式取舍、标识符选择与更新策略。 infini easysearch main https://docs.infinilabs.com/easysearch/main/docs/integrations/ai/rag-and-llm/ RAG 与 LLM 集成 | INFINI Easysearch (main) | 分布式搜索型数据库 以 Easysearch 为检索层,构建检索增强生成(RAG)与问答系统的整体方案。 infini easysearch mainragllm https://docs.infinilabs.com/easysearch/main/docs/features/query-dsl/query-dsl-basics/ Query DSL 基础 | INFINI Easysearch (main) | 分布式搜索型数据库 理解查询结构:query/filter、bool 组合与常见写法。 infini easysearch mainquerydsl https://docs.infinilabs.com/easysearch/main/docs/features/mapping-and-analysis/text-analysis/token-filters/dutch-stem/ 荷兰语词干过滤器(Dutch Stemmer) | INFINI Easysearch (main) | 分布式搜索型数据库 荷兰语词干过滤器 # dutch_stemmer 词元过滤器使用 Snowball 算法对荷兰语文本进行词干提取。 功能说明 # 荷兰语词干提取使用 Snowball 算法,结合词干覆盖字典处理不规则变形: 移除常见名词/动词后缀 荷兰语分析器额外使用 stemmer_override 字典处理不规则形式... infini easysearch main https://docs.infinilabs.com/easysearch/main/docs/deployment/install-guide/tencent-cloud/ 腾讯云部署 | INFINI Easysearch (main) | 分布式搜索型数据库 腾讯云部署指南 # 本文介绍在腾讯云 CVM 上部署 Easysearch 集群的推荐配置与实践。 推荐实例规格 # 节点角色 实例族 规格示例 说明 Master(专用) 标准型 S6 S6.LARGE16 (4C16G) 轻量计算 Data 高 IO 型 IT5 IT5.4XLARGE64 (16C64G) 本地... infini easysearch main https://docs.infinilabs.com/easysearch/main/docs/features/query-dsl/collapse/ 结果折叠 | INFINI Easysearch (main) | 分布式搜索型数据库 Field Collapsing:按字段值对搜索结果去重折叠,每组只展示 Top-N。 infini easysearch main https://docs.infinilabs.com/easysearch/main/docs/features/data-retention/time-series/ 时间序列索引优化 | INFINI Easysearch (main) | 分布式搜索型数据库 时间序列索引优化 # 最低版本:1.12.1 概述 # 在处理时序数据(如日志、监控指标、事件流)时,数据通常具有明显的时间先后顺序。Easysearch 底层的 Lucene Segment 合并是保证搜索性能和资源效率的关键操作。 然而,默认的合并策略(TieredMergePolicy)主要基于 Segment... infini easysearch main https://docs.infinilabs.com/easysearch/main/docs/upgrade/ 升级手册 | INFINI Easysearch (main) | 分布式搜索型数据库 infini easysearch main https://docs.infinilabs.com/easysearch/main/docs/fundamentals/concepts/ 核心概念 | INFINI Easysearch (main) | 分布式搜索型数据库 索引、文档、分片、副本、集群与节点——Easysearch 的基本术语与架构概览。 infini easysearch main https://docs.infinilabs.com/easysearch/main/docs/integrations/observability/ 可观测性集成 | INFINI Easysearch (main) | 分布式搜索型数据库 把 Easysearch 接入你的监控、日志和 Trace 体系,统一观测与分析。 infini easysearch main https://docs.infinilabs.com/easysearch/main/docs/features/mapping-and-analysis/text-analysis/token-filters/indic-normalization/ 印度语系归一化过滤器(Indic Normalization) | INFINI Easysearch (main) | 分布式搜索型数据库 印度语系归一化过滤器 # indic_normalization 词元过滤器对印度语系(Indic)文本进行 Unicode 归一化,统一各印度语系脚本中字符的多种表示形式。它是孟加拉语、印地语等语言归一化的基础层。 归一化规则 # 处理 说明 Unicode 分解与合成 将组合字符序列转为标准的预组合形式(NFC... infini easysearch main https://docs.infinilabs.com/easysearch/main/docs/features/mapping-and-analysis/mapping-parameters/null_value/ 空值参数(Null Value) | INFINI Easysearch (main) | 分布式搜索型数据库 infini easysearch main https://docs.infinilabs.com/easysearch/main/docs/features/query-dsl/term-based-query/ids/ IDs 查询 | INFINI Easysearch (main) | 分布式搜索型数据库 infini easysearch mainids https://docs.infinilabs.com/easysearch/main/docs/management/hot-threads/view-hot-threads/ 查看热点线程详情 | INFINI Easysearch (main) | 分布式搜索型数据库 在 Easysearch UI 中查看节点热点线程信息。 infini easysearch main