仙桃网站制作网站设计,社交app定制开发,纸箱包装设计,五大建设是什么内容写在前面
本文记录es的零碎知识点#xff0c;包括但不限于概念#xff0c;集群方式#xff0c;等。
1#xff1a;词项查询 VS 全文查询
词项查询#xff1a;查询的内容不做分词处理#xff0c;输入的什么查询什么。
全文查询#xff1a;查询的内容会做分词处理…写在前面
本文记录es的零碎知识点包括但不限于概念集群方式等。
1词项查询 VS 全文查询
词项查询查询的内容不做分词处理输入的什么查询什么。
全文查询查询的内容会做分词处理生成多个词项然后对每个词项分别查询所有的查询结果汇总在一起作为最终的结果。
具体参考这里 。
2Query Context VS Filter Context
Query Context算分的上下文。
Filter Context不算分的上下文。
3copy_to
使用copy_to如下 测试
# 1:先删除索引因为前面创建过了
DELETE users
# 2创建索引并指定firstName的null_value
PUT users
{mappings: {properties: {firstName: {type: text,copy_to: fullName},lastName: {type: text,copy_to: fullName}}}
}
# 3:创建新数据
POST users/_create/1
{firstName: jack,lastName: james
}
# 4:搜索在fulleName中包含jack或者是包含james的可以正常搜索到
GET users/_search?qfullName:(jack james)
{profile: true
}4常见分词器
4.1中文分词器
ik 。
icu 。
pinyin 分词为拼音 配置 例子
HanLP 安装参考pinyin ,下载参考下图
5相关性相关文档precision,recall
相关性
1需要找到的文档都找到了
2找到了多少错误的文档
3找到的文档评分高低是否符合预期相关文档 应该找到的文档。precision,recall 如果找到的文档我们标记为positive没有找到的文档标记为negative然后我们用true来表示找到的该找到的没找到的不该找到的用false来表示没找到的该找到的找到的不该找到的绕啊则我们可以得到下图
precision就是返回的文档中相关文档数/返回的文档数
recall就是返回的相关文档/总相关文档如下图 一般搜索时尽量提高recall值是我们的目标。
写在后面
参考文章列表
Elasticsearch理解搜索中的 precision 及 recall 。