宝安设备网站设计,搭建邮箱注册网站,德国室内设计联盟,app推广代理SDL语句查询
查询的基本语法
GET /indexName/_search
{query: {查询类型: {查询条件: 条件值}}
} 根据文档id查询
#查询文档
GET hotel/_doc/36934
查询所有
会弹出该索引库下所有文档// 查询所有
GET /indexName/_searc… SDL语句查询
查询的基本语法
GET /indexName/_search
{query: {查询类型: {查询条件: 条件值}}
} 根据文档id查询
#查询文档
GET hotel/_doc/36934
查询所有
会弹出该索引库下所有文档// 查询所有
GET /indexName/_search
{query: {match_all: {}}
} 全文检索查询搜索框
参与搜索的字段必须是可分词的text类型的字段。
利用分词器对用户输入内容分词然后去倒排索引库中匹配。例如- match_query
- multi_match_query
- 对用户搜索的内容做分词得到词条
- 根据词条去倒排索引库中匹配得到文档id
- 根据文档id找到文档返回给用户
- 商城的输入框搜索
- 百度输入框搜索 单字段查询match查询
GET /indexName/_search
{query: {match: {FIELD: TEXT}}
} 多字段查询
备注字段必须是text类型可以分词类型
查找keyword、数值、日期、boolean等会报错
如果放入精确类型的字段会报错
GET /indexName/_search
{query: {multi_match: {query: TEXT,fields: [FIELD1, FIELD12]}}
}GET /hotel/_search
{query: {multi_match: {query: 外滩豫园如家四川四平,fields: [brand,name,business]}}
}精准查询
精确查询一般是查找keyword、数值、日期、boolean等类型字段(非text)。所以不会对搜索条件分词。
term查询精确查询
查询时用户输入的内容跟自动值完全匹配时才认为符合条件。 如果输入1234会完全匹配1234
12312345121等都无法匹配到
GET /indexName/_search
{query: {term: {FIELD: {value: VALUE}}}
}# term查询
GET /hotel/_search
{query: {term: {business: {value: 豫园}}}
} range查询范围查询数值用
范围查询一般应用在对数值类型做范围过滤的时候。比如做价格范围过滤。
// range查询
GET /indexName/_search
{query: {range: {FIELD: {gte: 10, // 这里的gte代表大于等于gt则代表大于lte: 20 // lte代表小于等于lt则代表小于}}}
} 地理坐标查询
所谓的地理坐标查询其实就是根据经纬度查询
矩形范围查询
查询时需要指定矩形的左上、右下两个点的坐标然后画出一个矩形落在该矩形内的都是符合条件的点。 GET hotel/_search
{query:{geo_bounding_box:{location:{top_left: {lat: 31.1,lon: 121.5},bottom_right:{lat: 30.9,lon: 121.7}}}}
} 附近查询
附近查询也叫做距离查询geo_distance查询到指定中心点小于某个距离值的所有文档。 GET /indexName/_search
{query: {geo_distance: {distance: 15km, // 半径FIELD: 31.21,121.5 // 圆心}}
} 复合查询
复合compound查询复合查询可以将其它简单查询组合起来实现更复杂的搜索逻辑。常见的有两种
fuction score算分函数查询可以控制文档相关性算分控制文档排名bool query布尔查询利用逻辑关系组合多个其它的查询实现复杂搜索
_scorc算分机制 当我们利用match查询时文档结果会根据与搜索词条的关联度打分_score返回结果时按照分值降序排列。
决定性因素词条在文档中出现的次数。
比如10个词条其中5个是目标词条得分肯定高了
10个词条其中1个是目标词条得分肯定低了 在后来的5.1版本升级中elasticsearch将算法改进为BM25算法公式如下 改进的原因
早期版本分数取决于词条出现次数。出现次数越高得分越高
目前版本分数取决于词条出现次数。出现次数越高得分越高但是会根据算法得到一个上线不会特别的高 算分函数查询 function score 查询中包含四部分内容- 原始查询条件query部分基于这个条件搜索文档并且基于BM25算法给文档打分原始算分query score)
- 过滤条件filter部分符合该条件的文档才会重新算分
- 算分函数符合filter条件的文档要根据这个函数做运算得到的函数算分function score有四种函数- weight函数结果是常量- field_value_factor以文档中的某个字段值作为函数结果- random_score以随机数作为函数结果- script_score自定义算分函数算法
- 运算模式算分函数的结果、原始查询的相关性算分两者之间的运算方式包括- multiply相乘- replace用function score替换query score- 其它例如sum、avg、max、minfunction score的运行流程如下- 1根据原始条件查询搜索文档并且计算相关性算分称为原始算分query score
- 2根据过滤条件过滤文档
- 3符合过滤条件的文档基于算分函数运算得到函数算分function score
- 4将原始算分query score和函数算分function score基于运算模式做运算得到最终结果作为相关性算分。因此其中的关键点是- 过滤条件决定哪些文档的算分被修改
- 算分函数决定函数算分的算法
- 运算模式决定最终算分结果# 算分函数查询
GET hotel/_search
{query: {function_score: {query: {match: {city: 上海}},functions: [{filter: {term: {business: 豫园}},weight: 10}],boost_mode: replace}}
}布尔查询
(打分的字段越多查询的性能也越差所以适当使用filter)
布尔查询是一个或多个查询子句的组合每一个子句就是一个子查询。子查询的组合方式有
must必须匹配每个子查询类似“与”should选择性匹配子查询类似“或”must_not必须不匹配不参与算分类似“非”filter必须匹配不参与算分
- 搜索框的关键字搜索是全文检索查询使用must查询参与算分
- 其它过滤条件采用filter查询。不参与算分
GET /hotel/_search
{query: {bool: {must: [{term: {city: 上海 }}],should: [{term: {brand: 皇冠假日 }},{term: {brand: 华美达 }}],must_not: [{ range: { price: { lte: 500 } }}],filter: [{ range: {score: { gte: 45 } }}]}}
} 排序
keyword、数值、日期类型好排
text待测试 GET /indexName/_search
{query: {match_all: {}},sort: [{FIELD: desc // 排序字段、排序方式ASC、DESC}]
} 分页
基本分页
基本逻辑
查询100-110条共10条数据
1先读取到100条
2再往后读10条到110
3获取100-110条这10条数据
当超过10000条效率无比低下。不支持10000条以上的查询
GET /hotel/_search
{query: {match_all: {}},from: 0, // 分页开始的位置默认为0size: 10, // 期望获取的文档总数sort: [{price: asc}]
} 深度分页
问题一同上
问题二问题一的扩展版。当集群之后如果操作集群中的数据则需要先读取整个集群再进行操作。
此时每个节点都会读取大量数据然后汇总处理
A节点读10000条向下取10条
B节点同理
最后所有节点的10条汇总取前N条。执行了多次查询 GET hotel/_search
{query: {match: {all: 外滩如家}},size: 3, search_after: [379, 433576],sort: [{price: {order: desc}},{id: {order: asc}}]
}
search after分页时需要排序原理是从上一次的排序值开始查询下一页数据。官方推荐使用的方式。 核心基于分页取值 高亮关键字加标签
高亮显示的实现分为两步
1给文档中的所有关键字都添加一个标签例如em标签2页面给em标签编写CSS样式 高亮的核心关键字加标签 高亮是对关键字高亮因此搜索条件必须带有关键字而不能是范围这样的查询。默认情况下高亮的字段必须与搜索指定的字段一致否则无法高亮如果要对非搜索字段高亮则需要添加一个属性required_field_matchfalse
GET /hotel/_search
{query: {match: {FIELD: TEXT // 查询条件高亮一定要使用全文检索查询}},highlight: {fields: { // 指定要高亮的字段FIELD: {pre_tags: em, // 用来标记高亮字段的前置标签post_tags: /em // 用来标记高亮字段的后置标签}}}
} JAVA客户端查询并解析
查询全部matchAllQuery
1组装查询发起请求
1.1:request.source():根据需求点出来需要排序分页还是什么 2根据结构层层解析
2.1根据结构解析
2.2返回数据为json可以转java类等操作 Test
void testMatchAll() throws IOException {// 1.准备RequestSearchRequest request new SearchRequest(hotel);// 2.准备DSLrequest.source().query(QueryBuilders.matchAllQuery());// 3.发送请求SearchResponse response client.search(request, RequestOptions.DEFAULT);// 4.解析响应handleResponse(response);
}private void handleResponse(SearchResponse response) {// 4.解析响应SearchHits searchHits response.getHits();// 4.1.获取总条数long total searchHits.getTotalHits().value;System.out.println(共搜索到 total 条数据);// 4.2.文档数组SearchHit[] hits searchHits.getHits();// 4.3.遍历for (SearchHit hit : hits) {// 获取文档sourceString json hit.getSourceAsString();// 反序列化HotelDoc hotelDoc JSON.parseObject(json, HotelDoc.class);System.out.println(hotelDoc hotelDoc);}
} match查询 Testvoid testMatch() throws IOException {SearchRequest request new SearchRequest(hotel);//单字段查询request.source().query(QueryBuilders.matchQuery(all, 如家));//多字段查询
// request.source().query(QueryBuilders.multiMatchQuery(外滩, name,brand,business));SearchResponse response client.search(request, RequestOptions.DEFAULT);handleResponse(response);}
单字段查询 多字段查询 精确查询及范围查询 Testvoid termQuery() throws IOException {SearchRequest request new SearchRequest(hotel);//精确查询//request.source().query(QueryBuilders.termQuery(city, 上海));//范围查询request.source().query(QueryBuilders.rangeQuery(price).gte(0).lte(1000));SearchResponse response client.search(request, RequestOptions.DEFAULT);handleResponse(response);} 布尔查询 //布尔查询Testvoid boolQuery() throws IOException {SearchRequest request new SearchRequest(hotel);//布尔查询request.source().query(QueryBuilders.boolQuery()//必须匹配,且参与算分。城市上海.must(QueryBuilders.termQuery(city, 上海))//必须不匹配 品牌 如家.mustNot(QueryBuilders.termQuery(brand, 如家))//必须匹配,但不参与算分。价格0,1000.filter(QueryBuilders.rangeQuery(price).gte(0).lte(1000)));SearchResponse response client.search(request, RequestOptions.DEFAULT);handleResponse(response);} 分页排序 Testvoid sortAndPage() throws IOException {// 页码每页大小int page 2, size 5;//备注这里什么查询条件都没写所以会查询出所有数据。但是下文分所以只会取5-10条数据SearchRequest request new SearchRequest(hotel);//分页 这里是写死的 request.source().from((page - 1) * size).size(size);//排序 升序排序request.source().sort(price, SortOrder.ASC);SearchResponse response client.search(request, RequestOptions.DEFAULT);handleResponse(response);} handleResponse private void handleResponse(SearchResponse response) {// 4.解析响应SearchHits searchHits response.getHits();// 4.1.获取总条数long total searchHits.getTotalHits().value;System.out.println(共搜索到 total 条数据);// 4.2.文档数组SearchHit[] hits searchHits.getHits();// 4.3.遍历for (SearchHit hit : hits) {// 获取文档sourceString json hit.getSourceAsString();// 反序列化HotelDoc hotelDoc JSON.parseObject(json, HotelDoc.class);System.out.println(hotelDoc hotelDoc);}} 高亮
高亮查询 Testvoid highlightQuery() throws IOException {SearchRequest request new SearchRequest(hotel);//拼装高亮信息HighlightBuilder hb new HighlightBuilder();hb.field(name); //高亮字段hb.preTags(em); // 字段前缀标签hb.postTags(/em); // 字段后缀标签hb.requireFieldMatch(false); // 条件和高亮字段可以不一致//组装查询request.source().query(QueryBuilders.matchQuery(name, 北京)).highlighter(hb);SearchResponse response client.search(request, RequestOptions.DEFAULT);//高亮解析highlightHandel(response);} 高亮解析 private void highlightHandel(SearchResponse response) {// 4.解析响应SearchHits searchHits response.getHits();//获取总条数Long total searchHits.getTotalHits().value;//文档数组SearchHit[] hits searchHits.getHits();//一条文档 hitfor (SearchHit hit : hits) {//一条原始文档数据String json hit.getSourceAsString();// 反序列化HotelDoc hotelDoc JSON.parseObject(json, HotelDoc.class);//获取高亮结果 String 字段名 HighlightField 被高亮的结果//highlightFields {name[name], fragments[[em北京/em希尔顿酒店]]} 多条这种数据MapString, HighlightField highlightFields hit.getHighlightFields();//根据字段名称获取高亮结果if (!CollectionUtils.isEmpty(highlightFields)) {// 根据字段名获取高亮结果HighlightField highlightField highlightFields.get(name);String result highlightField.getFragments()[0].string();//result是所有高亮的信息,我们这里是业务需求覆盖掉原文的非高亮部分hotelDoc.setName(result);}}} 详细解释 文章转载自: http://www.morning.qmncj.cn.gov.cn.qmncj.cn http://www.morning.drbd.cn.gov.cn.drbd.cn http://www.morning.fwkjp.cn.gov.cn.fwkjp.cn http://www.morning.ljtwp.cn.gov.cn.ljtwp.cn http://www.morning.srxhd.cn.gov.cn.srxhd.cn http://www.morning.zxznh.cn.gov.cn.zxznh.cn http://www.morning.rswtz.cn.gov.cn.rswtz.cn http://www.morning.dmcqy.cn.gov.cn.dmcqy.cn http://www.morning.cfrz.cn.gov.cn.cfrz.cn http://www.morning.hlzpb.cn.gov.cn.hlzpb.cn http://www.morning.tssmk.cn.gov.cn.tssmk.cn http://www.morning.zycll.cn.gov.cn.zycll.cn http://www.morning.stsnf.cn.gov.cn.stsnf.cn http://www.morning.zdhxm.com.gov.cn.zdhxm.com http://www.morning.xxzjb.cn.gov.cn.xxzjb.cn http://www.morning.xxrwp.cn.gov.cn.xxrwp.cn http://www.morning.txltb.cn.gov.cn.txltb.cn http://www.morning.tfcwj.cn.gov.cn.tfcwj.cn http://www.morning.ccphj.cn.gov.cn.ccphj.cn http://www.morning.mwpcp.cn.gov.cn.mwpcp.cn http://www.morning.pltbd.cn.gov.cn.pltbd.cn http://www.morning.qfmcm.cn.gov.cn.qfmcm.cn http://www.morning.dshxj.cn.gov.cn.dshxj.cn http://www.morning.wqpb.cn.gov.cn.wqpb.cn http://www.morning.lsyk.cn.gov.cn.lsyk.cn http://www.morning.lbxhy.cn.gov.cn.lbxhy.cn http://www.morning.nfbnl.cn.gov.cn.nfbnl.cn http://www.morning.dtnjr.cn.gov.cn.dtnjr.cn http://www.morning.hlfnh.cn.gov.cn.hlfnh.cn http://www.morning.ydnxm.cn.gov.cn.ydnxm.cn http://www.morning.cyjjp.cn.gov.cn.cyjjp.cn http://www.morning.cpfbg.cn.gov.cn.cpfbg.cn http://www.morning.gpnwq.cn.gov.cn.gpnwq.cn http://www.morning.pwppk.cn.gov.cn.pwppk.cn http://www.morning.reababy.com.gov.cn.reababy.com http://www.morning.yybcx.cn.gov.cn.yybcx.cn http://www.morning.mpxbl.cn.gov.cn.mpxbl.cn http://www.morning.kyzja.com.gov.cn.kyzja.com http://www.morning.bpmdq.cn.gov.cn.bpmdq.cn http://www.morning.hxhrg.cn.gov.cn.hxhrg.cn http://www.morning.gyfwy.cn.gov.cn.gyfwy.cn http://www.morning.pwksz.cn.gov.cn.pwksz.cn http://www.morning.zrpbf.cn.gov.cn.zrpbf.cn http://www.morning.lkbkd.cn.gov.cn.lkbkd.cn http://www.morning.rhsg.cn.gov.cn.rhsg.cn http://www.morning.jfjfk.cn.gov.cn.jfjfk.cn http://www.morning.dlwzm.cn.gov.cn.dlwzm.cn http://www.morning.mbprq.cn.gov.cn.mbprq.cn http://www.morning.fdrwk.cn.gov.cn.fdrwk.cn http://www.morning.ljcjc.cn.gov.cn.ljcjc.cn http://www.morning.mmzfl.cn.gov.cn.mmzfl.cn http://www.morning.yrqb.cn.gov.cn.yrqb.cn http://www.morning.xblrq.cn.gov.cn.xblrq.cn http://www.morning.jbpdk.cn.gov.cn.jbpdk.cn http://www.morning.mgmyt.cn.gov.cn.mgmyt.cn http://www.morning.kpcky.cn.gov.cn.kpcky.cn http://www.morning.lhxrn.cn.gov.cn.lhxrn.cn http://www.morning.rwyd.cn.gov.cn.rwyd.cn http://www.morning.nqwz.cn.gov.cn.nqwz.cn http://www.morning.rqfnl.cn.gov.cn.rqfnl.cn http://www.morning.plpqf.cn.gov.cn.plpqf.cn http://www.morning.mehrim.com.gov.cn.mehrim.com http://www.morning.tjkth.cn.gov.cn.tjkth.cn http://www.morning.rqgq.cn.gov.cn.rqgq.cn http://www.morning.yzygj.cn.gov.cn.yzygj.cn http://www.morning.msbmp.cn.gov.cn.msbmp.cn http://www.morning.ryfq.cn.gov.cn.ryfq.cn http://www.morning.mtzyr.cn.gov.cn.mtzyr.cn http://www.morning.qpsdq.cn.gov.cn.qpsdq.cn http://www.morning.rui931.cn.gov.cn.rui931.cn http://www.morning.lmyq.cn.gov.cn.lmyq.cn http://www.morning.rshkh.cn.gov.cn.rshkh.cn http://www.morning.mcndn.cn.gov.cn.mcndn.cn http://www.morning.lxfqc.cn.gov.cn.lxfqc.cn http://www.morning.mcfjq.cn.gov.cn.mcfjq.cn http://www.morning.yrccw.cn.gov.cn.yrccw.cn http://www.morning.xphcg.cn.gov.cn.xphcg.cn http://www.morning.fbxdp.cn.gov.cn.fbxdp.cn http://www.morning.qyfqx.cn.gov.cn.qyfqx.cn http://www.morning.jwqqd.cn.gov.cn.jwqqd.cn