当前位置: 首页 > news >正文

我们做的网站是优化型结构中国大数据平台官网

我们做的网站是优化型结构,中国大数据平台官网,北京团建网站,黄页网站大全免费网址日本Lucene及概念介绍 基础概念倒排索引索引合并分析查询语句的构成 基础概念 Document:我们一次查询或更新的载体,对比于实体类 Field:字段,是key-value格式的数据,对比实体类的字段 Item:一个单词&#xff0…

Lucene及概念介绍

  • 基础概念
  • 倒排索引
  • 索引合并
  • 分析
  • 查询语句的构成

基础概念

Document:我们一次查询或更新的载体,对比于实体类
Field:字段,是key-value格式的数据,对比实体类的字段
Item:一个单词,这个单词就是建立倒排索引的一项
Token:一个Item的一次匹配,包含Item、开始位置、结束位置、类型等信息。

倒排索引

在这里插入图片描述
倒排索引相当于做了两个操作:

  1. 分词
  2. 建立索引

分词就是把文本进行分割,形成多个小的Item,建立索引就是将分词和原数据建立关联关系。

索引合并

单个索引会分割成多个小块进行存储,而这些小块一经写入不会再更新。当我们的查询设计到多个小块时,查询效率会降低,因此需要合并多个小块来提升查询效率,这个操作就是索引合并。索引合并是需要占用IO的,因此一般不要强制索引合并

分析

原始Document拆分成倒排索引和新的查询语句拆分成允许被搜索的选项的操作都会涉及到”分析“

分词器:将文本进行分割,拆分成索引的工具

映射器:对文本进行处理,映射成其他数据

过滤器:对拆分后的文本进行过滤,例如隐私处理等。

三个部分的处理顺序如下:
在这里插入图片描述

查询语句的构成

查询语句主要分为term和操作符两部分,term就是分词的匹配项,而操作符用于描述本次查询的多个term之间的匹配关系

操作符作用
AND表示同时匹配关系
OR表示同时或关系
NOT表示同时否定匹配关系
+表示同时确认匹配关系
-表示否定匹配关系
()表示关系优先级绑定
?表示单字符通配
*表示多字符通配
~表示模糊查询
[]表示闭区间范围查询
{}表示开区间范围查询
http://www.tj-hxxt.cn/news/105104.html

相关文章:

  • hostinger建站wordpress百度直播推广
  • 深圳装修公司哪家好旺道seo优化软件怎么用
  • 汕头网站网店建设微信指数怎么看
  • 网站推广公司简介google推广及广告优缺点
  • 深圳网a深圳网站建设百度识图在线使用
  • 网站页面布局设计思路网站搭建关键词排名
  • 哪个网站上做自媒体最好黄页88网站推广方案
  • 厦门模板做网站漂亮的网页设计
  • 建设摩托车专卖店谷歌seo快速排名优化方法
  • 网站备案需要关闭百度指数排行榜
  • 福清做网站的公司web网站模板
  • 广州购网站建设seo计费系统开发
  • python语言程序设计基础商丘网站seo
  • 用windows搭建手机网站苏州百度推广公司
  • 学校网站建设的意义的主要负责人seo公司推荐推广平台
  • 苹果园网站建设许昌网站seo
  • 杭州哪里找网站建设的兼职怎么上百度搜索
  • 做一个小型网站多少钱天津seo网站管理
  • 自适应网站建站开发软件app需要多少钱
  • 杭州网站制作工具模板网站
  • 安徽智农网络信息技术服务有限公司 网站开发网站服务器搭建与管理
  • 网站业务需求文档网络推广和网络销售的区别
  • 用自己的服务器做网站社群推广平台
  • wordpress 翻页功能百度seo费用
  • 做网站后怎样让其他人交互电商营销策划方案
  • 松江区建设交通委员会网站新开传奇网站发布站
  • web网站开发的流程图企业网络推广的方式有哪些
  • 西宁网站设计建设四年级小新闻50字左右
  • 沈阳网站制作公司网址解析ip地址
  • 怎样建立俄罗斯网站推广方式