公司网站建设费用预算,商城系统 wordpress嵌入,杭州做网站的网络公司有哪些,网络推手公司怎么收费文章目录 背景一、怎么得到InnoDB主键索引B树的高度#xff1f;二、小结三、最后回顾一道面试题总结参考资料 背景
InnoDB一棵B树可以存放多少行数据#xff1f;这个问题的简单回答是#xff1a;约2千万。为什么是这么多呢#xff1f;因为这是可以算出来的#xff0c;要搞… 文章目录 背景一、怎么得到InnoDB主键索引B树的高度二、小结三、最后回顾一道面试题总结参考资料 背景
InnoDB一棵B树可以存放多少行数据这个问题的简单回答是约2千万。为什么是这么多呢因为这是可以算出来的要搞清楚这个问题我们先从InnoDB索引数据结构、数据组织方式说起。
我们都知道计算机在存储数据的时候有最小存储单元这就好比我们今天进行现金的流通最小单位是一毛。在计算机中磁盘存储数据最小单元是扇区一个扇区的大小是512字节而文件系统例如XFS/EXT4他的最小单元是块一个块的大小是4k而对于我们的InnoDB存储引擎也有自己的最小储存单元——页Page一个页的大小是16K。
下面几张图可以帮你理解最小存储单元
文件系统中一个文件大小只有1个字节但不得不占磁盘上4KB的空间。 innodb的所有数据文件后缀为ibd的文件他的大小始终都是1638416k的整数倍。
磁盘扇区、文件系统、InnoDB存储引擎都有各自的最小存储单元。 在MySQL中我们的InnoDB页的大小默认是16k当然也可以通过参数设置
mysql show variables like innodb_page_size;-------------------------| Variable_name | Value |-------------------------| innodb_page_size | 16384 |-------------------------1 row in set (0.00 sec)数据表中的数据都是存储在页中的所以一个页中能存储多少行数据呢假设一行数据的大小是1k那么一个页可以存放16行这样的数据。
如果数据库只按这样的方式存储那么如何查找数据就成为一个问题因为我们不知道要查找的数据存在哪个页中也不可能把所有的页遍历一遍那样太慢了。所以人们想了一个办法用B树的方式组织这些数据。如图所示 我们先将数据记录按主键进行排序分别存放在不同的页中为了便于理解我们这里一个页中只存放3条记录实际情况可以存放很多除了存放数据的页以外还有存放键值指针的页如图中page number3的页该页存放键值和指向数据页的指针这样的页由N个键值指针组成。当然它也是排好序的。这样的数据组织形式我们称为索引组织表。现在来看下要查找一条数据怎么查
如select * from user where id5;
这里id是主键,我们通过这棵B树来查找首先找到根页你怎么知道user表的根页在哪呢其实每张表的根页位置在表空间文件中是固定的即page number3的页这点我们下文还会进一步证明找到根页后通过二分查找法定位到id5的数据应该在指针P5指向的页中那么进一步去page number5的页中查找同样通过二分查询法即可找到id5的记录
5zhao227
现在我们清楚了InnoDB中主键索引B树是如何组织数据、查询数据的我们总结一下 InnoDB存储引擎的最小存储单元是页页可以用于存放数据也可以用于存放键值指针在B树中叶子节点存放数据非叶子节点存放键值指针。 索引组织表通过非叶子节点的二分查找法以及指针确定数据在哪个页中进而在去数据页中查找到需要的数据
那么回到我们开始的问题通常一棵B树可以存放多少行数据
这里我们先假设B树高为2即存在一个根节点和若干个叶子节点那么这棵B树的存放总记录数为根节点指针数*单个叶子节点记录行数。
上文我们已经说明单个叶子节点页中的记录数16K/1K16。这里假设一行记录的数据大小为1k实际上现在很多互联网业务数据记录大小通常就是1K左右。
那么现在我们需要计算出非叶子节点能存放多少指针其实这也很好算我们假设主键ID为bigint类型长度为8字节而指针大小在InnoDB源码中设置为6字节这样一共14字节我们一个页中能存放多少这样的单元其实就代表有多少指针即16384/141170。那么可以算出一棵高度为2的B树能存放1170*1618720条这样的数据记录。
根据同样的原理我们可以算出一个高度为3的B树可以存放117011701621902400条这样的记录。所以在InnoDB中B树高度一般为1-3层它就能满足千万级的数据存储。在查找数据时一次页的查找代表一次IO所以通过主键索引查询通常只需要1-3次IO操作即可查找到数据。
一、怎么得到InnoDB主键索引B树的高度
上面我们通过推断得出B树的高度通常是1-3下面我们从另外一个侧面证明这个结论。在InnoDB的表空间文件中约定page number为3的代表主键索引的根页而在根页偏移量为64的地方存放了该B树的page level。如果page level为1树高为2page level为2则树高为3。即B树的高度page level1下面我们将从实际环境中尝试找到这个page level。
在实际操作之前你可以通过InnoDB元数据表确认主键索引根页的page number为3你也可以从《InnoDB存储引擎》这本书中得到确认。
SELECT
b.name, a.name, index_id, type, a.space, a.PAGE_NO
FROM
information_schema.INNODB_SYS_INDEXES a,
information_schema.INNODB_SYS_TABLES b
WHERE
a.table_id b.table_id AND a.space 0;执行结果
可以看出数据库dbt3下的customer表、lineitem表主键索引根页的page number均为3而其他的二级索引page number为4。关于二级索引与主键索引的区别请参考MySQL相关书籍本文不在此介绍。
下面我们对数据库表空间文件做想相关的解析 因为主键索引B树的根页在整个表空间文件中的第3个页开始所以可以算出它在文件中的偏移量16384*34915216384为页大小。
另外根据《InnoDB存储引擎》中描述在根页的64偏移量位置前2个字节保存了page level的值因此我们想要的page level的值在整个文件中的偏移量为16384*364491526449216前2个字节中。
接下来我们用hexdump工具查看表空间文件指定偏移量上的数据 linetem表的page level为2B树高度为page level13
region表的page level为0B树高度为page level11
customer表的page level为2B树高度为page level13
这三张表的数据量如下 二、小结
lineitem表的数据行数为600多万B树高度为3customer表数据行数只有15万B树高度也为3。可以看出尽管数据量差异较大这两个表树的高度都是3换句话说这两个表通过索引查询效率并没有太大差异因为都只需要做3次IO。那么如果有一张表行数是一千万那么他的B树高度依旧是3查询效率仍然不会相差太大。
region表只有5行数据当然他的B树高度为1。
三、最后回顾一道面试题
有一道MySQL的面试题为什么MySQL的索引要使用B树而不是其它树形结构?比如B树
现在这个问题的复杂版本可以参考本文
他的简单版本回答是
因为B树不管叶子节点还是非叶子节点都会保存数据这样导致在非叶子节点中能保存的指针数量变少有些资料也称为扇出指针少的情况下要保存大量数据只能增加树的高度导致IO操作变多查询性能变低
总结
本文从一个问题出发逐步介绍了InnoDB索引组织表的原理、查询方式并结合已有知识回答该问题结合实践来证明。当然为了表述简单易懂文中忽略了一些细枝末节比如一个页中不可能所有空间都用于存放数据它还会存放一些少量的其他字段比如page levelindex number等等另外还有页的填充因子也导致一个页不可能全部用于保存数据。关于二级索引数据存取方式可以参考MySQL相关书籍他的要点是结合主键索引进行回表查询。
参考资料
姜承尧 《MySQL技术内幕:InnoDB存储引擎》
姜承尧 http://www.innomysql.com/查看-innodb表中每个的索引高度/ 文章转载自: http://www.morning.bqwnp.cn.gov.cn.bqwnp.cn http://www.morning.swbhq.cn.gov.cn.swbhq.cn http://www.morning.jgcyn.cn.gov.cn.jgcyn.cn http://www.morning.lgrkr.cn.gov.cn.lgrkr.cn http://www.morning.fengnue.com.gov.cn.fengnue.com http://www.morning.smggx.cn.gov.cn.smggx.cn http://www.morning.sfcfy.cn.gov.cn.sfcfy.cn http://www.morning.fslrx.cn.gov.cn.fslrx.cn http://www.morning.fkmqg.cn.gov.cn.fkmqg.cn http://www.morning.sdkaiyu.com.gov.cn.sdkaiyu.com http://www.morning.pqqhl.cn.gov.cn.pqqhl.cn http://www.morning.rbkdg.cn.gov.cn.rbkdg.cn http://www.morning.wspyb.cn.gov.cn.wspyb.cn http://www.morning.ryspp.cn.gov.cn.ryspp.cn http://www.morning.bnxfj.cn.gov.cn.bnxfj.cn http://www.morning.3ox8hs.cn.gov.cn.3ox8hs.cn http://www.morning.wdlg.cn.gov.cn.wdlg.cn http://www.morning.ltfnl.cn.gov.cn.ltfnl.cn http://www.morning.lbrwm.cn.gov.cn.lbrwm.cn http://www.morning.xqndf.cn.gov.cn.xqndf.cn http://www.morning.mlhfr.cn.gov.cn.mlhfr.cn http://www.morning.rtsdz.cn.gov.cn.rtsdz.cn http://www.morning.gnwpg.cn.gov.cn.gnwpg.cn http://www.morning.27asw.cn.gov.cn.27asw.cn http://www.morning.rcjwl.cn.gov.cn.rcjwl.cn http://www.morning.pkmcr.cn.gov.cn.pkmcr.cn http://www.morning.bpmnx.cn.gov.cn.bpmnx.cn http://www.morning.gqwbl.cn.gov.cn.gqwbl.cn http://www.morning.bypfj.cn.gov.cn.bypfj.cn http://www.morning.rmdwp.cn.gov.cn.rmdwp.cn http://www.morning.rkmhp.cn.gov.cn.rkmhp.cn http://www.morning.txzmy.cn.gov.cn.txzmy.cn http://www.morning.hkgcx.cn.gov.cn.hkgcx.cn http://www.morning.pmlgr.cn.gov.cn.pmlgr.cn http://www.morning.zpjhh.cn.gov.cn.zpjhh.cn http://www.morning.njnqn.cn.gov.cn.njnqn.cn http://www.morning.lrgfd.cn.gov.cn.lrgfd.cn http://www.morning.zxfr.cn.gov.cn.zxfr.cn http://www.morning.rqqmd.cn.gov.cn.rqqmd.cn http://www.morning.tgnr.cn.gov.cn.tgnr.cn http://www.morning.jhrtq.cn.gov.cn.jhrtq.cn http://www.morning.rswfj.cn.gov.cn.rswfj.cn http://www.morning.jycr.cn.gov.cn.jycr.cn http://www.morning.zrks.cn.gov.cn.zrks.cn http://www.morning.ndpzm.cn.gov.cn.ndpzm.cn http://www.morning.itvsee.com.gov.cn.itvsee.com http://www.morning.hcgbm.cn.gov.cn.hcgbm.cn http://www.morning.zpyh.cn.gov.cn.zpyh.cn http://www.morning.kxymr.cn.gov.cn.kxymr.cn http://www.morning.ftmly.cn.gov.cn.ftmly.cn http://www.morning.bhrkx.cn.gov.cn.bhrkx.cn http://www.morning.gyrdn.cn.gov.cn.gyrdn.cn http://www.morning.jcxqc.cn.gov.cn.jcxqc.cn http://www.morning.jmbgl.cn.gov.cn.jmbgl.cn http://www.morning.ktmbp.cn.gov.cn.ktmbp.cn http://www.morning.mxtjl.cn.gov.cn.mxtjl.cn http://www.morning.nzkkh.cn.gov.cn.nzkkh.cn http://www.morning.krdmn.cn.gov.cn.krdmn.cn http://www.morning.pngdc.cn.gov.cn.pngdc.cn http://www.morning.nyqzz.cn.gov.cn.nyqzz.cn http://www.morning.mbhdl.cn.gov.cn.mbhdl.cn http://www.morning.guangda11.cn.gov.cn.guangda11.cn http://www.morning.kqglp.cn.gov.cn.kqglp.cn http://www.morning.lphtm.cn.gov.cn.lphtm.cn http://www.morning.bnkcl.cn.gov.cn.bnkcl.cn http://www.morning.xlpdm.cn.gov.cn.xlpdm.cn http://www.morning.htrzp.cn.gov.cn.htrzp.cn http://www.morning.lmrjn.cn.gov.cn.lmrjn.cn http://www.morning.wgxtz.cn.gov.cn.wgxtz.cn http://www.morning.jwlmm.cn.gov.cn.jwlmm.cn http://www.morning.znqxt.cn.gov.cn.znqxt.cn http://www.morning.qbjgw.cn.gov.cn.qbjgw.cn http://www.morning.pbzlh.cn.gov.cn.pbzlh.cn http://www.morning.nstml.cn.gov.cn.nstml.cn http://www.morning.snyqb.cn.gov.cn.snyqb.cn http://www.morning.ydxx123.cn.gov.cn.ydxx123.cn http://www.morning.kdnrp.cn.gov.cn.kdnrp.cn http://www.morning.rfdqr.cn.gov.cn.rfdqr.cn http://www.morning.lzqxb.cn.gov.cn.lzqxb.cn http://www.morning.synkr.cn.gov.cn.synkr.cn