Mysql索引底层数据结构与算法

Wesley13
• 阅读 607

索引是什么

  • 索引是帮助MySQL高效获取数据的排好序的数据结构。

  • 索引存储在文件里

  • 补充知识:

    磁盘存取原理:

    • 寻道时间(速度慢,费时)
    • 旋转时间(速度较快)

    磁盘IO读取效率:

    • 单次IO读取是N个页的大小,读取数据量大于N个页就需要分页读取。
  • 索引的数据结构

    • 二叉树
      • 有可能出现worst-case,如果输入序列已经排序,则时间复杂度为O(N)
    • 红黑树
      • 解决了二叉树的缺点,但是在数据量大的情况下,会出现分层很深的情况,影响查询效率。
    • hash
      • 查询效率很高,但是无法实现范围查询
    • B树
      • 【特点】度(Degree)-节点的数据存储个数
      • 【特点】叶节点具有相同的深度
      • 【特点】叶节点的指针为空
      • 【特点】节点中的数据key从左到右递增排列
      • 【缺点】每个节点存储key+具体数据,而度涉及到IO读取,故如果度设计的很大就会影响IO读取效率。由于该限制,只能限制度的大小,使得深度无法控制。
    • B+树
      • 非叶子节点不存储data,只存储key,可以增大度
      • 叶子节点不存储指针
      • 顺序访问指针,提高区间访问的性能
      • 优点
        • 一般使用磁盘I/O次数评价索引结构的优劣
        • 预读:磁盘一般会顺序向后读取一定长度的数据(页的整数倍)放入内存
        • 局部性原理:当一个数据被用到时,其附近的数据也通常会马上被使用
        • B+Tree节点的大小设为等于一个页,每次新建节点直接申请一个页的空间,这样就保证一个节点物理上也存储在一个页里,就实现了一个节点的载入只需一次I/O
        • B+Tree的度d一般会超过100,因此h非常小(一般为3到5之间)
        • 【最佳实践】使用自增的主键
          • a.自增型主键以利于插入性能的提高;
          • b.自增型主键设计(int,bigint)可以降低二级索引的空间,提升二级索引的内存命中率;
          • c.自增型的主键可以减小page的碎片,提升空间和内存的使用。

存储引擎

  • 存储引擎是表的属性。
  • MyISAM是非聚集的索引实现
    • 索引文件和数据文件是分开的两个文件
    • 索引中叶子节点存储的是数据的地址
      • 主键索引和其他索引都是一样的,叶子节点指向的是数据文件中对应的地址
  • InnoDB是聚集的索引实现
    • 索引和数据在同一个文件中
    • 数据的存储是建立在主键索引结构中,叶子节点是具体的数据。故必须要有主键
    • 其他索引的叶子节点是主键的值
    • 【好处】一致性和节省存储空间

转自:https://www.cnblogs.com/xxxuwentao/p/9769942.html

点赞
收藏
评论区
推荐文章
blmius blmius
3年前
MySQL:[Err] 1292 - Incorrect datetime value: ‘0000-00-00 00:00:00‘ for column ‘CREATE_TIME‘ at row 1
文章目录问题用navicat导入数据时,报错:原因这是因为当前的MySQL不支持datetime为0的情况。解决修改sql\mode:sql\mode:SQLMode定义了MySQL应支持的SQL语法、数据校验等,这样可以更容易地在不同的环境中使用MySQL。全局s
添砖java的啾 添砖java的啾
3年前
distinct效率更高还是group by效率更高?
目录00结论01distinct的使用02groupby的使用03distinct和groupby原理04推荐groupby的原因00结论先说大致的结论(完整结论在文末):在语义相同,有索引的情况下groupby和distinct都能使用索引,效率相同。在语义相同,无索引的情况下:distinct效率高于groupby。原因是di
皕杰报表之UUID
​在我们用皕杰报表工具设计填报报表时,如何在新增行里自动增加id呢?能新增整数排序id吗?目前可以在新增行里自动增加id,但只能用uuid函数增加UUID编码,不能新增整数排序id。uuid函数说明:获取一个UUID,可以在填报表中用来创建数据ID语法:uuid()或uuid(sep)参数说明:sep布尔值,生成的uuid中是否包含分隔符'',缺省为
待兔 待兔
5个月前
手写Java HashMap源码
HashMap的使用教程HashMap的使用教程HashMap的使用教程HashMap的使用教程HashMap的使用教程22
Jacquelyn38 Jacquelyn38
3年前
2020年前端实用代码段,为你的工作保驾护航
有空的时候,自己总结了几个代码段,在开发中也经常使用,谢谢。1、使用解构获取json数据let jsonData  id: 1,status: "OK",data: 'a', 'b';let  id, status, data: number   jsonData;console.log(id, status, number )
Wesley13 Wesley13
3年前
mysql设置时区
mysql设置时区mysql\_query("SETtime\_zone'8:00'")ordie('时区设置失败,请联系管理员!');中国在东8区所以加8方法二:selectcount(user\_id)asdevice,CONVERT\_TZ(FROM\_UNIXTIME(reg\_time),'08:00','0
Wesley13 Wesley13
3年前
mysql5.6 分页查询优化
mysql5.6分页查询优化场景:表结构:主键(非自增)contentCode(varchar),过滤条件列为updateTime(timeStamp),已经为timestamp建立索引。搜索sql为:SELECTFROMmy_hello_tableWHEREupdat
Wesley13 Wesley13
3年前
MySQL部分从库上面因为大量的临时表tmp_table造成慢查询
背景描述Time:20190124T00:08:14.70572408:00User@Host:@Id:Schema:sentrymetaLast_errno:0Killed:0Query_time:0.315758Lock_
为什么mysql不推荐使用雪花ID作为主键
作者:毛辰飞背景在mysql中设计表的时候,mysql官方推荐不要使用uuid或者不连续不重复的雪花id(long形且唯一),而是推荐连续自增的主键id,官方的推荐是auto_increment,那么为什么不建议采用uuid,使用uuid究
Python进阶者 Python进阶者
11个月前
Excel中这日期老是出来00:00:00,怎么用Pandas把这个去除
大家好,我是皮皮。一、前言前几天在Python白银交流群【上海新年人】问了一个Pandas数据筛选的问题。问题如下:这日期老是出来00:00:00,怎么把这个去除。二、实现过程后来【论草莓如何成为冻干莓】给了一个思路和代码如下:pd.toexcel之前把这