磁盘数据如何加载到mysql中?

⼀般我们要更新⼀条数据,数据⼀开始肯定是存放在磁盘中的,⽤到时才会被加载到mysql,存放的数据在逻辑概念上我们称为表,物理层⾯上在磁盘中是按数据⻚形式存放的,那么加载到mysql中的就称为缓存⻚。

每个缓存⻚都有对应的⼀份描述信息,存放了缓存⻚的⼀些元数据相关的⼀些信息,通过描述信息可以快速定位到缓存⻚,最开始描述信息指向的缓存⻚当然都是空闲没有数据的,从磁盘加载数据⻚信息流程如下图所示:

那么从磁盘中加载⼀个数据⻚到mysql中真的就这么简单吗?会不会同⼀份数据⻚加载到mysql中出现重复加载的情况?如何快速知道当前数据⻚是否已经加载到mysql中了?

这时候可能很多⼈已经想到了:缓存。对于已经加载到mysql中的数据⻚,我们⼤可以设计⼀个缓存将加载过的数据⻚信息缓存⼀下,⼀⽅⾯可以防⽌同⼀份数据⻚重复加载到mysql,另⼀⽅⾯当我们需要使⽤到数据⻚的信息时,可以通过缓存信息快速定位mysql中对应的缓存⻚,没错,InnoDB存储引擎中就是按照这样的思路设计了⼀个数据⻚缓存:当⼀条update语句执⾏时,通过sql语句中的数据库名和表名解析可以知道我们需要加载的数据⻚处于哪个表空间,根据sql语句本身也可以通过⼀致性算法得数据⻚号(具体的sql解析和算法这⾥暂可简单了解下),根据数据⻚号和表空间号,可以从数据⻚缓存中(本质也就是⼀个哈希表)得到对应缓存⻚地址,通过缓存⻚地址我们直接就可以到InnoDB的缓冲池中定位到缓存⻚;当然,如果数据⻚还没有加载过,缓存⻚地址肯定是不存在,此时就需要从磁盘中加载数据⻚到mysql中了,如下图所示:

这个时候⼜有⼀个问题,既然现在我们已经知道磁盘中的数据⻚是加载到buffer pool缓冲池中的,那么我们怎么样才能知道哪些缓存⻚是空闲的?哪些缓存⻚是没有被加载过数据⻚信息的呢?毕竟加载过的数据的缓存⻚和没加载过数据的缓存⻚混在⼀起,倘若此时想找⼀个空闲的缓存⻚肯定也是⼀件很麻烦的事。InnoDB存储引擎在设计时当然也考虑到了这点,这⾥它引⼊了free链表这个数据结构,将那些还没有被使⽤的缓存⻚的描述信息⽤双向循环链表给组合在⼀起,需要⽤到时就卸⼀个节点出来存放数据⻚信息,如下图所示:

此时数据⻚被加载到缓存⻚了,缓存⻚中已经有数据了,相关的变动信息肯定也要回写到描述信息中,并且现在因为缓存⻚已经有数据,就不能再待在free链表中了,就需要将该缓存⻚对应的描述信息节点从free链表给摘掉,转移到了lru链表中,如下图所示:

lru链表实现的⽬的就是为让哪些被访问的缓存⻚能够尽量排到靠前位置,那么此时如果此时内存不够需要淘汰掉⼀些缓存⻚时,此时就可以到lru链表尾部,将哪些最近最少被访问的尾部节点给刷盘释放缓存⻚腾出内存来。

到这⾥为此,为了更新⼀个sql,我们已经把该sql所需要的数据、通过InnoDB存储引擎的各种底层机制,给加载到了Buffer Pool缓冲池中了,接下来就是在InnoDB中执⾏更新操作。

未经允许不得转载:任鹏个人博客 » 磁盘数据如何加载到mysql中?

赞 (0) 打赏

评论 0

取消
  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏