从硬件角度看Linux的内存管理

news/2024/7/8 6:26:38 标签: Linux

1. 分页机制

分段机制的地址映射颗粒度太大,以整个进程地址空间为单位的分配方式导致内存利用率不高。

分页机制把这个分配机制的单位继续细化为固定大小的页(Page),进程的虚拟地址空间也按照页来分割,这样常用的数据和代码就可以以页为单位驻留在内存中。而那些不常用的页可以交换到磁盘,从而节省物理内存,这比分段机制要高效很多。  

进程以页为单位的虚拟内存通过CPU的硬件单元映射到物理内存中,物理内存也是以页为单位来管理,这些物理页称为物理页面(Physical Page)或者页帧(Page Frame)。进程虚拟地址空间的页,我们称为虚拟页(Virtual Page)。操作系统为了管理这些帧需要按照物理地址顺序给每个页编号,叫作页帧号(Page Frame Number, PFN)。

分页机制的实现离不开硬件的实现,在CPU内部专门有一个硬件单元来负责这个虚拟页面到物理页面的转换,它就是一个称为内存管理单元(Memory Mangement Unit, MMU)的硬件单元。ARM处理器的内存管理单元包括TLB(translation lookaside buffer)和页表遍历单元(Table Walk Unit)两个部件。

  • TLB是一块高速缓存(Cache),用于缓存页表转换的结果,从而减少内存访问的时间。

一个完整的页表翻译和查找的过程叫作页表查询(Translation Table Walk),页表查询的过程由硬件自动完成,但是页表的维护需要软件来完成。页表查询是一个相对耗时的事情,理想的状态是TLB里面缓存有页表转换的相关信息。当TLB未命中时,才会去查询页表,并且开始读入页表的内容。ARM内存管理架构如下所示:

2. 页表

ARM32的虚拟地址VA[31:0]可以分成两部分:一部分是虚拟页面内的偏移量,以4KB页为例,VA[11:0]是虚拟页面内的偏移量;另一部分用来确定属于哪个页,我们称其为虚拟页帧号(Virtual Page Frame Number, VPN)。对于物理地址,也是类似的,PA[11:0]表示物理页帧的偏移量,剩余部分表示物理页帧号(Physical Frame Number, PFN) 。MMU的工作内容就是把VPN转换成PFN。处理器通常使用一张表来存储VPN到PFN的映射关系,这个表称为页表(Page Table, PT(进程都有自己独立的页表))。页表中每一个表项称为页表项(Page Table Entry, PTE)。 若将整张页表存放在寄存器中,则会占用很多硬件资源, 因此通常的做法是把页表放在主内存里,通过页表基地址寄存器(Translation Table Base Register, TTBR)来指向这种页表的起始地址。页表查询过程如图所示。处理器发出的地址是虚拟地址,通过MMU来查询页表,处理器得到了物理地址,最后把物理地址发送给内存控制器,从而访问物理页面。

3. 虚拟地址到物理地址的转换

下图展示了ARM32二级页表的查询过程,以4KB页为例,VA[31:20]用作一级页表的索引值,共有12位,最多可以索引4096个页表项;VA[19:12]用作二级页表的索引值,共有8位,最多可以索引256个页表项。当操作系统复制一个新进程时,首先会创建一级页表,分配16KB页面。本场景中,一级页表有4096个页表项,每个页表项占4字节,因此一级页表大小是16KB。当操作系统准备让该进程执行时,设置一级页表在物理内存中的起始地址到页表基地址寄存器中。进程执行过程中需要访问物理内存,因为一级页表的页表项是空的,这会触发缺页异常。在缺页异常里分配一个二级页表,并且把二级页表的起始地址填充到一级页表的相应页表项中。接着,分配一个物理页面,并把这个物理页面的帧号填充到二级页表的对应页表项中,从而完成页表的填充。随着进程的执行,它需要访问越来越多的物理内存,操作系统会逐步地把页表填充和建立起来。

当TLB未命中(Miss)时,处理器查询页表的过程如下图所示:

  • 处理器根据页表基地址控制寄存器TTBCR和虚拟地址来判断使用哪个页表基地址寄存器,是TTBR0和TTBR1。页表基地址寄存器中存放着一级页表的基地址。
  • 处理器根据虚拟地址的bit[31:20]作为索引值,在一级页表中找到页表项。一级页表一共有4096个页表项。
  • 一级页表的页表项中存放有二级页表的物理基地址。处理器将虚拟地址的bir[19:12]作为索引值,在二级页表中找到相应的页表项。二级页表有256个页表项。
  • 二级页表的页表项里面存放有4KB页的物理基地址,因此处理器就完成了页表的查询和翻译工作。

Note:

一级页表相当于把一本书缩小成几页的目录,通过目录来查询书的内容。但是有个问题,如果书非常厚,目录页非常多,那自然而然可以继续分,把一级目录当成一本教材,再建立一个目录,二级页表由此诞生,就是把页表当成教程,再建立页表。  


http://www.niftyadmin.cn/n/5536731.html

相关文章

Oracle PL / SQL 存储过程

PL / SQL存储过程不返回值。他们执行他们的指示并返回。您不能在赋值语句(如函数)的右侧使用存储过程。 创建存储过程 以下代码是一个非常简单的存储过程示例。 它基于SYS.DBMS_LOCK包的程序sleep(数量)。 此存储过程将停止执行…

【AI原理解析】—k-means原理

目录 步骤 注意事项 优点 缺点 步骤 初始化: 选择 k 个初始质心(通常通过随机选择数据集中的 k 个点作为初始质心)。迭代过程: 分配数据点到最近的质心: 对于数据集中的每个数据点,计算它与 k 个质心之…

【C语言入门】初识C语言:掌握编程的基石

📝个人主页🌹:Eternity._ ⏩收录专栏⏪:C语言 “ 登神长阶 ” 🤡往期回顾🤡:C语言入门 🌹🌹期待您的关注 🌹🌹 ❀C语言入门 📒1. 选择…

FPGA基本资源介绍

文章目录 FPGA资源介绍1.可编程输入输出单元(IOB)2.可配置逻辑块(CLB)3.数字时钟管理模块(DCM)4.嵌入式块RAM(BLOCK RAM / BRAM)4.1其他ram 5.丰富的布线资源6.底层内嵌功能单元7.内嵌专用硬核软核、硬核、以及固核的概念 FPGA资源介绍 1.可编程输入输出单元(IOB) 可编程输入…

引领汽车软件开发走向ASPICE认证之路

亚远景科技与ASPICE认证的关系可以从以下几个方面来阐述: (要明确的是:在ASPICE行业中专业来说,ASPICE项目是没有认证,而只有评估。不过,为了方便沟通,人们常将这一评估过程称为认证。) 行业专…

面向6G全域融合的智能接入关键技术综述

源自:电子与信息学报 作者:王雪, 孟姝宇, 钱志鸿 注:若出现无法显示完全的情况,可 V 搜索“人工智能技术与咨询”查看完整文章 摘 要 针对空天地一体化接入网络,该文在总结相关研究的基础上,阐述了…

探索PcapPlusPlus开源库:网络数据包处理与性能优化

文章目录 0. 本文概要1. PcapPlusPlus介绍1.1 概述1.2主要特性和功能1.3 PcapPlusPlus 主要模块关系和依赖1.4 网络协议层处理过程 2. 实例2.1 基于 PcapPlusPlus 的应用程序设计和封装流程:2.2 多线程示例代码2.3 代码说明: 3. 程序性能进一步优化3.1 避…

线性代数|机器学习-P21概率定义和Markov不等式

文章目录 1. 样本期望和方差1.1 样本期望 E ( X ) \mathrm{E}(X) E(X)1.2 样本期望 D ( X ) \mathrm{D}(X) D(X) 2. Markov 不等式&Chebyshev不等式2.1 Markov不等式公式 概述2.2 Markov不等式公式 证明:2.3 Markov不等式公式 举例:2.4 Chebyshev不…