在《图解|Linux大内存页原理》一文中,我们介绍过标准大页的原理与其优点,现在我们回顾一下标准大页有哪些优点:


(相关资料图)

减少转译后备缓冲区(Translation Lookaside Buffer,TLB)的失效情况,TLB 是 CPU 为了加速虚拟内存地址转换成物理内存地址而增加的缓冲区。减少页表的内存消耗。减少缺页异常(page fault)发生的次数,缺页异常处理例程需要对虚拟内存地址进行映射,而这个映射过程也是一个耗时的过程。

可以看出,使用大页能够加速系统的运行效率。

但是标准大页使用起来比较麻烦,需要挂载 Hugetlb 文件系统,并且需要使用 mmap 系统调用来对大页进行映射。为了解决标准大页使用麻烦的问题,红帽子(Red Hat)公司开发出透明大页(Transparent Huge Pages,THP)功能。

要使用透明大页功能,只需要使用以下命令开启即可:

echoalways>/sys/kernel/mm/transparent_hugepage/enabled

开启了透明大页功能后,内核将会创建一个名为khugepaged的内核线程。

khugepaged内核线程会不断扫描进程的虚拟内存空间(vma,virtual memory area),如果发现存在 2MB 地址连续的虚拟地址空间,那么判断其是否满足转换成大页的条件,如果满足则将这些物理内存合并成一个大页。如下图所示:

相对于使用繁琐的标准大页,透明大页显得更加友好。

透明大页原理

操作系统管理内存时,是以页作为单位的,常用的页大小有4KB、2MB和1GB。4KB 的内存页被称为普通内存页,而 2MB 和 1GB 的内存页被称为大页。

通常来说,4KB 的内存页使用频率最多,但有时候为了减少缺页异常发生的次数(提升程序的性能),所以会使用 2MB 或者 1GB 的内存页来代替 4KB 的内存页。

透明大页核心思想

透明大页的核心思想很简单:不断扫描进程的虚拟内存区间(vma),如果发现大小超过 2MB 的内存区间,将会判断其是否满足转换成大页的条件,如果满足则将这些物理内存合并成一个大页。

我们知道每个进程都有一个 mm_struct 结构,用来管理进程的虚拟内存空间和映射物理地址的页表等信息,而虚拟内存的区间是通过 vm_area_struct 结构(vma)来管理的。

透明大页的核心逻辑步骤:

查找满足转换成大页的内存区间

khugepaged内核线程会扫描进程的虚拟内存空间,如果发现内存区间大于等于 2MB,并且满足转换成大页的条件,那么将会进入下面的步骤。

推荐内容