高端内存管理技术：提升系统性能的关键

作者：后起之秀 | 来源：互联网 | 2023-10-14 03:20

作者：文松链接：https:www.zhihu.comquestion280526042answer1615449221来源：知乎一、高

作者&＃xff1a;文松
链接&＃xff1a;https://www.zhihu.com/question/280526042/answer/1615449221
来源&＃xff1a;知乎

一、高端内存的由来&＃xff08;为什么需要高端内存&＃xff09;

在32位地址时代&＃xff0c;最大可寻址0xFFFFFFFF&＃xff0c;即4GB&＃xff0c;因此虚拟地址空间有4GB&＃xff0c;通常32位Linux内核地址空间划分0~3G为用户空间&＃xff0c;3~4G为内核空间&＃xff0c;即Linux内核虚拟地址空间只有1G。

32位地址空间

实际的计算机体系结构有硬件的限制&＃xff0c;这约束了页框的使用方式&＃xff0c;其中&＃xff0c;Linux内核必须处理x86体系结构的两种硬件约束&＃xff1a;

ISA总线的直接内存存取&＃xff08;DMA&＃xff09;处理器有一个严格的限制&＃xff1a;它们只能对RAM的前16MB地址进行寻址。
在具有大容量RAM的现代32位计算机中&＃xff0c;CPU不能直接访问所有的物理内存&＃xff0c;因为现行地址大小太小。

为了应对这种限制&＃xff0c;对于x86机器&＃xff0c;Linux内核将内存区域又被分为了3个管理区&＃xff08;zone&＃xff09;。

	区域
ZONE_DMA	低于16MB的内存空间
ZONE_NORMAL	16MB~895MB
ZONE_HIGHMEM	896MB~物理内存结束

在内核或应用程序访问内存时&＃xff0c;所操作的内存地址都为虚拟地址&＃xff0c;而对应到真正的物理内存地址&＃xff0c;需要地址一对一的映射。对于应用程序&＃xff0c;虚拟地址到物理地址的转换需要MMU&＃xff0c;而对于内核前两个管理区的内存空间被直接映射到虚拟地址空间中。

对于内核&＃xff0c;直接映射时虚拟地址0xc0000003对应的物理地址为0x00000003&＃xff0c;0xc0000004对应的物理地址为0x00000004。虚拟地址与物理地址有如下的对应关系&＃xff1a;

物理地址 &＃61; 虚拟地址 – 0xC0000000

在Linux内核中&＃xff0c;有虚拟地址向物理地址转换的宏&＃xff1a;

__virt_to_phys

也是直接通过上面的对应关系计算而来~

如果按照上面所说的采用直接映射的方式&＃xff0c;将内核1G的地址空间全部直接映射&＃xff0c;就会发现内核只能访问1GB的物理内存&＃xff0c;但是实际上我们的物理内存&＃xff0c;往往是8G、16G&＃xff0c;甚至更高&＃xff0c;那么其他空间内核将无法访问和管控。所以必须要有一种灵活的方式&＃xff0c;既减少开销&＃xff0c;同时又让内核能够访问全部的物理内存&＃xff0c;Linux高端内存十分必要。

Linux 规定“内核直接映射空间” 最多映射 896M 物理内存~

高端内存就是帮助我们访问除了直接映射的896MB物理内存之外的其他内存空间。

二、实现方式

内核是如何借助128MB高端内存地址空间是如何实现访问可以所有物理内存呢&＃xff1f;

在《深入理解LINUX内核》中介绍了&＃xff0c;内核可以采用三种不同的机制将页框映射到高端内存&＃xff0c;分别叫做&＃xff1a;

永久内存映射
临时内存映射
非连续内存分配

当内核想访问高于896MB物理地址内存时&＃xff0c;从0xF8000000 ~ 0xFFFFFFFF地址空间范围内找一段相应大小空闲的虚拟地址空间&＃xff0c;借用一会。

借用这段虚拟地址空间&＃xff0c;建立映射到想访问的那段物理内存&＃xff08;即填充内核PTE页面表&＃xff09;&＃xff0c;临时用一会&＃xff0c;用完后归还。这样别人也可以借用这段地址空间访问其他物理内存&＃xff0c;实现了使用有限的地址空间&＃xff0c;访问所有所有物理内存。

&＃43;&＃43;&＃43;&＃43;&＃43;&＃43;&＃43;&＃43;&＃43;&＃43;&＃43;&＃43;&＃43;&＃43;&＃43;&＃43;&＃43;&＃43;&＃43;&＃43;&＃43;&＃43;&＃43;&＃43;&＃43;&＃43;&＃43;&＃43;&＃43;&＃43;&＃43;&＃43;&＃43;&＃43;&＃43;&＃43;&＃43;&＃43;&＃43;&＃43;&＃43;&＃43;&＃43;&＃43;&＃43;&＃43;&＃43;&＃43;&＃43;&＃43;&＃43;&＃43;&＃43;&＃43;&＃43;&＃43;&＃43;&＃43;&＃43;&＃43;&＃43;&＃43;&＃43;&＃43;&＃43;&＃43;&＃43;&＃43;&＃43;&＃43;&＃43;&＃43;

&＃64;Swee Neil

的回答已经把core concept介绍清楚了&＃xff0c;我这边补充一些内容。

要理解high memory是要解决什么问题&＃xff0c;首先要了解下内核地址转换的方式。在内核中我们往往要频繁地进行虚拟/物理地址操作&＃xff0c;在这种情况下&＃xff0c;快速高效的virtual to physical转换就很重要。可如果按照多级页表path walk去查找&＃xff0c;内存访问开销就比较大&＃xff0c;因此一种简单的"fix-mapping"思路是&＃xff1a;将0xC0000000-0xFFFFFFFF的虚拟地址直接映射到0x00000000-0x3FFFFFFF&＃xff0c;也就是将最高的1G地址全部映射到最低的1G&＃xff0c;这样虚拟地址与物理地址之间就有固定的3G offset&＃xff0c;每当遇到一个内核中的符号&＃xff0c;我们需要得到其物理地址时&＃xff0c;直接减去3G即可。

有人可能会问&＃xff0c;那0-3G的比较低的那些虚拟地址怎么转换呢&＃xff1f;答案是不用&＃xff0c;也就是内核自己不使用0-3G的虚拟地址&＃xff08;除非是处理syscall&＃xff09;。

上述这种简单粗暴的处理方式很方便理解&＃xff0c;效率也比较高&＃xff08;只需要简单的减法操作&＃xff09;&＃xff0c;但也有自己的局限性。在32位处理器下&＃xff0c;按照经典用户态与内核3:1的划分比例&＃xff0c;内核能够使用的虚拟地址只有1G大&＃xff0c;按照固定offset的映射方式&＃xff0c;这意味着内核能够使用的物理地址大小也只有1G。但...随着内核越来越复杂&＃xff0c;各种数据结构对内存的需求也越来越高&＃xff0c;比如用来物理页的page结构体&＃xff0c;仅仅在其上增加一个12字节的reverse mapping管理结构&＃xff0c;就会使得page总体占用的内存增高400KB&＃xff0c;将近96个物理页大小[1]&＃xff1b;即便内存技术的发展使得高于4G的内存变得十分常见&＃xff0c;受限于32位系统与这种fix-mapping&＃xff0c;内核可用的物理内存大小仍然被死死地限制在1G。

以上&＃xff0c;算是对high memory要解决问题的背景介绍。通俗地讲&＃xff0c;"high memory"要解决的是32位下虚拟地址空间不足带来的问题&＃xff08;而显然&＃xff0c;对64位系统这个问题就不存在了&＃xff09;。实际上在很早以前这个问题就在lwn上讨论过了[2] &＃xff0c;在当时已经有一些临时的方法去规避这个问题&＃xff0c;比如重新划分用户/内核的地址空间比例&＃xff0c;变为2.5:1.5等等&＃xff0c;但在特定场景下&＃xff08;比如用户态使用的内存非常非常多&＃xff09;会使得用户态运行效率降低&＃xff0c;同时带来一些非对其问题&＃xff0c;因此也不是一个很好的办法。

怎么解决呢&＃xff1f;

如

&＃64;Swee Neil

所提到的&＃xff0c;我们可以把这1G&＃xff0c;划分成两部分&＃xff0c;一部分用来fix-mapping&＃xff0c;一部分用来dynamic-mapping。以x86为例&＃xff0c;实际中的做法是&＃xff0c;0xC0000000-0xF7FFFFFF的896MB用作fix-mapping&＃xff0c;0xF8000000-0xFFFFFFFF的128MB用作dynamic-mapping&＃xff0c;前者仍然对应于物理地址的0x00000000-0x37FFFFFF&＃xff08;只不过部分要优先分配给DMA&＃xff09;&＃xff1b;后者就是所谓的high memory。当然&＃xff0c;high memory也有自己的缺点&＃xff0c;就是效率比较低&＃xff08;既然是动态的&＃xff0c;就绕不开重映射、pte操作等等&＃xff09;。

实际上high memory还被划分为了3个区域[3]&＃xff0c;一部分用于vmalloc分配虚拟地址上连续的内存&＃xff0c;一部分用于较长期的动态映射&＃xff08;persistent kernel mappings&＃xff09;&＃xff0c;还有一部分用于编译时可以直接分配物理地址的高端固定映射&＃xff08;fixmaps&＃xff09;&＃xff1a;

x86_32的memlayout

来到64位系统&＃xff0c;这个问题天然就不存在&＃xff0c;因此在64位系统的memlayout[3]中就没有high memory&＃xff0c;但vmalloc仍然是内核的一个重要部分&＃xff0c;因此memlayout中仍然有这一部分&＃xff1a;

x86_64的memlayout

参考

^Kernel development LWN - Kernel
^Virtual Memory I: the problem Virtual Memory I: the problem [LWN.net]
^abMauerer, W. (2010). Professional Linux Kernel Architecture. Somerset: Wiley.

推荐阅读

layout
通过Anaconda安装tensorflow，并安装运行spyder编译器的完整教程

本文提供了一个完整的教程，介绍了如何通过Anaconda安装tensorflow，并安装运行spyder编译器。文章详细介绍了安装Anaconda、创建tensorflow环境、安装GPU版本tensorflow、安装和运行Spyder编译器以及安装OpenCV等步骤。该教程适用于Windows 8操作系统，并提供了相关的网址供参考。通过本教程，读者可以轻松地安装和配置tensorflow环境，以及运行spyder编译器进行开发。 ... [详细]

蜡笔小新 2023-12-09 09:46:32
layout
linux查看目录权限命令,linux修改文件目录权限

Linuxchmod目录权限命令图文详解在Linux文件系统模型中，每个文件都有一组9个权限位用来控制谁能够读写和执行该文件的内容。对于目录来说，执行位的作用是控制能否进入或者通过 ... [详细]

蜡笔小新 2023-12-14 19:06:22
jsp
CentOS 7部署KVM虚拟化环境之一架构介绍

本文介绍了CentOS 7部署KVM虚拟化环境的架构，详细解释了虚拟化技术的概念和原理，包括全虚拟化和半虚拟化。同时介绍了虚拟机的概念和虚拟化软件的作用。 ... [详细]

蜡笔小新 2023-12-12 21:38:57
java
java命令运行

Java在运行已编译完成的类时，是通过java虚拟机来装载和执行的，java虚拟机通过操作系统命令JAVA_HOMEbinjava–option来启 ... [详细]

蜡笔小新 2023-12-12 19:26:55
java
CEPH LIO iSCSI Gateway及其使用参考文档

本文介绍了CEPH LIO iSCSI Gateway以及使用该网关的参考文档，包括Ceph Block Device、CEPH ISCSI GATEWAY、USING AN ISCSI GATEWAY等。同时提供了多个参考链接，详细介绍了CEPH LIO iSCSI Gateway的配置和使用方法。 ... [详细]

蜡笔小新 2023-12-12 10:10:14
java
Centos7搭建ELK（Elasticsearch、Logstash、Kibana）教程及注意事项

本文介绍了在Centos7上搭建ELK（Elasticsearch、Logstash、Kibana）的详细步骤，包括下载安装包、安装Elasticsearch、创建用户、修改配置文件等。同时提供了使用华为镜像站下载安装包的方法，并强调了保证版本一致的重要性。 ... [详细]

蜡笔小新 2023-12-10 16:27:21
default
x265探索与研究（一）：x265下载安装与配置

本文记录了作者对x265开源代码的实现与框架进行学习与探索的过程，包括x265的下载地址与参考资料，以及在Win7 32 bit PC、VS2010平台上的安装与配置步骤。 ... [详细]

蜡笔小新 2023-12-10 14:05:27
java
JNI原理及常用方法概述

本文概述了JNI的原理以及常用方法。JNI提供了一种Java字节码调用C/C++的解决方案，但引用类型不能直接在Native层使用，需要进行类型转化。多维数组（包括二维数组）都是引用类型，需要使用jobjectArray类型来存取其值。此外，由于Java支持函数重载，根据函数名无法找到对应的JNI函数，因此介绍了JNI函数签名信息的解决方案。 ... [详细]

蜡笔小新 2023-12-09 17:55:40
java
在Windows10系统上使用VMware创建CentOS虚拟机的详细步骤教程

本文详细介绍了在Windows10系统上使用VMware创建CentOS虚拟机的步骤，包括准备条件、安装VMware、下载CentOS ISO文件、创建虚拟机并进行自定义配置、设置虚拟机的ISO与网络、进行安装和配置等。通过本文的指导，读者可以轻松地创建自己的CentOS虚拟机并进行相应的配置和操作。 ... [详细]

蜡笔小新 2023-12-09 09:09:21
web
如何使用PLEX播放组播、抓取信号源以及设置路由器

本文介绍了如何使用PLEX播放组播、抓取信号源以及设置路由器。通过使用xTeve软件和M3U源，用户可以在PLEX上实现直播功能，并且可以自动匹配EPG信息和定时录制节目。同时，本文还提供了从华为itv盒子提取组播地址的方法以及如何在ASUS固件路由器上设置IPTV。在使用PLEX之前，建议先使用VLC测试是否可以正常播放UDPXY转发的iptv流。最后，本文还介绍了docker版xTeve的设置方法。 ... [详细]

蜡笔小新 2023-12-09 01:31:00
go
微软头条实习生分享深度学习自学指南

本文介绍了一位微软头条实习生自学深度学习的经验分享，包括学习资源推荐、重要基础知识的学习要点等。作者强调了学好Python和数学基础的重要性，并提供了一些建议。 ... [详细]

蜡笔小新 2023-12-14 20:58:32
web
Nginx使用AWStats日志分析的步骤及注意事项

本文介绍了在Centos7操作系统上使用Nginx和AWStats进行日志分析的步骤和注意事项。通过AWStats可以统计网站的访问量、IP地址、操作系统、浏览器等信息，并提供精确到每月、每日、每小时的数据。在部署AWStats之前需要确认服务器上已经安装了Perl环境，并进行DNS解析。 ... [详细]

蜡笔小新 2023-12-14 19:42:01
testing
问题2：重新命名或者移动数据文件、日志文件到新的位置

本文讨论了在数据库打开和关闭状态下，重新命名或移动数据文件和日志文件的情况。针对性能和维护原因，需要将数据库文件移动到不同的磁盘上或重新分配到新的磁盘上的情况，以及在操作系统级别移动或重命名数据文件但未在数据库层进行重命名导致报错的情况。通过三个方面进行讨论。 ... [详细]

蜡笔小新 2023-12-13 13:02:24
testing
Python张量流中的device spec make_merged_spec()方法使用说明

本文介绍了在Python张量流中使用make_merged_spec()方法合并设备规格对象的方法和语法，以及参数和返回值的说明，并提供了一个示例代码。 ... [详细]

蜡笔小新 2023-12-11 12:15:19
testing
今日份分享：Flutter自定义之旋转木马

今日份分享：Flutter自定义之旋转木马-先上图，带你回到童年时光:效果分析子布局按照圆形顺序放置且平分角度子布局旋转、支持手势滑动旋转、快速滑动抬手继续旋转、自动旋转支持X轴旋 ... [详细]

蜡笔小新 2023-10-17 21:08:55

后起之秀

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章