转自:http://happyseeker.github.io/kernel/2016/03/01/about-Video-Memory.html
闲话
在从事图形优化工作之前,一直对显存(Video Memory)充满了好奇,很想了解其管理方式、基本原理、与内存的区别等,但一直没有时间和机会去研究,现在工作需要,逐渐开始接触和了解,这里也顺便记录,以免后续忘记。
什么显存?
显存,即Video Memory,简单来说,就是位于显卡的内存,其主要用途当然是用作图形显示了,现在的家用pc中基本都配置了独立显卡,即使是集成显卡,也有一定的显存,否则一些游戏玩起来可能就费劲了。
为什么需要显存?
随着计算机硬件的飞速发展,现代的CPU、内存能力已经超过了从前的想象,按理说,目前计算机中的主要瓶颈应该还在IO上,内存应该不至于成为瓶颈,那为什么需要显存呢?
这个问题就如“为什么需要显卡”一样,之前的文章中应该做了解释,所谓术业有专攻,显卡专注于图形显示,更擅长于图形显示,而显卡进行图形显示时是需要内存资源的,如果其所需的内存资源都从内存(CPU主存,后面简称内存)分配,那相对于使用显卡自带的内存,性能肯定有损耗。 这就跟NUMA节点中远程访问类似,虽然内存硬件本身的能力并不比显存弱,但“距离”、“亲疏关系”、“使用方式”等对其影响很大。
显存管理
在Linux X11环境中,显存通常是通过内核的DRM模块进行管理,用户态和内核程序都可以使用DRM提供的接口分配和释放显存。 用户态程序通过Libdrm提供的用户态接口(本质上为ioctl调用)来分配和释放显存。
DRM模块中,最终使用TTM模块在管理显存(或内存)。 TTM模块中,自己实现了一个内存pool,分配和释放显存(或内存)时,会先放到pool中,如此可以提高内存管理的效率,具体的原理和代码就不深入讨论了。
GTT VS. VRam
做过图形研究的TX应该都了解GTT和VRam,GTT表示显卡可以访问的CPU主存,VRam表示显存。 为什么要将这两者进行比较呢? 因为对于软件来说,GTT和VRam的地位是对等的,当软件中(比如mesa驱动中)需要分配内存时,其可以选择在内存上分配(分配标志设置为GTT相关的标记),也可以选择在显存上分配(分配标志设置为VRam相关的标记), 对于软件来说,使用GTT或VRam并没有功能上的影响,通常情况下,任意选哪种都没有问题。 有影响的只是:
- 性能。 对于显卡,通常来说,显示需要的内存在VRam上分配,性能可能会更好,因为相关内存上的内容最终可能都会拷贝到framebuffer中去,而在显存内存区域之间的拷贝,显然比内存到显存之间的拷贝性能更好。
- Cache一致性等问题。 对于部分硬件,Cache一致性问题可能是很多问题的根源,特别在涉及到CPU和GPU之间的同步和并发访问时。 CPU和GPU对于GTT和VRam的访问,可能会涉及到一些硬件的细节和特性,比如WC(Write Commbined)和UC(Uncached)特性,这些细节的处理,在非X86架构上尤其重要,特别是在驱动中,需要时刻考虑这些问题。
Framebuffer
再简单聊下Framebuffer(后面有时间可单独再聊),Framebuffer本质上就是一段缓存,通常就是显存上的一段内存,其直接与最终显示到终端上的内容对应,所有需要显示到终端上的图形内容都必须拷贝到Framebuffer中。
Framebuffer其实由多个buffer组成,这里不详述。 但需要说明,通常Framebuffer中有前端和后端两类buffer,就是我们平常见到的double buffer技术,目的是为了解决屏幕撕裂问题。 前端buffer直接对应于欲显示的内容,需要显示的数据先拷贝到后端buffer,再在一定的时机(比如vblank)将后端buffer的数据swap到前端,从而显示出来。