在了解word文档的原理之前,先了解记事本原理。
记事本原理
记事本原理:文件以二进制数据在文件中储存,前几位为编码机制,标识记事本采用了哪一种字符集,后面按照固定位数读取。任何文件的开头都先指定编码,再根据编码存它们的二进制,存进硬盘。
输入:输入法输入的时候输的就是编码,每一个拼音对应很多编码,然后编码在形状库对比,显示出不同的字符供选择,我们选择后在记事本中存的就是编码。
读取:读取时,先读头部的编码确定是哪种编码,根据编码类型决定每次读几位,每种编码都有各自的形状库,选择形状库,再根据编码类型决定每次读几位,然后和他们的形状库对比,将数据从内存传到显示器,显示器显示出字符。
记事本打开的时候就有一个默认编码,另存的时候就是编码之间做置换另存在硬盘中。
Word的实现原理
Word的实现原理其实和记事本非常类似,只不过他们加了非常多的辅助技能以及加装了字体库,这样一来文本信息不止步于基础的编码,每一种基础的语言编码不再有单调的形状,而是具有了很多的扩展形状,Word可以对我们键入的编码进行修饰,进而改造成字体库中字体编码可以识别的编码,进而使用字体库中的其他字体的编码进行解码,这样一来就可以解码出更加有趣的形状,如同样的汉字,就可以有宋体楷体以及微软雅黑等不同的形状。
Word采用了矢量计算的方式解决这个问题,也就是说直接对点阵信息进行函数计算,让它表现出各种样式,而不是真的为其设计一款自己的点阵信息,也就是说某个字可能只有一个点阵形状,它对应的其他形状的编码并没有自己的点阵信息来对应,有的只是一个矢量计算函数,这个函数可以让这个点阵信息在不失真的情况下发生各种颜色变化以及形变,进而进一步节省了空间。