字幕是指电影、电视,以及戏剧、歌剧等舞台作品中出现的各种用途的文字。如版权标识、片名字幕、演(职)员表、说明字幕、歌词字幕、对白字幕等。这些字幕按照影片放映时出现的先后顺序而分为片头字幕、片间字幕和片尾字幕。一般情况下,片头、片尾字幕叠印在画面上,而对白、歌词等字幕一般出现在屏幕下方,戏剧等舞台伤口则显示于舞台两侧或上方。
字幕的作用,主要是将语音内容以文字方式显示,以帮助听力较弱的观众理解节目内容。另外,对于不同语言的观众,只有通过字幕才能了解影片内容。而在中国,不同地区语言的发音差别很大,不能正确理解普通话的人很多。但是文字写法的差异并不大,看到普通话的文字后人们大都都能理解。所以,近年来华语圈的影视作品中,对应普通话(或方言)的字幕大多被附加在节目中。
一、字幕种类
根据字幕应用方式,可分为硬字幕、软字幕及外挂字幕。
硬字幕,是将字幕覆盖叠加在视频画面上。因为这种字幕与视频画面溶于一体,所以具有最佳的兼容性,只要能够播放视频,就能显示字幕,对于现阶段的手机、MP4播放器而言,只支持这类型的字幕。缺点是字幕占据视频画面,破坏了视频内容,而且不可取消、不可编辑更改。
外挂字幕,将字幕单独做成一个文件,字幕文件有多种格式。这类字幕的优点是不破坏视频画面,可随时根据需要更换字幕语言,并且可随时编辑字幕内容。缺点是播放较为复杂,需要相应的字幕播放工具支持。
软字幕,是指通过某种方式将外挂字幕与视频打包在一起,下载、复制时只需要复制一个文件即可。如DVD中的VOB文件,高清视频封装格式MKV、TS、AVI等。这类型文件一般可以同时封装多种字幕文件,播放时通过播放器选择所需字幕,非常方便。在需要的时候,还可以将字幕分离出来进行编辑修改或替换。
二、字幕格式
从上面的解释可以看出,字幕可分为片名、标识等说明性字幕,及对白等帮助理解内容的语言字幕。对于视频制作时出现的片名、说明性字幕,一般在影视后期制作时叠加到了视频画面中,没有什么格式可言。这里所说的格式,是指现在网络上流传的影视对白字幕。
目前比较流行的字幕格式,分为图形格式和文本格式两类。
图形格式字幕:
由idx和sub文件组成,有时也能看到ifo文件,不过这个现在已经不怎么用的上了。idx相当于索引文件,里面包括了字幕出现的时间码和字幕显示属性等,sub文件就是存放字幕本身了,注意是图片格式的,所以比较大,动辄10M以上了。idx+sub可以存放很多语言的字幕,提供了在播放的时候的选择。
文本格式字幕:
比较流行的文本字幕有srt、ssa、smi格式,因为是文本格式,所以就比较小了,一般大不过百来k。
SRT格式
SRT(Subripper)是最简单的文本字幕格式,后缀名为.srt,其组成为:一行字幕序号,一行时间代码,一行字幕数据如:
45
00:02:52,184 --> 00:02:53,617
慢慢来
这表示:第45个字幕,显示时间从该影片开始的第2分52.184秒到第2分53.617秒,内容为:慢慢来
SSA、ASS格式
SSA(Sub Station Alpha)是为了解决SRT过于简单的字幕功能而开发的高级字幕格式其扩展名为.SSA。采用SSA V4脚本语言,能实现丰富的字幕功能,除了能设定不同字幕数据的大小和位置外,更能实现动态文字和水印等复杂的功能。ASS(Advanced SubStation Alpha)其实是更高级的SSA版本,采用SSA V4+脚本语言编写。
SMI格式
SMI(Sami),其扩展名为.smi,是Windows Media Player专用字幕文件格式,如果在播放的文件目录中有格式正确且与歌曲同名的SMI文件,那么WMP都会识别。SMI和SRT一样都是文本字幕格式,可以用记事本或者E-Lyric打开进行编辑。
三、字幕转换
不同格式之间的字幕可以相互转换。
其中文本字幕之间的转换,以及文本字幕转换为图形字幕都比较简单,因为都是本身都是文本文件,改变比较容易。
而图形字幕转换为文本字幕,则比较困难,需要通过OCR或手工重新输入。OCR英文字幕不难,英文识别难度要小得多。OCR中文难度就大一些,所用的软件个头也不小(SubOCR,30多M)。