验证码发明人的天才故事
Luis von Ahn,卡内基梅隆大学计算机科学副教授,天才计算机科学家和企业家
01 调皮捣蛋、不循规蹈矩的青少年时代
1978年8月19日,Luis von Ahn出生在危地马拉首都危地马拉城的一个中产阶级家庭。
他是德国和危地马拉后裔,父母均是医生。因为父母收入在当地属于较高水平,
使Luis von在危地马拉这个发展中国家依旧可以接受良好的教育。
8岁时,他进入当地的一所私立英文学校学习,他的母亲送给他一台家用电脑
Commodore 64而不是他想要的“任天堂”。在没有互联网的时代,他通过
阅读手册、书籍和杂志慢慢学会了使用电脑。在好奇心的驱使下,他更想弄
明白电脑是如何运行工作的,孩提时代的他对科技和计算机产生了深深的迷恋。
在危地马拉的时光是快乐且短暂的,不久他便开始申请去美国读大学。即使他
成绩优异,但在申请美国大学时仍然面临着障碍。Luis von作为国际生,必须
通过申请美国大学的英语语言认证考试。1995 年,Luis von参加英语认证考
试时,危地马拉城的所有席位都已满,他只能飞往萨尔瓦多参加考试。这场英
语语言认证考试使Luis von花了 1200 美元,借此机会他亲眼目睹了财富是
如何决定教育机会的,意识到全世界有数百万人是负担不起昂贵的教育成本的。
02 一夜成名的研究生时期
基于优异的成绩和出色的表现,Luis von收到了杜克大学的录取通知书。2000年,
他在顺利获得了数学学士学位后,选择到卡内基梅隆大学计算机科学专业继续读博,
师从Manuel Blum。Manuel Blum曾获得计算领域的诺贝尔奖——图灵奖。
在刚开始读研究生的Luis von,参加了Yahoo研究员关于《我们无法解决的十大问题》
的主题讲座。在讲座中,研究员提到了一个让工作人员和邮箱使用者苦不堪言的问题,
很多不法分子利用电脑软件自动创建无数个邮箱帐户来发送垃圾广告。这个问题引起
了Luis von的注意,于是他开始思考如何解决这个问题。在他和导师Manuel Blum
的共同努力下,他们对这个问题有了初步的解决思路。他们认为,解决这个问题需要
满足两个条件,人类用户容易通过验证但电脑却无法通过,同时电脑能够准确判断
用户的回答是否正确的方法。
经过很多次反复的实验与验证,他们发现,人类可以用肉眼轻易地识别出在图片中、
被扭曲过、污染过的文字信息,而电脑无法辨识。在Manuel Blum的指导下,
Luis von很快设计了一个程序,将随机产生的字符串进行随机的扭曲、重叠、
污染后,显示给要进行操作的用户,只要能识别变形了的字符串,就是人类。
这个设计方案后来被命名为“CAPTCHA”(全自动公共图灵测试),也就是
大家熟知的“验证码”。
美国主流媒体《纽约时报》、《今日美国》等纷纷对这项开创性的技术进行了
报道,这让Luis von声名鹊起。在“验证码”技术推出后不到一周,雅虎公司
便采用了,不久,世界上几乎每个网站都开始使用。在中国,12306的验证
码,对我们的订票生活,产生的极大的影响力。
03 震动互联网的重大发明
Luis von并没有止步于发现“CAPTCHA”技术,他进一步深入探索这一领域
——“人类计算”。在博士论文中,Luis von阐述了“人类计算”的概念,
这就是耳熟能详的热门领域“众包”的前身。基于“人类计算”,Luis von
开发了一系列互联网的系统,包括可以将任务分成很多子任务分配给多人共
同完成的模式。其中,“有目的的游戏”(Games With A Purpose),是他
开发的多人在线游戏,当用户超出计算机能力的完成任务,将会改善互联网
图像和音频搜索,增强计算机人工智能功能。
他经过计算后发现,“CAPTCHA”机制的每次识别与输入大约需要花费
网民10秒钟的时间,而全球网民每天大概需要验证码的次数多达2亿多次,
这意味着浪费了全球网民的大量时间。
04 验证码的新应用
“那么如何更有效的利用广大网民的时间呢?”他结合了Marc的提议,
“为什么不向用户显示由系统扫描出的印刷文本图片,利用广大网民
完成老旧书报的数字化工作呢?”
他构建了带有reCAPTCHA的高效系统,一种类似于 CAPTCHA 的网
络安全工具。不同的是,该系统的验证码不但包含电脑随机生成的字符
串,还包含有一部分计算机无法识别的扫描文本中的扭曲单词,这些破
译的单词可以用于书籍、报纸、地图的数字化。互联网用户每天解码数
百万个“验证码”,相当于每天工作 500,000 小时。
2007年,Luis von基于reCAPTCHA的发明技术,成立了reCAPTCHA
公司。两年后,谷歌收购了这家公司,他也加入了谷歌工作。reCAPTCH
促进了谷歌图书项目每年约 200 万本书的数字化,及《纽约时报》追溯
至 1851 年大概1300 多万篇文章的数字化。这使以前仅在特定实体图书
馆地点提供阅览的历史作品,可以在网上广泛进行阅读,为历史研究工
作开辟了可能性。
05 验证码的全球化
验证码在中国的最有名的应用是买火车票,还有所有的网站登录应用。