1 第一个阶段:为战争而发展的计算机器
1.1 问题描述
面对全球冲突,一帮数学家开始致力于尽可能快地解决复杂数学问题。冲突双方都会通过无线电发送命令和战略信息,而这些信号也可能被敌方截获。为了防止信息泄露,军方会对信号进行加密,而能否破解敌方编码关乎着成百上千人的性命,自动化破解过程显然大有裨益。
1.2 解决方案
到第二次世界大战结束时,人们已经制造出了两台机器,它们可以被看作是现代计算机的源头。
- 一台是美国的电子数字积分计算机(ENIAC),它被誉为世界上第一台通用电子数字计算机;
- 另一台是英国的巨人计算机(Colossus)。
图1 世界上第一台通用计算机ENIAC
这两台计算机都不能像今天的计算机一样进行编程,配置新任务时需要进行移动电线和推动开关等一系列操作。
2 第二个阶段:通用计算机
2.1 问题描述
专用的计算机:计算机几乎存在于所有的电子设备当中,通常只是因为它比其他选项都要便宜。例如普通的烤面包机本来并不需要计算机,但比起采用乱七八糟一堆组件,只用一个简单的成分就可以实现所有功能还是比较划算的。
计算机不是唯一能操纵信息的机器。当你用简单的计算器来运算一组数字时,就是在输入信息(数字),处理信息(如计算连续的总和),然后输出信息(如显示)。另一个简单的例子是油泵,给油箱加油时,油泵利用当前每升汽油的价格和来自传感器的信号,读取汽油流入油箱的速率,并将这些数据转换为加了多少汽油和应付多少钱的信息。但是,计算器或油泵并不是完整的计算机,它们只是被构建来执行特定的任务。
这类计算机的特点:
- 运行速度不同、体积大小不一,但从根本上讲,它们的功用都是一样的;
- 大部分只能在工厂进行一次编程,这样做是为了对运行的程序进行加密,同时降低可能因改编程序引起的售后服务成本;
这类计算机无法满足人们玩计算机游戏,或写文章、在线购物、听音乐、通过社交媒体与朋友联系、预测天气、设计飞机、制作电影、经营企业、完成金融交易和控制工厂等。
2.2 解决方案
通用计算机:作为一种通用的信息处理机器,电子计算机通称电脑,它能够执行被详细描述的任何过程,其中用于描述解决特定问题的步骤序列称为算法,算法可以变成软件(程序),确定硬件(物理机)能做什么和做了什么。创建软件的过程称为编程。
现代计算机可以被定义为“在可改变的程序的控制下,存储和操纵信息的机器”。定义有两个关键要素:
- 第一,计算机是用于操纵信息的设备。这意味着可以将信息存入计算机,计算机将信息转换为新的、有用的形式,然后显示或以其他方式输出信息。
- 第二,计算机在可改变的程序的控制下运行。
在计算机的帮助下,人们可以设计出更有表现力、更加优雅的语言,并指示机器将其翻译为读取—执行周期能够理解的模式。
图2 中国的超级计算机“天河二号”
中国的第一台电子计算机诞生于1958年。在2021年6月29日公布的全球超算500强榜单中,中国共有186台超级计算机上榜,连续第8次蝉联全球拥有超算数量最多的国家。
3 第三个阶段:人工智能
3.1 问题描述
信息社会所带来的好处是显而易见的:每个人口袋里都揣着一部手机,每台办公桌上都放着一台电脑,每间办公室内都连接到局域网或者互联网。半个世纪以来,随着计算机技术全面和深度地融入社会生活,信息爆炸已经积累到了一个引发变革的程度。它不仅使世界充斥着比以往更多的信息,而且其增长速度也在加快。信息总量的变化还导致了信息形态的变化——量变引起了质变。
量变导致质变。物理学和生物学都告诉我们,当改变规模时,事物的状态有时也会发生改变。以专注于把东西变小而不是变大的纳米技术为例,其原理就是当事物到达分子级别时,它的物理性质会发生改变。一旦你知道这些新的性质,就可以用同样的原料来做以前无法做的事情。铜本来是用来导电的物质,但它一旦到达纳米级别就不能在磁场中导电了。银离子具有抗菌性,但当它以分子形式存在时这种性质会消失。同样,当我们增加所利用的数据量时,也就可以做很多在小数据量的基础上无法完成的事情。
大数据的科学价值和社会价值正是体现在这里。一方面,对大数据的掌握程度可以转化为经济价值的来源。另一方面,大数据已经撼动了世界的方方面面,从商业科技到医疗、政府、教育、经济、人文以及社会的其他各个领域。尽管我们还处在大数据时代的初期,但我们的日常生活已经离不开它了。
从机械思维到数据思维:对于整个社会来说,大数据不仅仅是一种技术革命,更是一种由技术而引发的思维革命。在社会影响力上,只有始于英国的工业革命、始于德国和美国的二次工业革命、以及“二战”后摩尔定律带来的信息革命能够与其相比。而对人类认识世界的方法上,只有引发工业革命的机械思维能够与之相匹配。我们来看看将人类带入现在社会,并影响了人类几个世纪的机械思维是什么?
机械思维:
- 人们可能会将其与死板、僵化、落伍等贬义词联系在一起,但是在过去的三个多世纪里面,机械思维可以算得上是人类总结出的最重要的思维方式;
- 对机械思维做出最大贡献的是科学家牛顿,他用几个简单而优美的公式破解了自然之谜。持机械思维的科学家们认为,世界确定无疑,就像一个精密的钟表,依据几个简单公式可以推算事物未来发展变化的趋势。据说时至今日,仍然可以利用牛顿的理论,精确地预测出一千年后日食和月食的时间;
- 机械思维是欧洲之所以能够在科学上领先于世界的重要原因,其核心方法论是笛卡尔建立的“通过正确的证据、正确的推理、得到正确的结论”的科研方法,概括地说,就是“大胆假设,小心求证”。这种思维方式造就了从欧几里得到托勒密再到牛顿等一位位科学巨匠,将人类带入科学时代,让人们相信世界万物的运动遵循着某种确定性的变化规律,而这些规律又是可以被认知的,给人类带来了前所未有的自信。
图3 牛顿的《自然哲学之数学原理》
机械思维以及因其而发明的各种各样的机械,直接导致了人类迄今为止最伟大的事件——工业革命,极大地增加了社会财富、延长了人类寿命,为人类文明带来了前所未有的进步,其核心思想是:
- (1)世界变化的规律是确定的;
- (2)因为有确定性做保证,因此规律不仅是可以被认知的,而且可以用简单的公式或者语言描述清楚;
- (3)这些规律应该是放之四海皆准的,可以应用到各种未知领域来指导实践。
概括来说,机械思维就是确定性(可预测性)和因果关系。牛顿可以把所有天体运动的规律用几个定律讲清楚,并且应用到任何场合都正确,这就是确定性。类似地,当我们给物体施加一个外力时,它就获得一个加速度,而加速度的大小取决于外力和物体本身的质量,这是一种因果关系。机械思维的所有逻辑都建立在确定性的基础上,这个基础的正确性就决定了机械思维的适用性。
但是,人们发现,这个世界是确定的,也充满了不确定性。
对于不确定性最好的例子就是股市预测。如果统计一下各种专家对股市的预测,会发现它们基本上是对错各一半(巴菲特甚至用猴子来比喻这些投资专家)。这一方面是由于影响股市的因素太多,即使是最好的经济学家也很难将这些因素都研究透彻,有太多的不确定因素是他们考虑不到的,因此无法准确预测市场。再加上还有很多因素是目前人们尚未发现的,或者发现了但是被忽略了,这就使得预测的准确率进一步下降。事实上,美国大部分基金的投资回报率并没有市场的平均值高,这也在很大程度上证明了世界的不确定性。
图4 股票预测
预测活动本身也影响了被测量的结果,当有人按照某个理论买或卖股票时,其实给股市带来了一个相反的推动力,导致股市在微观上的走向和理论预测的方向相反,从而也推动了股市的不可预测性。
这就是世界不确定性的两个主要来源。首先,当我们对这个世界的方方面面了解得越细致后,会发现影响世界的变量其实非常多,已经无法通过简单的方法或者公式算出结果,因此我们宁愿采用一些针对随机事件的方法来处理,人为地把它归为不确定的一类。
另一个因素来自客观世界本身,它是宇宙的一个特性。在宏观层面,行星围绕恒星运动的速度和位置是可以计算得很准确的,从而可以画出它的运动轨迹。但是在微观世界里,电子在围绕原子核做高速运动时,我们不可能准确的测定出它在某一时刻的位置和运动速度,当然也就不能描绘它的运动轨迹了。
要解决不确定性问题,这在过去可能很难,因为不确定性因素太多,确定它的成本太高且收益并没有想象中的那么大。得益于由摩尔定律带来的信息革命,从数据的产生、存储、传输和处理各个环节的成本都极大的降低,数据量呈现出爆炸性增长,使得收集各个维度的数据成为可能,这就为解决不确定性问题奠定了基础。
概括的来讲,利用信息来消除不确定性,就是用不确定性的眼光看待世界,再用信息消除不确定性,将很多智能问题转化为信息处理问题。具体到操作方法上就是用寻找事物的强相关性关系代替原来的寻找因果关系来解决问题。
图5 机器无法很好理解非结构化数据
3.2 解决方案
大数据是物联网、Web和信息系统发展的综合结果。大数据相关的技术紧紧围绕数据展开,包括数据的采集、整理、传输、存储、安全、分析、呈现和应用等等。大数据的价值主要体现在分析和应用上,比如大数据场景分析等。
大数据思维是从大量数据中找到直接答案(即使不知道原因)的思维方法,这为我们寻找解决问题的方法提供了捷径。但是,大数据思维和机械思维并非对立,它更多的是后者的补充。对于能够找到确定性和因果关系的事物,机械思维依然是最好的方法。但是面对不确定的世界,当无法确定因果关系时,大数据思维将为我们提供新的方法。
人工智能是典型的交叉学科,研究的内容集中在机器学习、自然语言处理、计算机视觉、机器人学、自动推理和知识表示等六大方向。机器学习的应用范围比较广泛的,比如自动驾驶、智慧医疗等领域都有广泛的应用。人工智能的核心在于“思考”和“决策”,如何进行合理的思考和合理的行动是人工智能研究的主流方向之一。
大数据和人工智能虽然关注点不同,但是却有密切的联系,一方面人工智能需要大量的数据作为“思考”和“决策”的基础,另一方面大数据也需要人工智能技术进行数据价值化操作,比如机器学习就是数据分析的常用方式。在大数据价值的两个主要体现当中,数据应用的主要渠道之一就是智能体(人工智能产品),为智能体提供的数据量越大,智能体运行的效果就会越好,因为智能体通常需要大量的数据进行“训练”和“验证”,从而保障运行的可靠性和稳定性。
人工智能是对人的意识、思维的信息过程的模拟。人工智能不是人的智能,但能像人那样思考,甚至也可能超过人的智能。自诞生以来,人工智能的理论和技术日益成熟,应用领域也不断扩大,可以预期,人工智能所带来的科技产品将会是人类智慧的“容器”,因此,人工智能是一门极富挑战性的学科。
20世纪七十年代以来,人工智能被称为世界三大尖端技术之一(空间技术、能源技术、人工智能),也被认为是21世纪三大尖端技术(基因工程、纳米科学、人工智能)之一,这是因为近几十年来人工智能获得了迅速的发展,在很多学科领域都获得了广泛应用,取得了丰硕成果。
实现人工智能有三种途径,即强人工智能、弱人工智能和实用型人工智能。
- 强人工智能又称多元智能,研究人员希望人工智能最终能成为多元智能并且超越大部分人类的能力。有些人认为要达成以上目标,可能需要拟人化的特性,如人工意识或人工大脑。上述问题被认为是人工智能的完整性:为了解决其中一个问题,你必须解决全部的问题。即使一个简单和特定的任务,如机器翻译,要求机器按照作者的论点(推理),知道什么是被人谈论(知识),忠实地再现作者的意图(情感计算)。因此,机器翻译被认为具有人工智能完整性。
- 弱人工智能指的是利用设计好的程序对动物以及人类逻辑思维进行模拟,所指的智能体表现出与人类相似的活动,但是这种智能体缺乏独立的思想和意识。目前就算最尖端的人工智能领域也仅仅停留在弱人工智能的阶段,即使这种人工智能可以做到人类难以完成的事情。甚至有人工智能学者认为,人类作为智能体,永远不可能制造出真正能理解和解决问题的智能机器。就我们目前的生活来看,这种弱人工智能已经完全融入到了我们的生活环境之中:譬如手机中的语音助手、智能音箱等等。但是说到底,这些只是工具,被称为“机器智能”或许更为贴切。
- 实用型人工智能的研究者们将目标放低,不再试图创造出像人类一般智慧的机器。眼下我们已经知道如何创造出能模拟昆虫行为的机器人。机械家蝇看起来似乎并没有什么用,但即使是这样的机器人,在完成某些特定任务时也是大有裨益的。比如,一群如狗大小,具备蚂蚁智商的机器人在清理碎石和在灾区找寻幸存者时就能够发挥很大的作用。
图6 华盛顿大学研制的靠激光束驱动的RoboFly昆虫机器人