2016年3月Google的AlphaGo战胜韩国顶尖职业围棋选手李世石绝对可以称得上近代人工智能标志性的事件。以此为时间点在Google Trends上搜索人工智能相关的关键字,比较近年流行的机器学习框架,我们可以看到近年人工智能在国内的热度在逐年攀升。
2017年7月8日,国务院印发《新一代人工智能发展规划》并通知各省、自治区、直辖市人民府,国务院各部委、各直属机构,认真贯彻执行。这意味着我们国家对人工智能的重视,发展人工智能已经上升到国家战略层面。
《规划》分三步走:
第一步,到 2020年, 人工智能总体技术和应用与世界先进水平同步, 人工智能产业成为新的重要经济增长点, 人工智能技术应用成为改善民生的新途径, 人工智能核心产业规模超过 1500 亿元,带动相关产业规模超过 1 万亿元。
第二步,到2025 年,人工智能基础理论实现重大突破, 部分技术与应用达到世界领先水平, 人工智能成为我国产业升级和经济转型的主要动力, 智能社会建设取得积极进展, 人工智能核心产业规模超过 4000 亿元,带动相关产业规模超过 5 万亿元。
第三步,到 2030 年,人工智能理论、 技术与应用总体达到世界领先水平, 成为世界主要人工智能创新中心, 人工智能核心产业规模超过 1 万亿元, 带动相关产业规模超过10万亿元。
除了中国外,世界主要经济体如:美国,欧洲各国,日本等国家也已经把发展人工智能上升为国家战略。引用《经济日报》2019年4月7日的文章《世界主要国家人工智能战略及其产业政策的特点》:
人工智能之所以成为世界各国竞争的焦点和产业政策发力的重点,是因为其在经济社会发展全方位都具有巨大价值。一方面,人工智能拥有强大的经济带动性。人工智能是当代通用目的技术,也就是说它是一种能够在国民经济各行业获得广泛应用并持续创新的技术,这意味着经济社会对人工智能的需求十分巨大,人工智能技术能够发展成规模巨大的产业。另一方面,人工智能可对其他产业产生颠覆性影响,加快产业行业的技术创新、商业模式和业态变革,提高生产效率、改善用户体验。对于这样一种刚进入产业化初期且快速发展的前沿技术,目前没有哪个国家已经具备绝对优势,更没有哪个国家能够像掌控传统产业那样在这一领域形成垄断地位,因此,如果能及早进入这一领域就可能占据一席之地,甚至获取未来产业发展的主导权,反之则很有可能被其他国家甩在后面。
通常一种新的通用目的的技术会颠覆传统行业,并带来新的发展模式,进一步带来新的经济增长点。比如移动互联网发展的几年,好多行业要么被“互联网+”模式颠覆,要么拥抱互联网摸索出新的发展模式。人工智能必然是新一代科技产业潮流,“AI+”已经开始渗透到各行各业。大数据和人工智能时代已经到来,我们正身处最好的时代。
人工智能的发展条件
人工智能主要有两个研究方向:
传统人工智能的方法:研究人类是如何产生智能的,然后让计算机去模拟人的智能。模拟人脑神经网络构成,模拟突触工作。由于太过复杂,最终发现这个方向是错的,这条路根本走不通。机器智能最重要的是能够解决人脑所能解决的问题,而不是在于是否需要采用和人一样的方法。
现代人工智能的方法:数据驱动和机器学习,本质是大数据+统计的方法,通过尝试各种算法,在大数据加持下尝试寻找能适配规律的模型,新数据就通过该模型进行运算输出结果。
人工智能经历过60年左右的发展,为什么现在才开始爆发呢?一方面的研究方向的问题,另一方面是人工智能技术是超时代的技术。这就需要从人工智能的先决条件说起,人工智能最关键的两个方面:
1.完备的数据
实现人工智能的首要前提条件是大数据,需要研究某个领域,必须有该领域完备的数据。吴军博士在《智能时代》中有一个典型的例子:2005年之前,Google在机器翻译领域从来没有技术积累,结果确在当年4月的机器翻译大赛中以巨大的优势打败了全世界所有机器翻译研究团队, 一跃成为这个领域的领头羊。据负责人透露, 他用的还是两年前的方法 ,但是在Google有一个其他团队没有的优势——他用了比其他团队多成千上万倍的数据 。
2.超快算力的计算机
人工智能的本质就是给计算机“喂”大量的数据,做大量的并行运算,进行训练得到一个模型用来解决某个问题。
数据产生:人类生存的几千年,产生的无数的数据,但是这些数据并没有很好的保存下来。在移动互联网之前,大部分的数据是由企业存储下来的。随着现代科技的进步,计算机技术,存储技术,全球互联网宽带的速度的发展,特别是随着移动互联网的发展,个人通过移动设备,可穿戴设备以及设备上的传感器提供的数据在呈指数级别的增长。在移动互联网时代,大部分的数据是由个人和传感器产生的。数据不但包括文字、声音、影像,还有细胞等医疗数据、个人位置聊天记录等隐私数据、气候数据、工农业生产数据、电子交易数据、物联数据等等。
数据存储:随摩尔定律的发展,热存储设备发展到SSD,蓝光等冷存储设备,存储越来载稳定,容量越来越大,读写速度也越来越快,价格却越来越便宜。这为海量数据的快速存储准备了必要条件。2005年左右,3.5吋软盘还没有被完全淘汰,容量也就只有1.4M,最多只能存储几个文档。那个年代,如果你有一个32M的U盘都可以拿一个挂绳挂在脖子上炫耀了。现在高端点的手机,内存动不动12G,硬盘来个1T也很正常。
数据的处理:数据海量增长对计算机算力的要求并不是线性增长的。如果需要处理增长一万倍的数据,需要的计算机算力往往要增长几十万乃至上亿倍。需要处理这些数据,由单台计算机是不可能完成的,必需要由相当数量的服务器集群。要解决并行计算机之间的连接速度,必须要解决各个服务器之间的网络速度及交换机,否则,网络会变成并行计算机的瓶颈。Google为此研发了专用交换机解决了并行计算机之间的网络连接问题,华为也有类似的专用产品。
所有这些条件只有在科技发展到如今的时代才能实现,这也解释了为什么大数据和人工智能到现在才真正开始爆发。随着5G、物联网的发展,以及计算机处理速度的进一步提升,这个发展趋势会愈发明显。
在未来,5G+万物互联+量子计算肯定会让大数据和人工智能进一步大放溢彩。
生活中感知的人工智能
生活中随处可见的人脸识别:考勤,银行,手机App等等。大家应该发现,随着互联网的发展,很多事情都可以网上办理,特别是新冠疫情以来,实地办理的成本更大,而网上办事的身份识别是关键的一环。人脸识别的普及把身份识别的问题解决了,现在绝大部分的事情都可以网上办理了。再举一个反面的例子:2021年央视315晚会就曝光了某些商家使用人脸识别追踪顾客是否回头客,用以区分是否潜在客户,从而实施不同的销售策略。此事件虽然是反面应用的例子,但也客观说明人工智能的技术已经开始实用化普及。
利用数据挖掘的推荐系统:我们每个人使用的网购APP首页推荐都不一样,电商会根据我们的购买习惯,给我们推荐可能需要的商品,有自家物流的电商甚至可以把我们很可能购买的商品,提前运到附件的仓库点,来提升物流效率和买家的购物体验。视频类,音乐类,新闻类的App也是使用了利用数据挖掘的推荐算法。各种渠道获取的用户隐私数据是原材料,传统统计算法就是手工作坊,AI算法模型就是工业生产。
使用大数据和人工智能助力新冠防疫:2021年10月31日的上海迪士尼防疫事件在互联网迅速刷屏。据报道,上海在收到杭州数据异常的消息,从下午6点左右进行核酸检测,到晚上11点半,短短数小时,就完成了对整个迪士尼园区内2万多人的核酸检测,上海方面同时为没有离开的游客安排了200多辆大巴。另外上海通过大数据,整理出30日,31日去过迪士尼的人员名单,通知到居委会,学校等单位,并督促他们第一时间做完核酸检测,在封园后的十几个小时内,就公布了所有33863人员的核酸检测结果均为阴性。也就是说在监测到数据异常之后,24小时内就把所有事情都做完了。
上海作为一线城市,人口密度大,如果等病例出现了,再关闭可疑病例所在社区,势必对经济造成重大影响。因此,这次上海迪士尼防疫事件,肯定是有预案,能随时主动出击的。而主动防疫使用的关键技术是大数据人工智能。
智能语音机器人:早几年我们接到的推销类的电话都是真人拨打过来的, 现在越来越多机器人了,我们甚至不知道对方是真人还是机器人,因为除了声音,语气越来越像真人之外,说话也越来越有逻辑了。和机器人聊了半天还没能发现时机器人的情况时有发生。人工智能技术走出实验室,有商业应用的加持,发展速度越来越快。
AI云开放平台
在国家战略背书的情况下,短短数年后的今天,AI云开放平台如雨后春笋般在中国发展起来了。为人工智能的应用和普及起到至关重要的作用。
AI云开放平台有如下特点:
1、头部公司如百度、阿里、腾讯、华为等占据绝大部分的市场份额
- 大企业有人工智能的内需,投入产出都可以内部消化,除了内部消化外,还可以把AI事业部的通用API通过收费的方式提供给其他企业,达到增加收益的目的,此外,其他企业使用过程所提供的数据,还可以进一步增加数据的完备性,进一步优化人工智能的接口,形成良性循环。
- 有动力开发AI芯片,使用自家的高性能低成本AI芯片,进而有足够的议价优势。
- 人才的集聚效应,吸引更多的AI人才,各大院校也有培养AI人才的积极性,目前计算机相关硕士十之七八的研究方向都是AI人工智能。
- 进一步挖掘商业潜能,带动市场发展。
2、头部公司拥有全栈式AI能力
在语音技术,图像技术,文字识别,人脸人体,视频技术,NLP等几个大方面都有深入研究。
百度飞桨(PaddlePaddle)、华为ModelArts、阿里PAI、腾讯智能钛、小米Cloud-ML等。
3、各个细分领域均有独角兽公司深耕
- 讯飞的语音识别、第四范式预测模型、云从科技视觉识别等。
4、广泛面向社会开放AI能力接口API
- AI能力通用化,封装成API接口
- 支持各种主流编程语言
- 提供完备的说明文档及使用样例
- 方便中小企业及社会大众接入AI能力
5、商业收费模式灵活、规模化效应逐渐显现
- 部分能力提供免费试用、按调用量付费、包月包年预付费等。
- 不具备AI开发能力的企业,赋予企业AI能力,提升中小企业的竞争力。
- 向社会提供AI能力,也有助于AI平台得到更多完备的数据,进一步优化模型,提升竞争力。
- 通过AI云开放平台,进一步挖掘逐渐成型的商业模式。
人工智能的学习途径
- 高校学习资源。大学计算机相关专业,人工智能研究占比很高。大学MOOC等大量公共免费精品教学资源可供学习。
- 体验与人工智能相关的工作,如标注任务、AI应用接入、通用平台模型训练、使用公共数据集开发专用模型。
- 使用免费的GPU实践:比如有条件在合法的条件下使用Google的Colaboratory。
- 参加人工智能相关的比赛,比如Kaggle等。