得到前沿课·吴军讲GPT

news/2024/10/23 9:21:51/

第1讲 计算机回答问题、写诗难吗?

  1. ChatGPT是基于语言模型的自然语言处理系统。
  2. 让计算机回答问题并不是一件高不可攀的事情,在今天,让它做得比人好是完全能够办得到的。
  3. 我们让ChatGPT做的事情,核心有两个,一个是理解自然语言,明白人的意图;另一个是产生自然语言的文本,满足人的要求。

第2讲 ChatGPT的本质是什么?

  1. 语言模型不是逻辑框架,不是生物学的反馈系统,而是由数学公式构建的模型。
  2. 今天对于语言模型参数的统计并不是简单的数数,而是要用很复杂的机器学习方法反复计算。

第3讲 语言模型是如何进化的?

语言模型的发展大致经历了三个阶段:

  1. 上个世纪90年代之前,当时贾里尼克等人用它解决了语音识别的问题。
  2. 90年代后,语言模型加入了语法和语义信息,还出现了自适应的语言模型。
  3. 2010年前后,Google开发了深度学习的工具Google大脑,能够更有效地利用计算资源,也让模型计算出的概率越来越准确。

第4讲 ChatGPT的能力边界在哪?

语言模型能做的事情可以分为三类:

  1. 信息形式转换。这是将信息从一种形式转换为另一种形式,无论是语音识别还是机器翻译,都属于这一类。
  2. 根据要求产生文本。今天ChatGPT做的主要工作,像回答问题、回复邮件、书写简单的段落,都属于这一类。
  3. 信息精简,把更多的信息精简为较少的信息。为一篇长文撰写摘要,按照要求进行数据分析,分析上市公司的财报,都属于这方面的工作。

第5讲 ChatGPT的回答从哪里来?

  1. 利用语言模型回答问题,不是一个问题对一个答案这样简单的匹配,而是对于问题给出多个答案,然后根据答案的概率排序,返回一个最可能的答案。
  2. 简而言之,回答问题也好、写作短文也好,ChatGPT的答案都基于它对现有事实的抽取和整合,或者说归纳总结。

第6讲 ChatGPT有哪些固有缺陷?

  1. ChatGPT的缺陷有些是可以改进解决的,有些则是ChatGPT固有的问题,甚至是今天机器学习方法固有的问题,要解决是很难的。
  2. 语言模型进化到今天,虽然进步了很多,但依然是一个利用已有的信息预测其他信息的模型,这个性质没有改变。
  3. 通过人为调高或者调低一些参数来控制ChatGPT的输出结果是很难的,人工干预可能导致更大的不公平。

第7讲 ChatGPT需要什么资源?

训练语言模型的三个限制,分别是数据、算力和算法:

  1. 数据:训练语言模型所需的数据量是极其庞大的。不是每个企业都能得到所有的这些数据。
  2. 算力:随着时间的推移,人们对人工智能的要求也在不断提高,需要的算力也在不断增加。
  3. 算法:除了算力之外,基础的自然语言处理技术,也就是算法,也是实现ChatGPT这些产品必不可少的条件。

第8讲 今天人工智能的边界在哪里?

  1. 无论是什么样的计算机,都只能解决世界上很小一部分问题。
  2. ChatGPT的边界是人工智能的边界,而人工智能的边界是数学的边界,数学是有边界的。
  3. 计算能力增加,原来可以计算的问题会算得更快,瞬间解决,但是不可算的还是不可算。

第9讲 ChatGPT为什么会被热炒?

  1. 如果ChatGPT这件事是一个方向,早一天、晚一天开始这方面的工作差别不大,毕竟追赶别人比自己在前面摸黑探索要快得多。
  2. 实事求是地讲,ChatGPT既不像很多人讲的那么神奇,也没有那么可怕,但也不是毫无用途。

第10讲 ChatGPT能替代什么人?

  1. ChatGPT能取代人吗,或者说能抢人的饭碗么吗?简单的答案是—"能’。但是它只会抢特定人的饭碗,而不是所有的人。
  2. 会被ChatGPT取代的人有三个特点:从事不费体力的工作,不动脑子的工作,或者不产出信息的工作。
  3. 越是到了各种智能工具不断涌现,做事情越来越便利的时候,从事创造性的工作也就越来越重要。

第11讲 理性看待ChatGPT

  1. 从投资的角度来说,技术发展带来投资的可能性,但是,当人们对一项技术炒得过热时,其实已经不是投资它的好机会了。
  2. 从从业的角度来说,做好本职工作的回报一定是最高的。
  3. 对于普通人,可以对新技术和未来有所期待,但不要觉得自己的好运气从此来了,然后放弃自己擅长的事情,去不擅长的领域寻找什么机会。

第12讲 还有哪些人工智能和科技值得关注?

在ChatGPT之外,还有一些值得关注的人工智能技术和应用:

  1. 多任务人工智能:GPT-3是所谓以数量实现质量的代表,而多任务的人工智能则是以质量取代数量。
  2. 生物和医学应用:深度学习在生物和医学上的应用是人工智能行业一个值得关注的应用领域。

http://www.ppmy.cn/news/87045.html

相关文章

超大规模数据库集群保稳系列之二:数据库攻防演练建设实践

总第562篇 2023年 第014篇 本文整理自美团技术沙龙第75期的主题分享《美团数据库攻防演练建设实践》,系超大规模数据库集群保稳系列(内含4个议题的PPT及视频)的第2篇文章。 本文首先介绍了美团当前数据库运维现状、遇到的问题,以及…

12. InnoDB引擎底层存储和缓存原理

MySQL性能调优 1. InnoDB记录存储结构和索引页结构1.1 行格式1.1.1 COMPACT1.1.2 Redundant行格式1.1.3 Dynamic和Compressed行格式1.1.4 数据溢出 1.2 索引页格式1.2.1 File Header1.2.2 Page Header1.2.3 Infimum Supremum1.2.4 User Records和Free Space1.2.5 Page Directo…

单点登录一:springboot项目使用redis、springSecurity、jwt实现单点登录的demo

1、jwt原理 JWT(JSON Web Token)是一种用于身份验证和授权的开放标准(RFC 7519)。它是一种轻量级的令牌格式,用于在网络应用间传输声明(claims)。JWT使用JSON对象来编码声明,并使用…

从价值交付的角度做 MVPU 拆分

1、商业价值的视角 这个项目能为企业带来哪些重要的商业价值呢?度量这个商业价值的核心指标是什么?比如一个大促项目,比较重要的指标有 GMV、总订单数、总成交客户数、首次下单客户数、超过一定体量的成交商家数等。 2、用户价值的视角 这…

STL --- 二、容器 (7)queue

目录 1、std::queue 的基本操作 2、std::queue 队列的应用场景 3、std::queue 实例 队列(Queue)是一种先进先出(FIFO)的数据结构,类似于现实生活中排队等待服务的场景。队列中的元素只能在队列的末尾添加&#xff0…

自学网络安全/Web安全,一般人我还是劝你算了吧

由于我之前写了不少网络安全技术相关的文章,不少读者朋友知道我是从事网络安全相关的工作,于是经常有人私信问我: 我刚入门网络安全,该怎么学? 要学哪些东西? 有哪些方向? 怎么选&a…

annoconda安装使用及镜像源的添加,提高软件下载速度

1 annoconda下载 文件地址列表,选择版本下载https://repo.anaconda.com/archive/ win10版本: Anaconda3-2023.03-1-Windows-x86_64 linux版本: Anaconda3-2023.03-1-Linux-x86_64 win10下执行exe按向导安装,linu…