厦大纪老师chatgpt相关讲座3.7

news/2025/1/31 4:26:32/

在线更新数据,迭代学习训练,进而提高模型性能。
比较明显的是API部分,这一步学习的就是intruction,实现人机写作的复杂系统工程

在这里插入图片描述
数据充足,维基类似于百度百科
transformer结构更有优势,预测下一个字,模型越大,则condition的range大。

模型遗忘是当模型做一个新任务时,就会忘记旧的任务,而模型足够大,就不会发生这种作用。

大的数据+大的模型——chatgpt


**
在这里插入图片描述

下图中的数据,多为猜测。
数据的搜集过程,无法复制?

在这里插入图片描述
论文中给出了标注数据集类型,有QA等等,需要给出提示

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

​​​在这里插入图片描述

不仅给出了答案,还给出推理chain。

无监督预训练:文本语料570g,代码:159g
有监督:12万个训练集,1653个测试集,集合的意思,不是数据集量

在这里插入图片描述

​​

​​

​​​

2、国产大模型硬件基础

不大指望企业,指望国家实验室

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
给标注数据和原始数据,他们把模型做出来。
给data,他们做模型
在这里插入图片描述

在这里插入图片描述

鹏程国家实验室不穷,很有钱

下边的模型花了27个亿

鹏程*神农——新冠预测的模型——4000张GPU卡。
在这里插入图片描述
在这里插入图片描述

国产大模型-神农模型

**用户需求:**蛋白的RDB区域是否病变
**研究动机:**提前预测病毒变异类型

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
蓝色表示结合亲力上升,月蓝色月可能发生变异
在这里插入图片描述

在这里插入图片描述

新颖的多任务损失函数,是什么?新在哪?

在这里插入图片描述

在这里插入图片描述
**在这里插入图片描述
**

流感病毒能直接迁移吗?应该不行吧?流感应该不是看RBD吧?

在这里插入图片描述

可能的未来的方向
给一部电影,写成一本小说。
给一本小说,拍出来一步电影。

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

一轮300万,学生写的代码完蛋

土豪做法是数据或者任务线性排,没钱,做聚类’

在这里插入图片描述

模型压缩

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

洪永淼:
AI领域的问题:
确定性问题(当输入和输出是确定的)
确定性答案

明确的,可控的情况下做模型。
数据量和标注数据的质量有关。

优化算法中,凸优化问题,怎么更新上万个参数?
梯度更新


http://www.ppmy.cn/news/968574.html

相关文章

2023数智金融峰会:生成式AI将给金融行业带来什么?

2022年中央经济工作会议提出,要推动“科技—产业—金融”良性循环。依托科技力量等生产要素的创新,带动金融和产业相互促进,最终实现实体经济增长,是金融供给侧结构性改革的主要路径之一。 2月23日,新华财经与百度智能…

Stable Diffusion实现之 Huggingface

Stable Diffusion 以及Huggingface的安装实现 介绍: Stable Diffusion AI是指将Stable Diffusion模型应用于人工智能领域的相关技术和方法。通常情况下,Stable Diffusion AI主要用于金融、投资等领域,并且广泛应用于期权定价、风险管理等方…

49位专家预测:2023最火的科技趋势

译者 | Jane 来源 | 36氪(ID:wow36kr) 2023 年的科技趋势是什么?围绕生成式人工智能、Web3、创客经济等可能出现的情况,Fast Company 采访了初创公司创始人、科技大佬、风险投资人和学者们的看法,并收集了他…

有实力一定要进大厂

春招来了,很多还在找工作的同学可能会有疑虑,到底是进小公司好呢? 还是进互联网大厂好? 相比之下,大厂抗风险能力更强,内部员工的发展也更稳定。除此之外,相比小公司,大厂还会带来更…

数字化转型:当光子计算遇上金融领域

原标题为【光子计算在金融领域的研究应用——聚焦“光子金融科技”新方向】 作者 | 吴永飞 王彦博 沈亦晨 杨璇 光子计算作为前沿尖端技术之一,近年来蓬勃发展、逐步成熟,目前已基本具备与行业应用深度结合的可行性。本文立足金融领域业务实践&#xff0…

“大模型压缩神器”?十亿参数,一键瘦身!狂掉75%

作者:英特尔公司 陆崟彤 何欣 郭恒 程文华 王畅 王梦妮 沈海豪 编辑:新智元 本文介绍了可提升大语言模型的训练后量化表现的增强型 SmoothQuant 技术,说明了这项技术的用法,并证明了其在准确率方面的优势。此方法已整合至英特尔…

【AI 大模型】a16z:LLM 应用程序的新兴架构:Emerging Architectures for LLM Applications

目录 LLM 应用程序的新兴架构:Emerging Architectures for LLM Applications The stack 技术堆栈

微信称不会推出「已读」功能;马斯克宣布成立 AI 公司 xAI;GPT-4 架构曝光,有 1.8 万亿参数|极客头条...

「极客头条」—— 技术人员的新闻圈! CSDN 的读者朋友们早上好哇,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧。 整理 | 梦依丹 出品 | CSDN(ID:CSDNnews) 一分钟速览新闻点&#…