人工智能论文:BERT和GPT, GPT-2, GPT-3 的简明对比和主要区别

embedded/2025/1/15 17:26:56/

在BERT的论文里面: 2018.10 BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding,BERT已经解释了BERT,GPT,ELMo的区别。

*ELMo为双向RNN,请忽略。

主要区别:

  • BERT使用的是transformer的encoder,双向,专注于完形填空。对于缺失的内容和应试内容比较擅长。
  • GPT使用的是transformer的decoder,单向,专注于预测,因为decoder看不到后面的字符,训练GPT的预测性能。
  • BERT和GPT-1都使用了微调,以应对各种考试。而后期GPT-2,GPT-3抛弃微调,专注于通用人工智能


http://www.ppmy.cn/embedded/29781.html

相关文章

第一课 自动驾驶概述

1. contents 2. 什么是无人驾驶/自动驾驶 3 智慧出行大智慧 4. 无人驾驶的发展历程

MySQL:DQL语句和多表设计

DQL Data Query Language(数据查询语言) 用来查询数据库中表的记录 查询关键字:SELECT 在业务系统中,查询频次是远高于增删改的. 语法 SELECT #字段列表(基本查询) From #表名列表 WHERE #条件列表(条件查询) GROUP BY #分组字段列表(分组查询) HAVING #分组后条件列表 O…

【机器学习】CLIP模型在有限计算资源下的性能探究:从数据、架构到训练策略

CLIP模型在有限计算资源下的性能探究:从数据、架构到训练策略 一、数据:质量胜过数量,小规模亦可制胜三、训练策略:选择合适的方法以应对计算资源的挑战 在人工智能领域,多模态模型正逐渐成为研究的热点。其中&#xf…

C语言双向链表快速入门教程

链表的声明 double_linked_list.h #ifndef ZDPC_ALGORITHM_DEV_DOUBLE_LINKED_LIST_H #define ZDPC_ALGORITHM_DEV_DOUBLE_LINKED_LIST_H// 双向链表的节点 typedef struct doubleLinkedListNode {int data;struct doubleLinkedListNode *next; // 下一个节点struct doubleLi…

【设计模式】17、iterator 迭代器模式

文章目录 十七、iterator 迭代器模式17.1 user_slice17.1.1 collection_test.go17.1.2 collection.go17.1.3 iterator.go17.1.4 user.go 十七、iterator 迭代器模式 https://refactoringguru.cn/design-patterns/iterator 为了集合数据的安全性, 或方便迭代, 可以用迭代器接口…

Django框架之请求生命周期流程图

一、引言 WSGI、wsgiref、uwsgi三者是什么关系? WSGI是协议,小写的wsgiref和uwsgi是实现该协议的功能模块 缓存数据库 提前已经将你想要的数据准备好了,需要的时候直接拿就可以,提高了效率和响应时间。 eg:当你在修改你的数据的时候&…

React 之 使用 ref 引用值

当你希望组件“记住”某些信息,但又不想让这些信息 触发新的渲染 时,你可以使用 ref 。 //通过从 React 导入 useRef Hook 来为你的组件添加一个 ref import { useRef } from react;export default function Counter() {//在组件内,调用 useR…

四. Django项目之电商购物商城 -- 图片验证码生成

Django项目之电商购物商城 – 图片验证码生成 需要开发文档和前端资料的可私聊 一. 图片验证码的生成 1. 创建应用用于生成图片验证码 , 以及短信验证码 python manage.py startapp verfications2.配置radis数据库 "var_code":{# 配置数据库指定引擎"BACKE…