大模型相关资料、基础技术和排行榜

ops/2025/1/17 21:16:51/

大模型排行榜

测试集
CEval中文多个学科测试集排名
MMLU大规模多任务语言理解英文排名,介绍
斯坦福排行榜
Math-V
Math-Vista
Open LLMs Leaderboard
CMMLU

大模型数据集

标题简介
19个大模型常用的评估数据集和训练数据集汇总19个大模型常用的评估数据集和训练数据集汇总
最全 高质量 大模型(LLM)中文预训练数据集,持续更新中高质量的中文预训练数据集 is all Chinese LLM need
最全 高质量 大模型 -预训练数据集(不定期更新)最全 高质量 大模型 -预训练数据集(不定期更新)

大模型相关资料

标题简介
Huggingface的介绍,使用(CSDN最强Huggingface入门手册)实现AGI的车轮地方
Transformers Tasks一个github上开源项目,里面有许多典型的NLP项目,且有相应的讲解和源码
《Planing for AGI and beyond》OpenAI对实现强人工智能AGI的规划
老北鼻AI工具箱各类AI产品
GPT相关开源项目合集GPT相关开源项目合集
AutoGPTAutoGPT项目地址
AgentAI Agent,英文原文
从大型语言模型LLM走向人工通用智能AGI的改进方向( public)我对未来LLM发展以及实现AGI的思考
从大型语言模型LLM走向人工通用智能AGI的改进方向( private)我对未来LLM发展以及实现AGI的思考和解决思路
大脑相关知识的简单介绍(小白入门)比较浅显的介绍
人的记忆组成图人的记忆图示化

大模型基础技术

标题简介
稳定扩散模型The Illustrated Stable Diffusion图示化讲解Jay讲解Stable Diffusion
Transformer图示化讲解Jay讲解 Attention is all you need(Transformer)
ChatGPT深度体验记录,期待GPT-4(测试各领域知识,正常聊天,写代码,写诗歌,模拟人格,机器翻译,语法改错等)2022.12.1号发布的ChatGPT体验记录
模型量化技术LLM大模型中常见的模型量化技术介绍
看注解逐行学习ChatGLM2-6B大模型学习大模型源码
逐行代码学习ChatGLM2-6B大模型SFT微调(通过prompt ptune实现)学习大模型微调源码
KBQA知识总结基于知识图谱的问答(KBQA)介绍
从零开始的知识图谱生活GitHub上一个知识图谱项目,适合入门学习知识图谱。是一个入门知识图谱过程中的学习笔记,算是半教程类的,指引初学者对知识图谱的各个任务有一个初步的认识。
大模型训练为什么用A100不用4090关于大模型训练的事情
大模型优化之KV Cache推理阶段时KVcache的作用
大模型实战教程大模型实战教程,配套教程和代码
大模型训练时常见GPU的对比大模型训练时常见GPU的对比
不得不会的32个Linux命令常见linux命令
手把手带你实战HuggingFace Transformersb站传送门,动手学习NLP和LLM非常好的地方
1B(10亿)的token大概需要多少磁盘空间存储算token数
Slurm集群上单节点8卡全量微调大模型笔记Slurm集群上单节点8卡全量微调大模型笔记
大模型加载的参数介绍及推荐表大模型加载的参数介绍及推荐表,temperature、top_k、top_p、num_beams、num_beam_groups、do_sample等
大模型:常见的文字表情包(可以直接加到微调数据里)大模型:常见的文字表情包(可以直接加到微调数据里)
LLM模型评测代码实践LLM模型评测代码实践
DeepSpeed使用指南(简略版)简单介绍DeepSpeed使用指南(简略版)
DeepSpeed使用指南(资深版)LLM-分布式训练工具(一):DeepSpeed【微软】【大模型分布式训练工具,实现ZeRO并行训练算法】【zero3配置将模型参数切分后分配到不同的显卡中,突破单张显卡容量不足以加载模型参数的限制】
Huggingface 镜像站Huggingface 镜像站
DPO原理DPO原理

http://www.ppmy.cn/ops/150921.html

相关文章

什么是IDE,新手如何选择IDE?

IDE 是 Integrated Development Environment(集成开发环境)的缩写,它是一种软件应用程序,为程序员提供了一站式的开发环境,整合了多种工具和服务,以便高效地创建、修改、编译、调试和运行软件程序。IDE 集成…

Android Room 报错:too many SQL variables (code 1 SQLITE_ERROR) 原因及解决方法

报错信息: android.database.sqlite.SQLiteException: too many SQL variables (code 1 SQLITE_ERROR): while compiling: SELECT * FROM points WHERE id IN (?,?,?,...,?,?,?)SQLiteException: too many SQL variables 通常是由于一次查询或插入的 SQL 语句…

Go语言封装加解密包(AES/DES/RSA)

Go语言封装加解密包(AES/DES/RSA) 1. Base64编码与解码2. AES加解密3. DES加解密4. RSA加解密5. SHA256哈希6. 单元测试1. AES加解密单元测试2. DES加解密单元测试3. RSA加解密单元测试4. SHA256哈希单元测试测试用例说明 总结 在现代软件开发中&#xf…

微信小程序:实现单选,多选,通过变量控制单选/多选

一、实现单选功能 微信小程序提供了 radio 组件来实现单选功能。radio 组件需要配合 radio-group 使用。 1. WXML 代码 <radio-group bindchange"onRadioChange"><label wx:for"{{items}}" wx:key"id"><radio value"{{it…

图像识别opencv翻转

运行界面 以下是代码&#xff1a; import cv2 import numpy #读取图像 img cv2.imread("../image/cat.jpg") #1,0,-1代表不一样的翻转效果 flipped cv2.flip(img, 1) #显示结果 cv2.imshow("Flip", flipped) cv2.imshow("original", img) cv2…

山石防火墙命令行配置示例

现网1台山石SG6000防火墙&#xff0c;配置都可以通过GUI实现。 但有一些配置在命令行下配置效率更高&#xff0c;比如在1个已有策略中添加1个host或端口。 下面的双引号可以不加 1 创建服务 1.1 单个端口 service "tcp-901"tcp dst-port 901 1.2 端口范围 servi…

2025-1-15-十大经典排序算法 C++与python

文章目录 十大经典排序算法比较排序1. 冒泡排序2. 选择排序3. 插入排序4. 希尔排序5. 归并排序6. 快速排序7. 堆排序 非比较排序8. 计数排序9. 桶排序10. 基数排序 十大经典排序算法 十大经典排序算法可以分为比较排序和非比较排序: 前者包括冒泡排序、选择排序、插入排序、希…

【算法学习笔记】32:筛法求解欧拉函数

上节学习的是求一个数 n n n的欧拉函数&#xff0c;因为用的试除法&#xff0c;所以时间复杂度是 O ( n ) O(\sqrt{n}) O(n ​)&#xff0c;如果要求 m m m个数的欧拉函数&#xff0c;那么就会花 O ( m n ) O(m \sqrt{n}) O(mn ​)的时间。如果是求连续一批数的欧拉函数&#x…