【LLM】o1/R1系列LLM数据篇

embedded/2025/2/12 19:42:17/

关于思维链推理的10开源数据集:
目前开源的数据主要有如下:

1、Magpie-Reasoning-V2数据集,其中包含DeepSeek-R1生成的250K思路链推理样本,这些示例涵盖了数学推理、编码和一般问题解决等各种任务。https://huggingface.co/datasets/Magpie-Align/Magpie-Reasoning-V2-250K-CoT-Deepseek-R1-Llama-70B

2、Dolphin-R1,包含80万个样本的数据集,其中的数据来自DeepSeek-R1和Geminiflash的生成结果,同时还有来自Dolphinchat的20万个样本。https://huggingface.co/datasets/cognitivecomputations/dolphin-r1,https://modelscope.cn/datasets/AI-ModelScope/dolphin-r1

3、R1-Distill-SFT,有17000个样本,目的是创建数据以支持Open-R1项目,https://huggingface.co/datasets/ServiceNow-AI/,https://modelscope.cn/datasets/ServiceNow-AI/R1-Distill-SFT

4、NuminaMath-TIR,工具类数据集。 https://www.modelscope.cn/datasets/AI-MO/NuminaMath-TIR,

5、NuminaMath-CoT,大约86万道数学题,每个解题过程都以“思维链”方式呈现。 https://www.modelscope.cn/datasets/AI-MO/NuminaMath-CoT

6、BAAI-TACO,代码生成的基准,包含26443个问题。 https://modelscope.cn/datasets/BAAI/TACO

7、OpenThoughts-114k,开放的合成推理数据集,包含11.4万个高质量样本,涵盖数学、科学、代码和谜题等领域。 https://modelscope.cn/datasets/open-thoughts/OpenThoughts-114k

8、Bespoke-Stratos-17k,对伯克利Sky-T1数据的复制,使用DeepSeek-R1创建了一个包含问题、推理过程和答案的数据集。 https://modelscope.cn/datasets/bespokelabs/Bespoke-Stratos-17k

9、clevr_cogen_a_train,R1蒸馏视觉推理数据集。 https://huggingface.co/datasets/leonardPKU/clevr_cogen_a_train)-AR1-distilledvisualreasoningdataset.

10、S1k,训练S1模型的数据集,https://huggingface.co/datasets/simplescaling/s1K


http://www.ppmy.cn/embedded/161104.html

相关文章

anaconda中可以import cv2,但是notebook中cv2 module not found

一、问题 anaconda中成功import cv2 但是jupyter notebook中却无法导入cv2 二、排查 anaconda中使用python路径如下: jupyter notebook中使用python路径如下: 可以发现路径不一致。 三、解决 ①查看可用的kernel ②选中想要修改的kernel,打…

如何查看Ubuntu24.04系统,显卡是什么型号,适配的驱动是什么?

在Ubuntu 24.04系统中,查看显卡型号和适配的驱动程序可以通过以下步骤完成: 查看显卡型号 要确定您的计算机上安装了什么显卡,您可以使用几种不同的命令。最常用的命令之一是lspci,它能够列出所有PCI设备的信息。为了专门找到NV…

android studio无痛入门

在Android Studio中创建和管理项目主要涉及以下几个步骤: 1. 创建新项目 打开Android Studio,点击“Start a new Android Studio project”或者“File” > “New” > “New Project”。 选择一个模板,例如“Empty Activity”&#xff0…

深入浅出:机器学习的全面解析

深入浅出:机器学习的全面解析 引言 机器学习(Machine Learning, ML)作为人工智能的一个重要分支,近年来取得了显著进展,并在多个领域中得到了广泛应用。本文将从基础概念、核心算法、应用场景以及未来发展趋势等方面…

基于机器学习的DDoS检测系统实战

基于机器学习的DDoS检测系统实战(PythonScikit-learn)|毕业设计必备 摘要:本文手把手教你从0到1实现一个轻量级DDoS攻击检测系统,涵盖数据预处理、特征工程、模型训练与可视化分析。 一、项目背景与意义 DDoS&#x…

DeepSeek和ChatGPT对比分析

DeepSeek与ChatGPT作为当前主流的两大AI语言模型,在技术架构、应用场景、成本效益等方面存在显著差异。以下从多个维度进行对比分析: 1. 技术架构与训练方式 DeepSeek 架构:采用混合专家模型(MoE),包含6710…

HTMLCSSJS

1.1HTML&CSS&JavaScript的作用 HTML 只要用于网页主题结构的搭建 CSS 主要用于美化界面 JS 添加一些提示 一,HTML入门 <!-- 1 html文件的根标签<html></html>所有子标签都要在这个标签中间 2 html根标签下有两个一级子标签<head></head> 头…

VMware Workstation Pro 免注册下载链接

VMware Workstation Prohttps://softwareupdate.vmware.com/cds/vmw-desktop/ws/https://softwareupdate.vmware.com/cds/vmw-desktop/ws/ 访问不了或下载速度慢挂VNP