大语言模型微调的公开JSON数据

embedded/2025/2/24 0:56:55/

语言模型微调的公开JSON数据

在这里插入图片描述

以下是一些可用于大语言模型微调的公开JSON数据及地址:

  • EmoLLM数据集
    • 介绍:EmoLLM是一系列能够支持理解用户、帮助用户心理健康辅导链路的心理健康大模型,其开源了数据集、微调方法、训练方法及脚本等。数据集按用处分为general和role-play两种类型,按格式分为qa和conversation两种类型。
    • 地址:https://github.com/SmartFlowAI/EmoLLM/tree/main/datasets
  • kigner/ruozhiba-llama3数据集
    • 介绍:又称弱智吧数据集,大小为601k,包含1500条指令与答复。
    • 地址:https://huggingface.co/datasets/kigner/ruozhiba-llama3

http://www.ppmy.cn/embedded/164710.html

相关文章

docker 和 Quay.io的关系

Docker 和 Quay.io 存在紧密的关联,它们在容器技术生态系统中扮演着不同但相互协作的角色,下面从多个方面为你详细介绍它们的关系: 概念层面 Docker:是一个用于开发、部署和运行应用程序的开源平台,基于容器化技术。它允许开发者将应用及其依赖项打包到一个独立的容器中,…

华为昇腾910b服务器部署DeepSeek翻车现场

最近到祸一台HUAWEI Kunpeng 920 5250,先看看配置。之前是部署的讯飞大模型,发现资源利用率太低了。把5台减少到3台,就出了他 硬件配置信息 基本硬件信息 按照惯例先来看看配置。一共3块盘,500G的系统盘, 2块3T固态…

DeepSeek基础之机器学习

文章目录 一、核心概念总结(一)机器学习基本定义(二)基本术语(三)假设空间(四)归纳偏好(五)“没有免费的午餐”定理(NFL 定理) 二、重…

【JavaEE进阶】Spring MVC(2)

欢迎关注个人主页:逸狼 创造不易,可以点点赞吗 如有错误,欢迎指出~ 传递JSON数据 JSON(JavaScript Object Notation)是一种轻量级的数据格式,有自己的语法和格式,主要负责不同语言中的数据传递和交换(作用类似于"英语,普通话"等语…

工业级无人机手持地面站技术详解

工业级无人机手持地面站是无人机系统的核心组成部分,它集控制、通信、数据处理于一体,为无人机的安全飞行和任务执行提供全面支持。以下是对工业级无人机手持地面站技术的详细解析: 一、硬件构成 1. 处理器与操作系统: 工业级手…

JVM系列--虚拟机类加载机制

概况 在 Class 文件中描述的各种信息,最终都需要加载到虚拟机中之后才能被运行和使用。而虚拟机如何加载这些 Class文件? Class 文件中的信息进入到虚拟机后会发生什么变化?这些都是本文要讲的内容。 虚拟机把描述类的数据从 Class 文件加载到内存,并…

Qt ModbusTCP和ModBusRTU读写数据

文章目录 ModbusTCP和ModBusRTU 的区别ModbusTCP添加模块ModBus读写 ModBusRTU添加模块 ModbusTCP和ModBusRTU 的区别 Modbus RTU 和 Modbus TCP 是 Modbus 协议的两种不同实现方式,主要区别如下: 通信介质 Modbus RTU:基于串行通信&#xf…

Linux基本指令(三)+ 权限

文章目录 基本指令grep打包和压缩zip/unzipLinux和windows压缩包互传tar(重要)Linux和Linux压缩包互传 bcuname -r常用的热键关机外壳程序 知识点打包和压缩 Linux中的权限用户权限 基本指令 grep 1. grep可以过滤文本行 done用于标记循环的结束&#x…