chatgpt训练自己的数据python版

news/2025/2/13 6:35:10/

一、准备数据(本人准备的是JSONL数据)

1.1、数据格式:

{"prompt": "本篇文章的作者是谁?", "completion": "当然是咸菜萝卜头"}
{"prompt": "咸菜萝卜头是谁?", "completion": "咸菜萝卜头是本篇文章的作者"}

1.2、数据格式化:

openai tools fine_tunes.prepare_data -f filename.jsonl

格式化成功

1.3、若报错,可带着问题来评论区

二、开始训练

import os
import json
import time
import openai
from openai_api import *file_name = "dataupload/test1_prepared.jsonl" # 格式化后的数据
model_name = "shhc-ada-test"
openai.api_key = '' # 自己的key
start_train = Create_train()         # 本人将chatgpt的所有方法封装成的类upload_status = start_train.Chatgpt_file(file_name)    # 上传自己的训练数据
print("当前上传状态:", upload_status)time.sleep(15)# 获取上传文件id
file_id = start_train.File_list()
print('上传文件id:', file_id)# 通过上传的文件id,将文件id传入训练板块,进行训练
create_train = start_train.Fineture(file_id, sufix=model_name)
print("开始训练!")# 列出训练模型的id
file_model_id = start_train.Finelist()
print("当前模型id", file_model_id)# 查看当前模型状态
fine_train = start_train.Fine_retrieve(file_model_id)
print("当前模型状态", fine_train)# 查看模型名称
fine_train_model = fine_train.fine_tuned_model
print("当前模型名称", fine_train_model)# 列出所有的训练文件
list_fine = start_train.Finelist()
print(list_fine)

等待一段时间,训练完毕

三、测试

def Chatgpt(model_name, prompt_input):answer_txt = open('Answer.txt', 'a+', encoding='utf-8')question_txt = open('Question.txt', 'a+', encoding='utf-8')print('你好,使用者!')openai.api_key = ''  # 秘钥completion = openai.Completion.create(engine=model_name,prompt=str(prompt_input),max_tokens=256,temperature=0.5,top_p = 1.0,frequency_penalty = 0.5,presence_penalty = 0.5,user = 'FF')result = completion.choices[0].textprint('result:', result)question_txt.write(str(prompt_input) + '\n')answer_txt.write(str(result) + '\n')question_txt.close()answer_txt.close()# return resultif __name__ == '__main__':model_name = ''while True:prompt_input = input('请输入您的问题:')Chatgpt(model_name, prompt_input)

四、结束

        4.1、因chatgpt在3.2日更新之后,目前api不能调用,无法连接,就没有截训练的截图(此前已训练多个模型,且可以正常使用,完全没问题)

        4.2、后续各位需要封装的类的话,滴滴我


http://www.ppmy.cn/news/950259.html

相关文章

低成本复制 ChatGPT 训练流程,仅需 1.68GB GPU 即可使用,方法现已开源!

编译 | 屠敏 出品 | CSDN(ID:CSDNnews) 当昨日我们还在讨论从大厂以及个人创业的角度来看,复制一家 OpenAI 和一款强大的 ChatGPT 可行性究竟有几成之际,苦于 OpenAI 并未将 ChatGPT 开源出来,所以这趟水究…

在uni-app中,如果data中的对象属性改变了,但是页面没有相应更新的情况,通常有以下几点需要注意:

1. 使用this.$set更新对象属性直接修改对象属性是无法触发页面更新的,需要使用this.$set方法: this.$set(this.obj, key, value) 2. 确保数据层级不太深如果对象层级过深,改变内层属性也可能无法触发更新。建议关键数据不要超过2层。 3. 使用深度 watcher可以在watch中用深度…

企业需要一个数字体验平台(DXP)吗?

数字体验平台是一个软件框架,通过与不同的业务系统喝解决方案集成,帮助企业和机构建立、管理和优化跨渠道的数字体验。帮助企业实现跨网站、电子邮件、移动应用、社交平台、电子商务站点、物联网设备、数字标牌、POS系统等传播内容,除了为其中…

netperf常用命令使用方法

启动netserver服务报错[rootlocalhost ~]# netserver -p 12865 Unable to start netserver with IN(6)ADDR_ANY port 12865 and family AF_UNSPEC 解决方案: 这个错误提示意味着netserver无法使用给定的IP地址和端口号来启动监听服务。可能的解决方案包括&#x…

ChatGPT大封号!亚洲成重灾区,网友自救喊话:不要登录不要登录

“不要登录ChatGPT!” “暂时远离人工智能和ChatGPT概念板块高位股!” 就在这两天,一些关于ChatGPT的疾呼突然在各种社交平台和群聊刷屏了。 而看到这些消息的用户更是感到前所未有的惶恐。 因为导致这些声音出现的原因是——ChatGPT正在悄…

如何获取ChatGPT的key

您可以通过以下步骤获取 ChatGPT 的 key: 访问 OpenAI 的官方网站(https://openai.com/)。在网站的顶部导航栏中点击“API”按钮。在弹出的菜单中点击“GPT-3”。在 GPT-3 页面中,点击“获取 API Key”按钮。在弹出的窗口中输入您的电子邮件地址和密码&a…

chatgpt赋能python:Python模拟登录-实现自动化登录的方法

Python模拟登录 - 实现自动化登录的方法 在日常生活中,我们使用的许多网站需要我们进行登录才能够访问其功能和服务。而在进行人工操作时,频繁登录已经成为了一件烦琐的任务。因此,自动化登录功能的实现也成为了一个极为重要的需求&#xff…

chatgpt 无法登录报错Access denied、OpenAl‘s services are not available in yourcountry. (error=unsupported )

一、主要解决有账号无法登录问题,共包含两种情况。 1、Oops! OpenAls services are not available in yourcountry.(errorunsupported country) 2、Access denied You do not have access to chat.openai.com. The site owner may have set restrictions that p…