运行fastGPT 第四步 配置ONE API 添加模型

news/2025/1/19 14:02:03/

上次已经装好了所有的依赖和程序。

下面在网页中配置One API ,这个是大模型的接口。配置好了之后,就可以配置fastGPT了。

打开 OneAPI 页面 添加模型

这里要添加具体的付费模型的API接口填进来。
可以通过ip:3001访问OneAPI后台,**默认账号为root密码为123456。**在OneApi中添加合适的AI大模型渠道。 比如我用质谱AI的API。

在这里插入图片描述
第一次进入,先改密码。

创建渠道 也就是质谱AI的渠道 API KEY 添加进去

添加渠道,也就是添加模型 和接口。
在这里插入图片描述
这里,比如我想添加GLM质谱AI的大模型,那么就去官网找到这个。找到具体的模型名字。因为我是用作 AI聊天客服,应对日常咨询。因此不需要强大的推理,而是需要急速回答,和便宜。
https://www.bigmodel.cn/pricing
在这里插入图片描述在这里插入图片描述
找到以上的就可以了,向量模型用来处理文本,和知识库的信息。所以要一同加入。
注意,这里要手动填入模型的完整名字哦。否则列表中可能没有。 有些新的模型版本,需要自己填写。
然后在你的大模型网站上,找到API KEY 粘贴进去,就可以了。 每次就会扣费了。
在这里插入图片描述
测试一下,这里通过了,表示模型已经就位。 可以调用了。

在这里插入图片描述

创建ONE API的令牌

创建令牌 其实也就是ONE API 的KEY 用于给fastGPT调用。
在这里插入图片描述
创建了新的令牌TOKEN之后,你就能复制它了,就是一串密钥sk开头的

然后fastGPT通过这个,来调用你的ONE API上的接口。 从而扣费。 这样就能实现对个人的管理了。 你可以通过ONE API来多给别人建立几个TOKEN ,每个人单独扣费。你能在后台看到他们的费用情况。

在这里插入图片描述
当然,您只是自己用,就随便。 给自己随便填写一个额度。使劲用就行。 保证您的大模型接口上有钱就行。

修改ONE API配置文件 添加参数

找到上一篇文章中的/fastgpt/docker-compose.yml 这个文件,修改下面的参数。 把你的ONE API得到的token粘贴进去。
好了,sk-xxxxxxXU73hQgQ6DaB01601610e41B992995cD929C6C4Ec,我的是这样的。
在这里插入图片描述
把oneapi,改成你的 ip。 把 ip填进去替换oneapi就行,其它的不用改

修改FastGPT配置文件 向其中添加模型信息

然后在去修改另一文件。/fastgpt/config.json
为fastGPT添加新模型GLM-4-AirX ,这个是和我们前面ONE API里加入的名字要一致。

 {"provider": "ZhiPu","model": "GLM-4-AirX",  // 新添加的模型"name": "GLM-4-AirX","maxContext": 8000,  // 你可以根据需要设置最大上下文"maxResponse": 4000,  // 最大回复"quoteMaxToken": 8000,// 最大引用内容"maxTemperature": 1,// 最大温度"charsPointsPrice": 0.01,  // n积分/1k token(商业版)"censor": false,// 是否开启敏感校验(商业版)"vision": false,// 是否支持图片输入"datasetProcess": true,"usedInClassify": true,"usedInExtractFields": true,"usedInToolCall": true,"usedInQueryExtension": true,"toolChoice": true,"functionCall": false,"customCQPrompt": "","customExtractPrompt": "","defaultSystemChatPrompt": "","defaultConfig": {"top_p": 0.7 },// 请求API时,挟带一些默认配置(比如 GLM4 的 top_p)"fieldMap": {}}

在这里插入图片描述

添加向量模型

   {"provider": "ZhiPu","model": "embedding-2",    // 模型名(与OneAPI对应)"name": "embedding-2",     // 模型展示名"charsPointsPrice":0.0005, // n积分/1k token"defaultToken": 700,       // 默认文本分割时候的 token"maxToken": 3000,          // 最大 token"weight": 100,             // 优先训练权重"defaultConfig": {} // 自定义额外参数。例如,如果希望使用 embedding3-large 的话,可以传入 dimensions:1024,来返回1024维度的向量。(目前必须小于1536维度)}

在这里插入图片描述
在这里插入图片描述

特别要注意的是,这个名子的大小写,千万不要写错了。 它一会儿大写一会儿小写。 错了的话,就找不到接口。报错了。
在这里插入图片描述

好了。然后在宝塔面板中,重启这两个docker

ok,搞定了,下面就是去配置FastGPT了。 下一篇文章见~。


http://www.ppmy.cn/news/1564430.html

相关文章

CISSP一次通过我的经验分享

2024年3月15日,消费者权益保护日这天,爆出了很多日常外卖的料,朋友圈里都在说以后奶茶不能喝了,炸串不能吃了…….而我却没有关注这些,因为这一天是我CISSP考试的日子! 我平时生活工作在江苏,因…

CVPR 2024 人体姿态估计总汇(3D人体、手语翻译和人体网格恢复/重建等)

1、Human Pose Estimation(人体姿态估计) CLOAF: CoLlisiOn-Aware Human FlowMeta-Point Learning and Refining for Category-Agnostic Pose EstimationSurMo: Surface-based 4D Motion Modeling for Dynamic Human Rendering ⭐codeGALA: Generating Animatable Layered Ass…

图像分类、目标定位与目标检测的区别详解:定义、工作原理、应用场景

《------往期经典推荐------》 一、AI应用软件开发实战专栏【链接】 项目名称项目名称1.【人脸识别与管理系统开发】2.【车牌识别与自动收费管理系统开发】3.【手势识别系统开发】4.【人脸面部活体检测系统开发】5.【图片风格快速迁移软件开发】6.【人脸表表情识别系统】7.【…

【前端动效】HTML + CSS 实现打字机效果

目录 1. 效果展示 2. 思路分析 2.1 难点 2.2 实现思路 3. 代码实现 3.1 html部分 3.2 css部分 3.3 完整代码 4. 总结 1. 效果展示 如图所示,这次带来的是一个有趣的“擦除”效果,也可以叫做打字机效果,其中一段文本从左到右逐渐从…

图论1-问题 C: 算法7-6:图的遍历——广度优先搜索

题目描述 广度优先搜索遍历类似于树的按层次遍历的过程。其过程为:假设从图中的某顶点v出发,在访问了v之后依次访问v的各个未曾被访问过的邻接点,然后分别从这些邻接点出发依次访问它们的邻接点,并使“先被访问的顶点的邻接点”先…

【Linux】线程与同步互斥相关知识详细梳理

目录 1. 线程概念 2. 线程优势 3. 线程劣势 4. 线程控制 4.1 POSIX线程库 4.2 线程操作 5. 线程互斥 5.1 互斥相关概念 5.2 互斥量mutex 5.3 互斥量实现原理 6. 线程同步 6.1 同步概念与竞态条件 6.2 条件变量 6.3 条件变量使用规范及细节 1. 线程概念 什么是…

Linux《Linux简介与环境的搭建》

在学习了C或者是C语言的基础知识之后就可以开始Linux的学习了,现在Linux无论是在服务器领域还是在桌面领域都被广泛的使用,所以Linxu也是我们学习编程的重要环节,在此接下来我们将会花大量的时间在Linxu的学习上。在学习Linux初期你可以会像初…

【设计模式-结构型】代理模式

一、什么是代理模式 在港片中,经常能看到一些酷炫的大哥被警察抓了,警察会试图从他们口中套出一些关键信息。但这些大哥们通常会非常冷静地回应:“我有权保持沉默,我要找我的律师。” 这个律师就像是大哥的“法律盾牌”&#xff…