FastGPT结合New-api,遍享各类大模型

server/2025/1/20 1:36:52/

​​欢迎关注【AI技术开发者】

上文中,我们成功搭建了FastGPT服务和New-api服务

我们现在需要配置New-api服务,使用New-api来同时使用多个厂商的大模型服务,如豆包、通义千问、混元、文心一言、Kimi等模型

 

首先,我们需要修改FastGPT容器的环境变量

OPENAI_BASE_URL = // New-api的服务地址,容器地址或外网地址都行
CHAT_API_KEY = // 访问Token

Token生成地址:

74a29fc97f444e618e18f2002e6780dd.png

注意修改额度,以防不够用

3da16ecd353a46d3af7c51ecae46f352.png

fe318f14b9624f69b3b814e00f920bff.png

然后修改FastGPT容器的config.json​文件中的llmModels​字段

这个是语言模型和视觉模型,按以下格式修改后放在这个文件里面

{"provider": "OpenAI", // 模型提供商,主要用于分类展示,目前已经内置提供商包括:https://github.com/labring/FastGPT/blob/main/packages/global/core/ai/provider.ts, 可 pr 提供新的提供商,或直接填写 Other"model": "gpt-4o-mini", // 模型名(对应OneAPI中渠道的模型名)"name": "gpt-4o-mini", // 模型别名"maxContext": 125000, // 最大上下文"maxResponse": 16000, // 最大回复"quoteMaxToken": 120000, // 最大引用内容"maxTemperature": 1.2, // 最大温度"charsPointsPrice": 0, // n积分/1k token(商业版)"censor": false, // 是否开启敏感校验(商业版)"vision": true, // 是否支持图片输入"datasetProcess": true, // 是否设置为文本理解模型(QA),务必保证至少有一个为true,否则知识库会报错"usedInClassify": true, // 是否用于问题分类(务必保证至少有一个为true)"usedInExtractFields": true, // 是否用于内容提取(务必保证至少有一个为true)"usedInToolCall": true, // 是否用于工具调用(务必保证至少有一个为true)"usedInQueryExtension": true, // 是否用于问题优化(务必保证至少有一个为true)"toolChoice": true, // 是否支持工具选择(分类,内容提取,工具调用会用到。)"functionCall": false, // 是否支持函数调用(分类,内容提取,工具调用会用到。会优先使用 toolChoice,如果为false,则使用 functionCall,如果仍为 false,则使用提示词模式)"customCQPrompt": "", // 自定义文本分类提示词(不支持工具和函数调用的模型"customExtractPrompt": "", // 自定义内容提取提示词"defaultSystemChatPrompt": "", // 对话默认携带的系统提示词"defaultConfig": {}, // 请求API时,挟带一些默认配置(比如 GLM4 的 top_p)"fieldMap": {} // 字段映射(o1 模型需要把 max_tokens 映射为 max_completion_tokens)},

model为New-api中的模型名称

name为自定义名称,自己认识就行

vision注意语言模型不支持图片输入

 

下面修改vectorModels​字段,部署向量模型(解析知识库需要用到)

按以下格式:

{"provider": "通义千问","model": "qwen-multimodal-embedding-v1", // 模型名(与OneAPI对应)"name": "通义千问-多模态向量", // 模型展示名"charsPointsPrice": 0, // n积分/1k token"defaultToken": 700, // 默认文本分割时候的 token"maxToken": 3000, // 最大 token"weight": 100, // 优先训练权重"defaultConfig": {}, // 自定义额外参数。例如,如果希望使用 embedding3-large 的话,可以传入 dimensions:1024,来返回1024维度的向量。(目前必须小于1536维度)"dbConfig": {}, // 存储时的额外参数(非对称向量模型时候需要用到)"queryConfig": {} // 参训时的额外参数}

下面部署重排模型,对知识库搜索结果进行排序,这个用处不大

修改reRankModels​字段,按以下格式:

{"model": "qwen-gte-rerank", // 模型名称"name": "通义千问-重排", // 随意"charsPointsPrice": 0,"requestUrl": "new-api/v1/rerank","requestAuth": "安全凭证,已自动补 Bearer"}

 

全部修改完毕后,重启容器

进入web页面,看到

c5e00845ccd248c794e6fcf83f19b18f.png

即为接入成功

现在 我们创建一个应用 测试一下模型是否可用

79835033bb9c46849eb14a8866af9e43.png

​欢迎关注【AI技术开发者】

 


http://www.ppmy.cn/server/159774.html

相关文章

Python毕业设计选题:基于python的酒店推荐系统_django+hadoop

开发语言:Python框架:djangoPython版本:python3.7.7数据库:mysql 5.7数据库工具:Navicat11开发软件:PyCharm 系统展示 管理员登录 管理员功能界面 用户管理 酒店客房管理 客房类型管理 客房预定管理 用户…

Redis - 环境搭建

目录 在Ubuntu上安装Redis在Centos上安装RedisCentos7Centos8 版本:使用Redis5系列 操作系统:在Linux中进行安装(Redis官方不支持Windows版本) 在Ubuntu上安装Redis 更新软件包: sudo apt-get update搜索相关软件包…

深度学习中的张量 - 使用PyTorch进行广播和元素级操作

深度学习中的张量 - 使用PyTorch进行广播和元素级操作 元素级是什么意思? 元素级操作在神经网络编程中与张量的使用非常常见。让我们从一个元素级操作的定义开始这次讨论。 一个_元素级_操作是在两个张量之间进行的操作,它作用于各自张量中的相应元素…

发布工具包 到npm 服务

操作步骤如下: 1. 创建文件夹,并创建文件 index.js, 在文件中声明函数,使用 module.exports 暴露 2. npm 初始化工具包,package.json 填写包的信息 (包的名字是唯一的) 3. 注册账号 https://www.npmjs.com/signup …

实现类似Excel的筛选

以下是在 DataGridView 中实现类似 Excel 下拉筛选功能的解决方案: 解决思路 为 DataGridView 的列添加 DataGridViewComboBoxColumn 类型的列,用于显示下拉筛选列表。为 DataGridView 的 ColumnHeaderMouseClick 事件添加处理程序,当用户点…

图像分类、目标定位与目标检测的区别详解:定义、工作原理、应用场景

《------往期经典推荐------》 一、AI应用软件开发实战专栏【链接】 项目名称项目名称1.【人脸识别与管理系统开发】2.【车牌识别与自动收费管理系统开发】3.【手势识别系统开发】4.【人脸面部活体检测系统开发】5.【图片风格快速迁移软件开发】6.【人脸表表情识别系统】7.【…

青少年编程与数学 02-007 PostgreSQL数据库应用 02课题、PostgreSQL数据库安装

青少年编程与数学 02-007 PostgreSQL数据库应用 02课题、PostgreSQL数据库安装 一、安装Windows系统安装PostgreSQL 17Linux系统安装PostgreSQL 17 二、配置Windows系统Linux系统 三、启动(一)Windows系统使用服务管理器(services.msc&#x…

微信小程序:中途退出原页面,再次进入无法回到退出时的位置

相信很多微信小程序的开发者都会碰到这样的问题,那今天我们就来详细的看下如何解决 一、使用 scroll-view 组件保存滚动位置: 在 wxml 文件中,使用 scroll-view 组件包裹需要滚动的内容。在 data 中定义一个变量来存储 scroll-view 的 scro…