LiteLLM - 集成 Qwen、智谱、Moonshot 等国内大模型 API

embedded/2024/12/22 14:56:32/

文章目录


目前 Qwen、智谱、Moonshot 等 LLM 的 API 都做了和 OpenAI 的兼容,所以按照 OpenAI-Compatible Endpoints 教程来配置即可:
https://docs.litellm.ai/docs/providers/openai_compatible


如果采用 Custom API Server (Custom Format) 的方式,可以调通,但 token 不会写入 usage 记录。
https://docs.litellm.ai/docs/providers/custom_llm_server
也可能是我操作使用有问题,欢迎反馈。


配置模型

方式一:
在 后台管理页面,添加模型时,选择 OpenAI-Compatible...

在这里插入图片描述


方式二:编写配置文件

config.yaml 写入如下

api_key 写各个平台申请的key

# general_settings: master_key
model_list:- model_name: mistralai--Mistral-Nemo-Instruct-2407litellm_params:model: huggingface/mistralai/Mistral-Nemo-Instruct-2407api_key: os.environ/HUGGINGFACE_API_KEY- model_name: "my-custom-model"litellm_params:model: "my-custom-llm/my-model"- model_name: "glm-4"litellm_params:model: "openai/glm-4"api_key: "6eeeb...abPJyrc8e"api_base: "https://open.bigmodel.cn/api/paas/v4/"- model_name: "qwen-plus"litellm_params:model: "openai/qwen-plus"api_key: 'sk-40d1c7...1d4'api_base: "https://dashscope.aliyuncs.com/compatible-mode/v1"- model_name: "moonshot-v1-8k"litellm_params:model: "openai/moonshot-v1-8k"api_key: 'sk-d7YcsMzyml...SzPCzQMB5e'api_base: "https://api.moonshot.cn/v1"

运行服务

litellm --config  /Users/.../config.yaml  --detailed_debug

调用测试

import openai
client = openai.OpenAI(api_key="sk-1234",             # pass litellm proxy key, if you're using virtual keysbase_url="http://0.0.0.0:4000" # litellm-proxy-base url
)model_name = "glm-4"
model_name = 'qwen-plus'
model_name = 'moonshot-v1-8k'
response = client.chat.completions.create(model=model_name,messages = [{"role": "user","content": "你吃了吗?"}],
)print(response)

返回

ChatCompletion(id='chatcmpl-66e4e28a9dce9c9fee5e5960', choices=[ Choice(finish_reason='stop', index=0, logprobs=None, message=ChatCompletionMessage(content='作为一个人工智能助手,我没有生理需求,所以不需要吃饭。但是,我很高兴为您提供帮助。请问有什么问题我可以帮您解答吗?', refusal=None, role='assistant', function_call=None, tool_calls=None))], created=1726276234, model='moonshot-v1-8k', object='chat.completion', service_tier=None, system_fingerprint=None, usage=CompletionUsage(completion_tokens=28, prompt_tokens=11, total_tokens=39, completion_tokens_details=None)
)

2024-09-14(买五送一的周六)


http://www.ppmy.cn/embedded/111479.html

相关文章

工业园生活污水处理设备产地货源

诸城市鑫淼环保小编带大家了解一下工业园生活污水处理设备产地货源 工业园生活污水处理设备是保障园区内生活污水得到有效处理的重要设施。这些设备种类繁多,功能各异,但总体上可以分为预处理设备、生化处理设备、深度处理设备、消du设备、污泥处理设备及…

【计算机网络】概述篇

目录 导学 计算机网络的发展简史 互联网的发展历史 中国互联网的发展历史 计算机网络的层次结构 层次结构设计的基本原则 OSI七层模型 TCP/IP四层模型 现代互联网的网络拓扑 计算机网络的性能指标 速率 时延 发送时延 ​传播时延 ​排队时延 处理时延 总时延 …

Python爬虫案例六:抓取某个地区某月份天气数据并保存到mysql数据库中

测试链接:https://lishi.tianqi.com/guangzhou/202003.html源码: import requests, pymysql from lxml import etree class ThSpider(object):def __init__(self):# 初始化self.month_list [202101, 202102, 202103, 202104, 202105, 202106, 202107, 2…

快速完成论文初稿写作的ChatGPT提示词分享

学境思源,一键生成论文初稿: AcademicIdeas - 学境思源AI论文写作 随着人工智能技术的迅速发展,ChatGPT已经成为学术写作中不可忽视的工具。它不仅能帮助研究者提高写作效率,还能在初稿撰写过程中提供结构化的建议和内容生成支持…

llama神经网络的结构,llama-3-8b.layers=32 llama-3-70b.layers=80; 2000汉字举例说明

AI大模型全套学习资料 “最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。 这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。 我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成…

SpringSecurity原理解析(六):SecurityConfigurer 解析

1、SecurityConfigurer SecurityConfigurer 在 Spring Security 中是一个非常重要的接口,观察HttpSecurity 中的很多 方法可以发现,SpringSecurity 中的每一个过滤器都是通过 xxxConfigurer 来进行配置的,而 这些 xxxConfigurer 其实都是 Sec…

暑假第四周——天气预报仿写

iOS学习 前言简介首页简单的网络申请 搜索功能添加功能 详情总结 前言 作为最后一个项目,暑期培训也迎来了尾声。这个项目中初次尝试了网络申请,在iOS学习中迈出重要一步。 简介 该项目主要有搜索,预览,添加,详情几个…

Unity Timeline

数据存储 TimeLine和Animation一样也是资源,以.playable的格式存储,可以通过Playable Director进行加载播放。 Playable具有以下优势: 结构简单; 运行时创建、添加和删除; 更加灵活,可以直接控制动画的各种…