vllm部署记录

server/2024/10/22 12:33:27/

1. pip安装

pip install vllm

下载模型在huggingface.co

注意在modelscope上的这个opt-125m好像不行了,我git不下来报错

启动服务

vllm serve opt-125m --model opt-125m --port 8888

第一个opt-125m是名字,可以在vllm支持的模型中查到,第二个是模型存放文件夹及其路径
也可以

python -m vllm.entrypoints.openai.api_server --model=opt-125m --port 8888

客户端

curl http://localhost:8888/v1/completions \-H "Content-Type: application/json" \-d '{"model": "opt-125m","prompt": "San Francisco is a","max_tokens": 7,"temperature": 0}'

或者从

git clone https://www.modelscope.cn/OpenBMB/miniCPM-bf16.git

然后启动

python -m vllm.entrypoints.openai.api_server --model=miniCPM-bf16 --port 8888 --trust-remote-code

客户端

curl http://localhos

http://www.ppmy.cn/server/90127.html

相关文章

Unity中有关Animation的一点笔记

也许更好的阅读体验 Animation Unity中Animation类并不是直接记载了和播放动画有关的信息,可以简单理解Animation为一个动画播放器,播放的具体内容就像卡带一样,当我们有了卡带后我们可以播放动画。 对应的则是编辑器中的组件 所以Anima…

C++之栈和队列使用及模拟实现

目录 栈的使用 队列的使用 栈的模拟实现 队列的模拟实现 deuqe容器介绍 在C语言中我们已经学习了栈和队列的相关性质,今天我们主要来学习C语法中栈和队列的相关概念。 栈的使用 在C中栈是一种容器适配器,在其内部适配了其它的容器,其相…

探索若依(Ruoyi):开源的企业级后台管理系统解决方案

探索若依(Ruoyi):开源的企业级后台管理系统解决方案 在现代企业管理中,拥有一个高效、稳定的后台管理系统是至关重要的。若依(Ruoyi)作为一款开源的企业级后台管理系统,为企业提供了丰富的功能…

【前端 13】Vue快速入门

Vue快速入门 在现代Web开发中,尽管通过HTML、CSS和JavaScript我们能够构建出美观且功能丰富的页面,但随着项目规模的增大,这种传统的开发方式在效率上逐渐显得力不从心。为了提高开发效率,前端开发者们引入了多种框架和库&#x…

IT服务运营过程中的资源要素管理(至简)

在IT服务运营管理过程中,所有资源要投入正式、连续、稳定运行,要保持规范化的管理和标准化的操作,具体包括工具管理、知识管理、服务台管理与评价、备件库管理等内容。 一、工具管理 1、工具的基本运营。见下表: 工具的基本运营…

Redis:AOF持久化

1. 简介 以日志的形式来记录每个写操作,将redis执行的每个写操作记录下来(读操作不记录),只需追加文件但不可以改写文件,redis启动之初会重新构建数据,即redis重启后会将日志中的所有写指令重新执行一遍以达…

Linux Vim教程(二):基本命令和操作

目录 1. 进入和退出Vim 1.1 启动Vim 1.2 退出Vim 2. 模式切换 2.1 切换到插入模式 2.2 切换到普通模式 2.3 切换到命令模式 2.4 切换到可视模式 3. 移动光标 4. 编辑文本 4.1 插入和追加文本 4.2 删除文本 4.3 复制和粘贴文本 4.4 撤销和重做 5. 搜索和替换 5.…

CSS技巧专栏:一日一例 11 -纯CSS实现多彩渐变按钮系列特效

CSS技巧专栏:一日一例 11 -纯CSS实现多彩渐变按钮系列特效 本篇,推荐给你几个按钮,先看一下图片 本例图片 案例分析 这是一个系列的按钮,它们具有共同的特点: 底层按钮层,具有一个彩色的渐变边框,上层是依据hover效果需要,可以是渐变,可以时白色。 鼠标hover效果…