vllm稳定输出json

ops/2025/1/18 17:53:05/

vllm版本

0.6.6

请求样例

python">def send_call_json(prompt="You are a helpful assistant.",msg="",top_p=1.0,temperature=0.7):import requests, json, traceback, timeretry_count = 5data = {"model":"Qwen2__5-72B-Instruct","messages": [{"role": "system","content": prompt},{"role": "user","content": msg},],"stream":0,"stop": ["<|EOT|>", "<|im_end|>"],"top_p":top_p,"repetition_penalty":1.05,"temperature":temperature,# 此参数用以强制返回json"response_format": {"type": "json_object"}}for i in range(0, retry_count):try:url = "自己的地址"headers = {"Content-Type": "application/json"}print(f"请求\n{data}")response = requests.post(url,data=json.dumps(data, ensure_ascii=False).encode('utf8'),headers=headers,timeout=300)response.encoding = 'utf-8'print(f"响应\n{response.text}")response_json = response.json()content = response_json["choices"][0]["message"]["content"]return contentexcept Exception:'''模型不停输出导致超时时,修改下面两个参数为默认值'''data["top_p"] = 1.0data["temperature"] = 0.7print(f"报错再次尝试 {i} {traceback.format_exc()}")time.sleep(5)return ""

http://www.ppmy.cn/ops/151147.html

相关文章

干部调整系统核心功能:规则匹配合规判断与“沙盘推演”模拟调整

在现代组织管理体系中&#xff0c;干部调整是一项复杂而敏感的任务&#xff0c;它不仅关乎组织的效能与活力&#xff0c;还直接影响到组织的稳定与发展。为了应对这一挑战&#xff0c;干部调整系统应运而生&#xff0c;该系统通过集成先进的信息技术和科学的管理方法&#xff0…

【React学习笔记】第二章:React面向组件编程

1.安装React 开发者工具调试 1.在Chrome应用商店中添加扩展程序&#xff1a;React Developer Tools 2.在github上下载压缩包&#xff1a;https://github.com/facebook/react-devtools/tree/v3 安装好之后运行react项目按F12打开浏览器控制台会多出两个tab栏&#xff1a; ● …

Tesla Free - Fall attack:特斯拉汽车网络安全攻击事件分析

文章目录 一、Tesla Free - Fall attack&#xff1a;特斯拉汽车网络安全事件纪要1. 引言2. 攻击流程2.1 攻击切入点2.2 系统入侵2.3 CAN 总线操控 3. 影响后果4. 特斯拉应对措施5. 研究意义二、安全攻击事件技术分析以及相应的检测和缓解措施 一、Tesla Free - Fall attack&…

如何在后端使用redis进行缓存,任意一种语言都可以

在后端使用 Redis 可以显著提升应用的性能&#xff0c;特别是在处理高并发请求、缓存数据、会话管理、消息队列等场景。以下是关于如何在 Spring Boot 项目中集成和使用 Redis 的详细讲解。 1. 添加依赖 首先&#xff0c;在 pom.xml 文件中添加 Redis 相关的依赖。Spring Boo…

Springboot + vue 图书管理系统

&#x1f942;(❁◡❁)您的点赞&#x1f44d;➕评论&#x1f4dd;➕收藏⭐是作者创作的最大动力&#x1f91e; &#x1f496;&#x1f4d5;&#x1f389;&#x1f525; 支持我&#xff1a;点赞&#x1f44d;收藏⭐️留言&#x1f4dd;欢迎留言讨论 &#x1f525;&#x1f525;&…

如何通过 Nginx 实现 CouchDB 集群的负载均衡并监控请求分发

在现代分布式系统中&#xff0c;负载均衡是确保高可用性和性能的关键组件。CouchDB 是一个强大的分布式数据库&#xff0c;而 Nginx 是一个高性能的反向代理和负载均衡器。本文将详细介绍如何通过 Nginx 实现 CouchDB 集群的负载均衡&#xff0c;并监控请求被分发到哪一台 Couc…

linux系统监视(centos 7)

一.系统监视 1.安装iostat&#xff0c;sar&#xff0c;sysstat&#xff08;默认没有&#xff0c;安装过可以跳跃&#xff09; iostat 和 sar&#xff1a; 同样&#xff0c;iostat 和 sar 是 sysstat 软件包的一部分。使用以下命令安装&#xff1a;sudo yum install sysstat解释…

图解Git——分布式Git《Pro Git》

分布式工作流程 Centralized Workflow&#xff08;集中式工作流&#xff09; 所有开发者都与同一个中央仓库同步代码&#xff0c;每个人通过拉取、提交来合作。如果两个开发者同时修改了相同的文件&#xff0c;后一个开发者必须在推送之前合并其他人的更改。 Integration-Mana…