12、xinference部署与自定义模型

devtools/2025/1/15 15:56:14/

1、环境创建

创建虚拟环境

conda create --name xinference python=3.10.9

激活虚拟环境

conda activate xinference

2、安装文件

官网:https://inference.readthedocs.io/zh-cn/latest/getting_started/installation.html

pip install "xinference[transformers]"

启动服务

xinference-local --host 0.0.0.0 --port 9997

便可在本地进行运行

3、下载本地模型

我们以embedding模型为例测试
下载一个本地的模型,可以在魔塔社区进行下载
https://www.modelscope.cn/models/Jerry0/text2vec-base-chinese
在这里插入图片描述

记住下载文件的路径,可以在代码中进行设置自定义的路径

#模型下载
from modelscope import snapshot_download
model_dir = snapshot_download('Jerry0/text2vec-base-chinese',cache_dir='../models')

4、注册

xinference界面选择注册模型–>embedding模型,根据实际的参数进行填写,主要是路径要写对
在这里插入图片描述
如果报错,需要去安装依赖包
在这里插入图片描述

 pip install sentence-transformers

安装后重新注册并launch
在这里插入图片描述

over


http://www.ppmy.cn/devtools/110965.html

相关文章

什么是站点内部搜索垃圾邮件攻击以及如何防范

过去一年中,我们发现很多WordPress网站遭遇了大规模的SEO垃圾邮件攻击,这些攻击主要针对网站内部的搜索功能。虽然这些攻击对SEO本身的影响不大,但却浪费了大量的时间和资源。 虽然大部分网站可能不需要担心这个问题,但如果你的网…

Linux中限制服务如mysql的最大cpu使用率

1、cpu占用测试&#xff1a; DELIMITER // DROP PROCEDURE IF EXISTS intensive_calculations; CREATE PROCEDURE intensive_calculations() BEGINDECLARE v INT DEFAULT 0;DECLARE i INT DEFAULT 0;WHILE i < 1000000 DOSET v SQRT(i * i (RAND() * 10000));SET i i 1…

Gradle和Maven

Gradle 和 Maven 都是 Java 生态中常用的构建工具&#xff0c;用于管理项目的编译、测试、依赖管理和打包等任务。两者在很多方面有相似之处&#xff0c;但也有显著的不同&#xff0c;选择使用哪个工具通常取决于项目的具体需求和团队的偏好。 Gradle 与 Maven 的比较 特性Gr…

基于SSM的二手物品交易管理系统的设计与实现 (含源码+sql+视频导入教程+文档+PPT)

&#x1f449;文末查看项目功能视频演示获取源码sql脚本视频导入教程视频 1 、功能描述 基于SSM的二手物品交易管理系统7拥有两种角色 管理员&#xff1a;用户管理、分类管理、商品管理、订单管理、系统管理等 用户&#xff1a;登录注册、充值、收货、评价、收藏、购物车、订…

Leetcode面试经典150题-162.寻找峰值

解法都在代码里&#xff0c;不懂就留言或者私信 想清楚的话会特别简单&#xff0c;你可能想不到这是个二分。。。 class Solution {/**本题题目规定我们只能用O(logN)的时间复杂度来解题&#xff0c;这显然就是让二分嘛而题目给的数组本身是无需&#xff0c;怎么二分呢其实我…

PHP-SER-libs靶场通关(1-9)

一.第一关&#xff08;基础序列化&#xff09; <?php highlight_file(__FILE__); class a{var $act;function action(){eval($this->act);} } $aunserialize($_GET[flag]); $a->action(); ?> 一个很基础的反序列过程 对输入的flag进行反序列化&#xff0c;再…

OpenCV结构分析与形状描述符(9)检测轮廓相对于其凸包的凹陷缺陷函数convexityDefects()的使用

操作系统&#xff1a;ubuntu22.04 OpenCV版本&#xff1a;OpenCV4.9 IDE:Visual Studio Code 编程语言&#xff1a;C11 算法描述 查找一个轮廓的凸性缺陷。 下图显示了一个手部轮廓的凸性缺陷&#xff1a; convexityDefects 是 OpenCV 库中的一个函数&#xff0c;用于检测轮…

本地部署Llama 3.1大模型

Meta推出的Llama 3.1系列包括80亿、700亿、4050亿参数版本&#xff0c;上下文长度扩展至12.8万tokens&#xff0c;并增加了对八种语言的支持。 部署模型需要用到Ollama的一个工具&#xff0c;访问官方网站https://ollama.com 点击下载&#xff0c;选择下载你对应的操作系统下…