一键运行大语言模型服务，搭建聊天应用

一键运行大语言模型服务，搭建聊天应用

news/2025/1/16 0:48:21/

前言

本文介绍一个可以快速搭建本地大语言模型的聊天服务，模型和代码已全部提供，不需要联网运行。项目使用的是Qwen-7B-Int4模型，只需要8G显存的显卡都能流畅运行，无论是Windows还是Linux系统都支持使用。

安装环境

安装GPU版本的Pytorch。

conda install pytorch torchvision torchaudio pytorch-cuda=11.8 -c pytorch -c nvidia

安装其他依赖库。

pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

启动服务

执行server.py程序，启动大语言模型服务。

python server.py

Android应用

使用Android Studio打开源码中的AndroidClient目录，这是一个Android应用源码，打开之后首先就要修改服务t地址CHAT_HOST，将它修改为你上面使用的服务器IP地址，点击运行安装到Android手机上。

应用效果图：

知识星球

扫码入知识星球，搜索【基于大语言模型的聊天应用】获取源码

知识星球

http://www.ppmy.cn/news/1172077.html

相关文章

深入浅出Apache SeaTunnel SQL Server Sink Connector

深入浅出Apache SeaTunnel SQL Server Sink Connector

在大数据时代，数据的迁移和流动已经变得日益重要。为了使数据能够更加高效地从一个源流向另一个目标，我们需要可靠、高效和易于配置的工具。今天，我们将介绍 JDBC SQL Server Sink Connector，这是一个专为 SQL Server 设计的连接器…

阅读更多...

接口测试 Jmeter 接口测试 —— 请求 Headers 与传参方式

接口测试 Jmeter 接口测试 —— 请求 Headers 与传参方式

一、背景： 在使用 Jmeter 进行接口测试时，有些小伙伴不知道 Headers 和请求参数 (Parameters，Body Data) 的联系，本文主要讲 Content-Type 为 application/x-www-form-urlencoded 和 application/json 的场景。 1、使用 Parame…

阅读更多...

生成式AI - 基于大模型的应用架构与方案

生成式AI - 基于大模型的应用架构与方案

这篇文章探讨了使用文档加载器、嵌入、向量存储和提示模板构建基于语言模型(LLM)应用程序的过程。由于其生成连贯且上下文相关的文本的能力，LLM在自然语言处理任务中变得越来越受欢迎。本文讨论了LLM的重要性，比较了微调和上下文注入方法，介绍…

阅读更多...

目标检测的方法

目标检测的方法

目标检测大致分为两个方向：基于传统的目标检测算法和基于深度学习的目标检测算法。 1.基于传统的目标检测算法在利用深度学习做物体检测之前，传统算法对于目标检测通常分为3个阶段：区域选取、特征提取和体征分类。 2.基于深度学习的目标检测算法目标检测任务可分为两

阅读更多...

redis的key超时策略和key淘汰机制（面试题详解）

redis的key超时策略和key淘汰机制（面试题详解）

ChatGPT给出的回答： Redis中的Key超时策略和Key淘汰机制是为了有效管理内存和控制数据的生命周期。 Key超时策略：Redis可以为每个Key设置过期时间，一旦Key过期，它将自动从Redis中删除。可以使用EXPIRE命令为Key设置过期时间&…

阅读更多...

基于Spring Boot的精准扶贫管理系统

基于Spring Boot的精准扶贫管理系统

文章目录项目介绍主要功能截图：部分代码展示设计总结项目获取方式🍅 作者主页：超级无敌暴龙战士塔塔开 🍅 简介：Java领域优质创作者🏆、简历模板、学习资料、面试题库【关注我，都给你】 🍅文末获取源码联系🍅 项目介绍基于Spring Boot的精准扶贫管理系统,jav…

阅读更多...

day10_面向对象_抽象_接口

day10_面向对象_抽象_接口

今日内容 1.作业 2.final 3.抽象 4.接口零、复习按从大到小的顺序写出访问修饰符 public > protected > package (default)> private static修饰属性和方法的特点在内存的特点: 在方法区(不是在堆,也不是在栈)初始化的特点: 随类(字节码文件)加载到内存已经初始化使…

阅读更多...

LeetCode--快速排序

LeetCode--快速排序

文章目录 1 排序原理2 代码实现 1 排序原理 quickSort(int[] arr, int left, int right) 参数描述 arr: 待排序的数组left: 排序的左边位置right: 排序的右边位置排序步骤: 先选取左边节点的数据作为 pivot从右边开始, 向左遍历节点数据, 在满足right > left 条件前提下…

阅读更多...

最新文章