基于LMStudio本地部署DeepSeek R1

news/2025/2/8 8:01:27/

DeepSeek R1

DeepSeek R1是由DeepSeek团队开发的一款高性能AI推理模型,其开源版本包括完整的DeepSeek R1 671B权重,以及基于其蒸馏出的多个小型模型。

DeepSeek R1通过蒸馏技术将推理模式迁移到更小的模型中,显著提升了这些模型的推理能力。例如:

  • DeepSeek R1-Distill-Qwen-7B:在AIME 2024上达到55.5%,超越QwQ-32B-Preview。

  • DeepSeek R1-Distill-Qwen-32B:在AIME 2024上得分为72.6%,在MATH-500上得分为94.3%,在LiveCodeBench上得分为57.2%,这些结果显著优于之前的开源模型。

LMStudio

LM Studio是一款功能强大的桌面应用程序,用于在本地计算机上运行和管理大型语言模型(LLMs),支持离线运行,确保用户数据的隐私和安全。以下是关于LM Studio的详细介绍:

功能特点

  • 本地运行与离线支持:LM Studio允许用户在本地设备上运行LLMs,完全脱机运行,无需依赖云端服务。

  • 丰富的模型支持:支持从Hugging Face下载多种开源模型,如Llama 2、Vicuna、Mistral、OpenOrca等。此外,它还支持Hugging Face上的任何ggml Llama、MPT和StarCoder模型。

  • 用户友好界面:提供直观的图形化界面,方便用户进行模型搜索、下载和使用。

  • OpenAI兼容API:支持本地服务器模式,提供与OpenAI兼容的API接口,方便开发者集成和调用。

  • 本地文档交互:用户可以将本地文件导入LM Studio,并与模型进行交互,实现文档内容的查询和分析。

  • 模型微调与个性化训练:支持在本地数据集上对模型进行微调,以适应特定领域或任务。

硬件要求

  • 操作系统:支持Windows、macOS(M1/M2/M3芯片)和Linux。

  • 内存:建议至少16GB RAM。

  • 显卡:支持NVIDIA、AMD等多种GPU,推荐使用支持CUDA的显卡。

  • 硬盘空间:至少需要250GB的可用空间。

安装与使用

  1. 下载与安装

    • 访问LM Studio官网,下载适合您操作系统的安装包。

    • 安装完成后,打开LM Studio。

  2. 模型下载与使用

    • 在LM Studio主界面中,通过搜索栏查找并下载所需的模型。

    • 下载完成后,选择模型并开始使用。

  3. 本地服务器模式

    • LM Studio可以作为本地服务器运行,提供与OpenAI兼容的API接口。

    • 用户可以通过API接口在其他程序或应用中调用LM Studio。

优势与挑战

  • 优势

    • 隐私保护:所有数据和计算都在本地进行,确保数据隐私。

    • 多功能集成:除了文本生成,还支持本地文档交互和模型微调。

    • 强大的社区支持:通过Hugging Face集成,用户可以轻松访问和下载丰富的模型资源。

  • 挑战

    • 硬件要求较高:高性能硬件是运行大型模型的必要条件。

    • 技术门槛:尽管界面友好,但模型优化和微调仍需要一定的技术背景。

LM Studio为用户提供了一个灵活、强大的平台,适合对数据隐私要求较高的用户,以及希望在本地环境中运行和管理大型语言模型的开发者。

安装LMStudio

在LMStudio的官网下载对应的安装包,支持 Windows,Linux,MacOS。

LMStudio 官网: https://lmstudio.ai/

下载完之后,打开文件,跟随指引正常安装。

LMStudio 的默认模型下载地址为 Hugging Face 平台,但由于众所周知的原因,我们需要设置一下国内可访问的 HF 镜像源。

打LMStudio的下载地址(最好用VScode打开)

将所有/huggingface.co/
全部替换成/hf-mirror.com/

https://huggingface.co/https://hf-mirror.com/

将https://huggingface.co/全部替换为https://hf-mirror.com/,然后重新打开LMStudio即可。

LMStudio使用

打开软件后,是如下画面:

点击左边的放大镜,在搜索栏中搜索r1

然后点击下载按钮即可。

下载完毕之后就可以在主页面对话啦!

当然LMStudio也支持部署api

点击 LMStudio 主界面的第二个按钮,可以进入开发者界面,打开此处的 api 部署服务,并在 Setting 中选择全部打开,这样就算 windows 部署 LMStudio 之后也可以在wsl 中访问到服务。


http://www.ppmy.cn/news/1570280.html

相关文章

windows 蓝牙驱动开发-传输总线驱动程序常见问题

以下是驱动程序开发人员在开发总线驱动程序以支持蓝牙功能时可能会遇到的一些常见问题和方案。 我的串行总线驱动程序遇到了一些错误。 它意味着什么? 代码 10-49:设备管理器生成的错误代码。 代码 51:当串行总线驱动程序具有相关的控制器…

分析用户请求K8S里ingress-nginx提供的ingress流量路径

前言 本文是个人的小小见解,欢迎大佬指出我文章的问题,一起讨论进步~ 我个人的疑问点 进入的流量是如何自动判断进入iptables的四表?k8s nodeport模式的原理? 一 本机环境介绍 节点名节点IPK8S版本CNI插件Master192.168.44.1…

Leecode刷题C语言之全排列②

执行结果:通过 执行用时和内存消耗如下: int* path; int pathTop; int** ans; int ansTop; int cnt[8];//标记path中是否已有此索引值,这也是同46题不同点 void backTracking(int* nums,int numsSize,int startIndex,int** returnColumnSizes){if(pathT…

git error: invalid path

git clone GitHub - guanpengchn/awesome-books: :books: 开发者推荐阅读的书籍 在windows上想把这个仓库拉取下来,发现本地git仓库创建 但只有一个.git隐藏文件夹,其他文件都处于删除状态。 问题: Cloning into awesome-books... remote:…

QT实现多线程的方法

目录 一、继承QThread类 1)自定义线程类 2)使用自定义的子线程类 3)使用说明 二、利用QThread的消息循环 1)自定义执行类 2)启动子线程 3)方法说明 三、使用线程池 四、方法比较 QT多线程编程常…

LeetCode:47. 全排列 II(dfs Java)

目录 47. 全排列 II 题目描述: 实现代码与解析: dfs 原理思路: 47. 全排列 II 题目描述: 给定一个可包含重复数字的序列 nums ,按任意顺序 返回所有不重复的全排列。 示例 1: 输入:num…

SQLite更新版本

下载并编译最新版本: 访问 SQLite 官网 下载最新版本的源码(如 3.44.2)。 解压并编译:wget https://www.sqlite.org/2024/sqlite-autoconf-3440200.tar.gz tar -xzvf sqlite-autoconf-3440200.tar.gz cd sqlite-autoconf-3440200…

【C语言】球球大作战游戏

目录 1. 前期准备 2. 玩家操作 3. 生成地图 4. 敌人移动 5. 吃掉小球 6. 完整代码 1. 前期准备 游戏设定:小球的位置、小球的半径、以及小球的颜色 这里我们可以用一个结构体数组来存放这些要素,以方便初始化小球的信息。 struct Ball {int x;int y;float r;DWORD c…