【DeepSeek】DeepSeek概述 | 本地部署deepseek

news/2025/2/12 14:25:55/

目录

1 -> 概述

1.1 -> 技术特点

1.2 -> 模型发布

1.3 -> 应用领域

1.4 -> 优势与影响

2 -> 本地部署

2.1 -> 安装ollama

deepseek-r1%E6%A8%A1%E5%9E%8B-toc" style="margin-left:40px;">2.2 -> 部署deepseek-r1模型


1 -> 概述

DeepSeek是由中国的深度求索公司开发的一系列人工智能模型,以其高效的性能和低成本的训练而受到关注。以下是其主要介绍:

1.1 -> 技术特点

  • 混合专家架构(MoE):DeepSeek-V3采用MoE架构,总参数达6710亿,但每个输入只激活370亿参数,通过动态冗余策略,在推理和训练过程中保持最佳的负载平衡,大大降低了计算成本,同时保持高性能。
  • 多头潜在注意力(MLA):引入多头潜在注意力机制,通过低秩联合压缩机制,将Key-Value矩阵压缩为低维潜在向量,显著减少内存占用。
  • 无辅助损失负载均衡:采用无辅助损失负载均衡策略,最小化因鼓励负载均衡而导致的性能下降。
  • 多Token预测(MTP):采用多Token预测目标,证明其对模型性能有益,并可用于推理加速。
  • FP8混合精度训练:设计了FP8混合精度训练框架,首次验证了在极大规模模型上进行FP8训练的可行性和有效性。
  • 知识蒸馏:DeepSeek-R1通过知识蒸馏,将长链推理(CoT)模型的推理能力蒸馏到标准LLM中,显著提升了推理性能。

1.2 -> 模型发布

  • DeepSeek-V3:2024年12月发布,总参数达6710亿,采用创新的MoE架构和FP8混合精度训练,训练成本仅为557.6万美元,在聊天机器人竞技场(Chatbot Arena)上排名第七,在开源模型中排名第一,是全球前十中性价比最高的模型。
  • DeepSeek-R1:2025年1月发布,性能与OpenAI的o1正式版持平,并开源,在Chatbot Arena综合榜单上排名第三,与OpenAI的o1并列,在高难度任务上表现出色。
  • Janus-Pro:2025年1月28日发布,分为7B(70亿)和1.5B(15亿)两个参数量版本,且均为开源,在多模态理解和文本到图像的指令跟踪功能方面取得重大进步,同时增强了文本到图像生成的稳定性,在多项基准测试中表现出色,甚至强于OpenAI旗下的DALL-E 3,以及Stable Diffusion。

1.3 -> 应用领域

  • 自然语言处理:能够理解并回答用户的问题,进行文本生成、翻译、摘要等任务,可用于智能客服、内容创作、信息检索等领域。
  • 代码生成与调试:支持多种编程语言的代码生成、调试和数据分析任务,帮助程序员提高工作效率。
  • 多模态任务:如Janus-Pro模型可进行文生图、图生文等多模态任务,在图像生成、图像理解等方面有应用潜力。

1.4 -> 优势与影响

  • 成本效益高:通过算法优化和架构创新,在保证性能的前提下,大幅降低了训练和推理成本,使AI技术更易于普及和应用。
  • 开源策略:采用完全开源策略,吸引了大量开发者和研究人员的关注,促进了AI社区的协作和技术的快速发展。
  • 推动行业变革:DeepSeek的成功挑战了传统的“大力出奇迹”的AI发展模式,为行业提供了新的发展思路和方向,激发了更多的创新和探索。

2 -> 本地部署deepseek

2.1 -> 安装ollama

ollama官网

  • 点击Download下载 

  • 选择对应的操作系统,本次以Windows操作系统为例

点击Download for Windows下载。 

  • 下载完成后,打开文件开始安装OllamaSetup

  • 点击Install开始下载,等待下载完成

  • 检查是否安装成功

win+R输入cmd调出命令行进入到命令模式,输入命令ollama -v查看是否安装成功,输入完命令出现了版本号的话就说明安装成功。

deepseek-r1%E6%A8%A1%E5%9E%8B">2.2 -> 部署deepseek-r1模型

  • 回到ollama官网点击左上角的Models进入如下界面。并选择第一个deepseek-r1,点击进入

  • 选择适合自己电脑配置的版本

  • 选择好后,复制对应版本后的命令

  • win+R输入cmd调出命令行进入到命令模式,输入命令

如果觉得下载速度慢,可以Ctrl+C先退出这个命令,然后再输入命令重新进行下载,还是会接着上次的下载进度继续下载,速度会稍微快一些。

  • 下载完成后会出现success,接下来就可以进行对话了

  • 问一个AI经常会出错的问题:9.11和9.9哪个大

可以看到,会给出思考过程以及最终结论。 

  • 输入命令/bye可以退出对话

  • 输入命令ollama list可以查看下载好的模型

  • 输入ollama run + 对应的模型就可以进入对话

 这里输入ollama run deepseek-r1:latest可以发现再一次进入对话。

这样本地部署deepseek就算完成啦


感谢各位大佬支持!!!

互三啦!!!


http://www.ppmy.cn/news/1571438.html

相关文章

蓝桥杯51单片机练习(国信长天比赛用)

文章目录 代码实现头文件固定模板延时函数HC138译码器和或非门流水灯闪烁次数(假设闪烁5次)从左向右依次亮从左向右依次灭 总代码 代码实现 头文件 #include <REGX52.H> 固定模板 void main() { while(1) { } } 延时函数 void Delay(unsigned char t) { while(t–…

【AI知识点】苦涩的教训 The Bitter Lesson by Rich Sutton(2019)

【AI论文解读】【AI知识点】【AI小项目】【AI战略思考】【AI日记】【读书与思考】【AI应用】 “The Bitter Lesson” 是由 Richard Sutton&#xff08;强化学习领域的先驱之一&#xff09;提出的一个概念&#xff0c;指的是机器学习领域在长期发展过程中&#xff0c;尤其是在强…

对React中类组件和函数组件的理解?

React 中的 类组件 和 函数组件 是两种不同的组件定义方式&#xff0c;它们都可以用来创建 UI&#xff0c;但在语法、特性和使用场景上有一些区别。以下是它们的详细对比和理解&#xff1a; 1. 类组件&#xff08;Class Components&#xff09; 特点 基于 ES6 的类&#xff1a…

Oracle认证大师(OCM)学习计划书

Oracle认证大师&#xff08;OCM&#xff09;学习计划书 一、学习目标 Oracle Certified Master&#xff08;OCM&#xff09;是Oracle官方认证体系中的最高级别认证&#xff0c;要求考生具备扎实的数据库管理技能、丰富的实战经验以及解决复杂问题的能力。本计划旨在通过系统化的…

Ubuntu 安装 NVIDIA 驱动实操指南(含卸载)

本文将详细介绍如何在Ubuntu上安装和配置NVIDIA显卡驱动。以下是一步步的操作流程&#xff0c;包括禁用开源驱动的步骤。 步骤 1&#xff1a;安装依赖 首先&#xff0c;确保系统中已安装gcc和make&#xff0c;这些是编译驱动所需的依赖。 sudo apt update sudo apt install …

Python 面向对象(类,对象,方法,属性,魔术方法)

前言&#xff1a;在讲面向对象之前&#xff0c;我们先将面向过程和面向对象进行一个简单的分析比较&#xff0c;这样我们可以更好的理解与区分&#xff0c;然后我们在详细的讲解面向对象的优势。 面向过程&#xff08;Procedure-Oriented Programming&#xff0c;POP&#xff0…

利用deepseek参与软件测试 基本架构如何 又该在什么环节接入deepseek

利用DeepSeek参与软件测试&#xff0c;可以考虑以下基本架构和接入环节&#xff1a; ### 基本架构 - **数据层** - **测试数据存储**&#xff1a;用于存放各种测试数据&#xff0c;包括正常输入数据、边界值数据、异常数据等&#xff0c;这些数据可以作为DeepSeek的输入&…

office高效AI插件

office-ai插件&#xff1a;https://www.office-ai.cn/static/introductions/officeai/introduction.html 下载后双击无脑安装即可 安装完成后顶部没有officeAI&#xff0c;会有一行黄色的点击可以导入的提示信息&#xff0c;导入一下就有啦 如果还是没有可以从设置中信任第三…