【DeepSeek】DeepSeek概述 | 本地部署deepseek

【DeepSeek】DeepSeek概述 | 本地部署deepseek

server/2025/2/12 1:10:39/

目录

1 -> 概述

1.1 -> 技术特点

1.2 -> 模型发布

1.3 -> 应用领域

1.4 -> 优势与影响

2 -> 本地部署

2.1 -> 安装ollama

deepseek-r1%E6%A8%A1%E5%9E%8B-toc" name="tableOfContents" style="margin-left:40px">2.2 -> 部署deepseek-r1模型

1 -> 概述

DeepSeek是由中国的深度求索公司开发的一系列人工智能模型，以其高效的性能和低成本的训练而受到关注。以下是其主要介绍：

1.1 -> 技术特点

混合专家架构(MoE)：DeepSeek-V3采用MoE架构，总参数达6710亿，但每个输入只激活370亿参数，通过动态冗余策略，在推理和训练过程中保持最佳的负载平衡，大大降低了计算成本，同时保持高性能。
多头潜在注意力(MLA)：引入多头潜在注意力机制，通过低秩联合压缩机制，将Key-Value矩阵压缩为低维潜在向量，显著减少内存占用。
无辅助损失负载均衡：采用无辅助损失负载均衡策略，最小化因鼓励负载均衡而导致的性能下降。
多Token预测(MTP)：采用多Token预测目标，证明其对模型性能有益，并可用于推理加速。
FP8混合精度训练：设计了FP8混合精度训练框架，首次验证了在极大规模模型上进行FP8训练的可行性和有效性。
知识蒸馏：DeepSeek-R1通过知识蒸馏，将长链推理(CoT)模型的推理能力蒸馏到标准LLM中，显著提升了推理性能。

1.2 -> 模型发布

DeepSeek-V3：2024年12月发布，总参数达6710亿，采用创新的MoE架构和FP8混合精度训练，训练成本仅为557.6万美元，在聊天机器人竞技场(Chatbot Arena)上排名第七，在开源模型中排名第一，是全球前十中性价比最高的模型。
DeepSeek-R1：2025年1月发布，性能与OpenAI的o1正式版持平，并开源，在Chatbot Arena综合榜单上排名第三，与OpenAI的o1并列，在高难度任务上表现出色。
Janus-Pro：2025年1月28日发布，分为7B(70亿)和1.5B(15亿)两个参数量版本，且均为开源，在多模态理解和文本到图像的指令跟踪功能方面取得重大进步，同时增强了文本到图像生成的稳定性，在多项基准测试中表现出色，甚至强于OpenAI旗下的DALL-E 3，以及Stable Diffusion。

1.3 -> 应用领域

自然语言处理：能够理解并回答用户的问题，进行文本生成、翻译、摘要等任务，可用于智能客服、内容创作、信息检索等领域。
代码生成与调试：支持多种编程语言的代码生成、调试和数据分析任务，帮助程序员提高工作效率。
多模态任务：如Janus-Pro模型可进行文生图、图生文等多模态任务，在图像生成、图像理解等方面有应用潜力。

1.4 -> 优势与影响

成本效益高：通过算法优化和架构创新，在保证性能的前提下，大幅降低了训练和推理成本，使AI技术更易于普及和应用。
开源策略：采用完全开源策略，吸引了大量开发者和研究人员的关注，促进了AI社区的协作和技术的快速发展。
推动行业变革：DeepSeek的成功挑战了传统的“大力出奇迹”的AI发展模式，为行业提供了新的发展思路和方向，激发了更多的创新和探索。

2 -> 本地部署deepseek

2.1 -> 安装ollama

ollama官网

点击Download下载

选择对应的操作系统，本次以Windows操作系统为例

点击Download for Windows下载。

下载完成后，打开文件开始安装OllamaSetup

点击Install开始下载，等待下载完成

检查是否安装成功

win+R输入cmd调出命令行进入到命令模式，输入命令ollama -v查看是否安装成功，输入完命令出现了版本号的话就说明安装成功。

deepseek-r1%E6%A8%A1%E5%9E%8B" name="2.2%20-%3E%20%E9%83%A8%E7%BD%B2deepseek-r1%E6%A8%A1%E5%9E%8B">2.2 -> 部署deepseek-r1模型

回到ollama官网点击左上角的Models进入如下界面。并选择第一个deepseek-r1，点击进入

选择适合自己电脑配置的版本

选择好后，复制对应版本后的命令

win+R输入cmd调出命令行进入到命令模式，输入命令

如果觉得下载速度慢，可以Ctrl+C先退出这个命令，然后再输入命令重新进行下载，还是会接着上次的下载进度继续下载，速度会稍微快一些。

下载完成后会出现success，接下来就可以进行对话了

问一个AI经常会出错的问题：9.11和9.9哪个大

可以看到，会给出思考过程以及最终结论。

输入命令/bye可以退出对话

输入命令ollama list可以查看下载好的模型

输入ollama run + 对应的模型就可以进入对话

这里输入ollama run deepseek-r1:latest可以发现再一次进入对话。

这样本地部署deepseek就算完成啦

感谢各位大佬支持！！！

互三啦！！！

http://www.ppmy.cn/server/166563.html

相关文章

对接DeepSeek

对接DeepSeek

其实，整个对接过程很简单，就四步，获取key，找到接口文档，接口测试，代码对接。获取 KEY https://platform.deepseek.com/transactions 直接付款就是了（现在官网暂停充值2025年2月7日&#xff0…

阅读更多...

java项目之金华学校社团管理系统源码(ssm+mysql)

java项目之金华学校社团管理系统源码(ssm+mysql)

项目简介金华学校社团管理系统实现了以下功能： 金华学校社团管理系统的主要使用者管理员对系统用户、公告信息进行管理。对社团信息进行管理，审核报名，统计社团报名结果等。学生维护个人信息，查看本校的社团信息，对…

阅读更多...

蓝桥杯51单片机练习（国信长天比赛用）

蓝桥杯51单片机练习（国信长天比赛用）

文章目录代码实现头文件固定模板延时函数HC138译码器和或非门流水灯闪烁次数(假设闪烁5次)从左向右依次亮从左向右依次灭总代码代码实现头文件 #include <REGX52.H> 固定模板 void main() { while(1) { } } 延时函数 void Delay(unsigned char t) { while(t–…

阅读更多...

[权限提升] Linux 提权维持 — 系统错误配置提权 - 通配符（ws）注入提权

[权限提升] Linux 提权维持 — 系统错误配置提权 - 通配符（ws）注入提权

关注这个专栏的其他相关笔记：[内网安全] 内网渗透 - 学习手册-CSDN博客 0x01：通配符（ws）注入提权原理通配符注入提权的核心是利用通配符的扩展特性，在命令执行时生成意外的参数或文件名，从而改变命令的行…

阅读更多...

gitlab多项目流水线

gitlab多项目流水线

背景是我有多个项目，希望其中一个项目被触发的时候，联动另外一个项目自动打包。然后我就看文档尝试操作了一下，所以有本文。官方文档参考：https://gitlab.cn/docs/14.5/jh/ci/pipelines/multi_project_pipelines.html 不知道是不…

阅读更多...

什么是企业经营驾驶舱

什么是企业经营驾驶舱

企业运营驾驶舱是一种基于数据可视化的管理工具，旨在帮助企业实时监控、分析和优化核心运营指标，辅助管理层快速决策。其概念类似于飞机驾驶舱，通过直观的仪表盘展示关键数据，让管理者“一目了然”掌握企业运营状态。数聚从多年的…

阅读更多...

Kafka 无消息丢失最佳实战

Kafka 无消息丢失最佳实战

1. 不要使用 producer.send(msg)，而要使用 producer.send(msg, callback)。记住，一定要使用带有回调通知的 send 方法。 2. 设置 acks all。acks 是 Producer 的一个参数，代表了你对“已提交”消息的定义。如果设置成 all，则…

阅读更多...

SSA-TCN麻雀算法优化时间卷积神经网络时间序列预测未来Matlab实现

SSA-TCN麻雀算法优化时间卷积神经网络时间序列预测未来Matlab实现

SSA-TCN麻雀算法优化时间卷积神经网络时间序列预测未来Matlab实现目录 SSA-TCN麻雀算法优化时间卷积神经网络时间序列预测未来Matlab实现预测效果基本介绍程序设计参考资料预测效果基本介绍 1.Matlab实现SSA-TCN麻雀算法优化时间卷积神经网络时间序列预测未来（优…

阅读更多...

最新文章