【AI知识点】大模型开源的各种级别和 deepseek 的开源级别

【AI知识点】大模型开源的各种级别和 deepseek 的开源级别

news/2025/2/13 2:52:51/

【AI论文解读】【AI知识点】【AI小项目】【AI战略思考】【AI日记】【读书与思考】【AI应用】

大模型 开源的各种级别

大模型的“开源”程度不同，通常可以分为以下几个主要级别：

1. 权重不开源（Closed-source）

特点：仅提供 API 访问，用户无法下载模型权重或进行本地部署。
代表：GPT-4、Claude 2、Gemini 1.5 等。

2. 受限权重开源（Restricted Open-weight）

特点：
- 允许用户下载模型权重，但存在较严格的使用限制。
- 可能要求用户申请许可证或遵守商业、研究用途的限制。
代表：
- LLaMA 2（Meta）：需要申请许可证，商用有限制。
- Mistral 7B：允许商用，但有 CC BY-SA 许可要求。

3. 研究开源（Research Only Open-weight）

特点：
- 权重开源，但仅限学术研究用途，不允许商用。
- 代码可能开源，也可能不开源。
代表：
- LLaMA 1（Meta）：仅限研究用途。
- DeepMind Gopher：仅限学术研究。

4. 权重和推理代码开源（Open-weight & Inference Code Open）

特点：
- 提供模型权重和推理代码，允许用户本地运行，但训练代码可能不开源。
- 可能有商用限制，但一般较为宽松。
代表：
- Mistral 7B（Apache 2.0）：权重 + 推理代码均开源。
- Bloom（BigScience）：训练代码未完全开放，但推理代码 + 权重开放。

5. 完全开源（Fully Open-source）

特点：
- 权重、推理代码、训练代码全部开源，甚至提供训练数据。
- 通常采用宽松的开源许可证（如 Apache 2.0、MIT）。
- 允许自由商用和二次开发。
代表：
- Falcon 180B（Apache 2.0）：完全开源。
- MPT-30B（Apache 2.0）：提供完整代码和权重。
- OpenLLaMA（Apache 2.0）：基于开源数据训练。

DeepSeek 开源级别

DeepSeek 已经开源了多个模型：

DeepSeek-V3：

开源内容：模型权重和推理代码。
许可证：MIT 许可证。
细节：模型权重和推理代码已在 MIT 许可证下开源，允许广泛使用、修改和分发。然而，训练代码和训练数据集尚未公开。
参考链接：DeepSeek-V3 GitHub 仓库

DeepSeek-R1：

开源内容：模型权重和推理代码。
许可证：MIT 许可证。
细节：与 DeepSeek-V3 类似，DeepSeek-R1 的模型权重和推理代码在 MIT 许可证下开源，但训练代码和数据集仍然是私有的。
参考链接：DeepSeek-R1 发布公告

综上，DeepSeek 已经在 MIT 许可证 下开源了 DeepSeek-V3 和 DeepSeek-R1 的模型权重及推理代码，这意味着用户可以自由使用和商用这些模型。然而，训练代码和数据集尚未开源，因此无法完全复现模型的训练过程或对其底层架构进行修改。

http://www.ppmy.cn/news/1571591.html

相关文章

昇腾，Ascend，NPU，mindie，镜像，部署vllm：第4篇，尝试多模态大模型部署（Qwen2-vl）

昇腾，Ascend，NPU，mindie，镜像，部署vllm：第4篇，尝试多模态大模型部署（Qwen2-vl）

文章目录前言下载模型前言一直想部署一个多模态大模型，今天就以Qwen2-vl为例尝试一番吧。（当然是在昇腾环境下）提示：需要把这篇文章先看一遍昇腾，mindie，镜像，部署vllm：第2篇，启动mindieservice_daemon服务，支持对Qwen2.5的7B版本的推理提示：本文章的撰写思…

阅读更多...

Vue笔记（四）

Vue笔记（四）

一、插槽 （一）默认插槽 1. 插槽概念：在Vue组件中，插槽是一种分发内容的机制，允许在父组件中向子组件传递HTML或组件片段。默认插槽是最基础的插槽类型。 2.使用场景：当子组件有预留区域，需要…

阅读更多...

探索B-树系列

探索B-树系列

🌈前言🌈 本文将讲解B树系列，包含 B-树，B树，B*树，其中主要讲解B树底层原理，为什么用B树作为外查询的数据结构，以及B-树插入操作并用代码实现；介绍B树、B*树。 &#x1f4…

阅读更多...

小结：NAT

小结：NAT

在华为设备中，NAT（网络地址转换）有多种类型，通常用于实现私有网络与公网之间的地址转换，或是实现内部网络的地址隔离。以下是华为路由器和交换机中常见的 NAT 类型及其配置。 1. NAT 类型 (1) 静态 NAT（S…

阅读更多...

3.React 组件化开发

3.React 组件化开发

react：版本 18.2.0node： 版本18.19.1脚手架：版本 5.0.1 一、类组件 (一) 一个干净的脚手架【1】使用已经被废弃的 CRA (create-react-app) create-react-app 已经被废弃，且目前使用会报错，官方已经不推荐使用&…

阅读更多...

从零到一：我的元宵灯谜小程序诞生记

从零到一：我的元宵灯谜小程序诞生记

缘起：一碗汤圆引发的灵感去年元宵节，我正捧着热腾腾的汤圆刷朋友圈，满屏都是"转发锦鲤求灯谜答案"的动态。看着大家对着手机手忙脚乱地切换浏览器查答案，我突然拍案而起：为什么不做一个能即时猜灯谜的微信…

阅读更多...

获取 Windows 视频时长的正确方式——Windows Shell API 深度解析

获取 Windows 视频时长的正确方式——Windows Shell API 深度解析

在 Qt 开发中，有时需要获取视频文件的时长，最直接的方法是在 Windows 上使用 Windows Shell API。然而，这涉及到 IShellItem、IPropertyStore 等 COM 组件，并需要正确处理 PKEY_Media_Duration。本篇文章将详细解析 Windows Shell API 获取视频时长的正确实现方式，并解决常…

阅读更多...

C++ 顺序表

C++ 顺序表

顺序表的操作有以下： 1 顺序表的元素插入给定一个索引和元素，这个位置往后的元素位置都要往后移动一次，元素插入的步骤有以下几步 （1）判断插入的位置是否合法，如果不合法则抛出异常 （2&…

阅读更多...

最新文章