AI学习资料留档(持续更新)

news/2025/3/4 6:04:25/

一、模型部署/硬件资源

1、动态量化版部署方法、大小

完整的671B MoE DeepSeek R1怎么塞进本地化部署?详尽教程大放送! | 机器之心

2、

二、模型应用

1、deepseek R1+cursor使用 

不卡顿、免费的满血版DeepSeek-R1 API,在无问芯穹这里用上了,更有异构算力鼎力相助 | 机器之心

2、

三、技术研究

1、模型训练对高质量有用数据的需求,团队开发了学习影响力度量(Learning Impact Measurement, LIM)方法。通过分析模型的学习曲线,LIM 可以自动识别那些与模型学习进程高度匹配的 "黄金样本"。

大模型强化学习新发现:删减84%数据反提升效果 | 机器之心

2、一个可供参考的微调“大礼包”

DeepSeek V3+R1满血微调工具上线!一键启动,硬件要求降10倍 | 机器之心

3、利用代码形成思维链来训练,而不是单纯用代码训练(这个感觉可以参考实践)

DeepSeek团队新作:把代码变成思维链,大模型推理各种能力全面提升 | 量子位

论文地址:
https://arxiv.org/abs/2502.07316
GitHub:
https://github.com/hkust-nlp/CodeIO


http://www.ppmy.cn/news/1576467.html

相关文章

前端依赖nrm镜像管理工具

npm 默认镜像 :https://registry.npmjs.org/ 1、安装 nrm npm install nrm --global2、查看镜像源列表 nrm ls3、测试当前环境下,哪个镜像源速度最快。 nrm test4、 切换镜像源 npm config get registry # 查看当前镜像源 nrm use taobao # 等价于 npm…

中间件专栏之Redis篇——Redis中过期key删除和内存淘汰策略

在Redis中,过期键的删除和内存淘汰策略是管理Redis内存的重要机制,确保Redis可以高效地使用内存,并避免由于内存不足导致的性能问题。以下是这两个概念的详细介绍: 一、过期键删除机制 Redis支持对存储的键设置过期时间&#xf…

技术速递|Copilot Usage Advanced Dashboard 教程

作者:Xuefeng Yin 排版:Alan Wang Copilot Usage Advanced Dashboard 是为了充分利用 GitHub Copilot API 中的几乎所有数据,用到的 API 有: List teams of an onganization Get a summary of Copilot metrics for a team Get C…

MySQL数据库基本概念

目录 什么是数据库 从软件角度出发 从网络角度出发 MySQL数据库的client端和sever端进程 mysql的client端进程连接sever端进程 mysql配置文件 MySql存储引擎 MySQL的sql语句的分类 数据库 库的操作 创建数据库 不同校验规则对查询的数据的影响 不区分大小写 区…

C语言复习4:有关数组的基础常见算法

# 数组的常见算法 - 查找算法 1. 基本查找/顺序查找 2. 二分查找/折半查找 3. 插值查找 4. 分块查找 5. 哈希查找 6. 树表查找 7. 斐波那契查找 - 排序算法(顾名思义,就是把没有顺序的…

UniApp 按钮组件 open-type 属性详解:功能、场景与平台差异

文章目录 引言一、open-type 基础概念1.1 核心作用1.2 通用使用模板 二、主流 open-type 值详解2.1 contact - 客服会话功能说明平台支持代码示例 2.2 share - 内容转发功能说明平台支持注意事项 2.3 getUserInfo - 获取用户信息功能说明平台支持代码示例 2.4 getPhoneNumber -…

P8680 [蓝桥杯 2019 省 B] 特别数的和

P8680 [蓝桥杯 2019 省 B] 特别数的和 - 洛谷 题目描述 小明对数位中含有2、0、1、9的数字很感兴趣(不包括前导0),在1到40中这样的数包括1、2、9、10至32、39和40,共28个,他们的和是574。 请问,在1到n中&…

【Map vs Set】:Java数据存储的“双子星”对决

个人主页:♡喜欢做梦 欢迎 👍点赞 ➕关注 ❤️收藏 💬评论 目录 🍰一、搜索 🍮1.概念 🍮2.模型 🍰二、Map 🍨1.什么是Map? 🍨2.Map的实例化 &…