资料导览(持续更新)

server/2024/9/23 9:27:54/

经典推荐

  • 多模态大模型:基础架构

  • 图解DSPy:Prompt的时代终结者?!

  • vLLM, LMDeploy, MLC-LLM, TensorRT-LLM, and TGI的性能小实验

  • 优雅谈大模型13:一文读懂LoRA/DoRA/MoRA

  • 新鲜速递:图解新颖LLM的CoPE位置编码

专栏导航

  • 综合性的调查报告打开是最合适的。

  • 平时闲暇无事,订阅一份最新动态也是不错。

  • 若理解大模型,想进一步的学习大模型,可以订阅大模型必备腔调。

  • 若已经具备一定的基础,想系统性的学习大模型背后的基础原理,可以订阅LLM背后的基础模型

  • 若已经是半个玩家,则可以订阅最新科技,亦或者订阅论文精读

  • 若是侧重关心部署运维,则订阅AI架构设计专栏是不错的选择。

  • 若对多模态或者具身智能感兴趣,可以订阅具身智能

主流架构索引

  • Mamba

  • Mamba-2

  • xLSTM

  • KAN

  • TransFormer

  • ViT

酸甜苦辣的模型们

  • Claude3.5:编码螃蟹游戏就是这么轻松

  • Gemma 2

  • Phi-3 Mini

  • “最好的开放模型”,LLAMA3重磅来袭

  • GPT-4o: 从最难的“大海捞针”基准看起

  •  SleepFM:利用对比学习预训练的多模态“睡眠”基础模型

  • Codestral横空出世:高级还是资深程序员

  • TimesFM: 预训练的时间序列基础模型

  • TSLANet:时间序列模型的新构思


多模态与具身智能

  • Llama 3-V: 比GPT4-V小100倍的SOTA

  • Cephalo:专门用于仿生设计的多模态视觉大型语言模型

  • Chameleon:早期融合混合模态的基础模型

  • 4M-21:霸气侧漏高效的20+多模态AI模型

  • Octo精武门 :开源的通用机器人模型


大模型的小配件

  • 一文读懂OpenGVLab带来的最新视觉预训练框架

  • EAGLE系列,大模型的“草稿技术”

  • 稀疏编码,直视大模型的灵魂深处

  • 大模型的灵魂解读:Anthropic AI的Claude3 Sonnet可解释性研究

  • 轻松读懂FlashAttention-1

  • 轻松读懂FlashAttention-2

  • 轻松读懂FlashAttention2

  • Vidur: 出手只需1小时,瞬间节省20万美元

  • “开放”的大模型到底有多“开放”?!

  • 沉睡而且“狡猾”的特工:大模型也可以是!

  • 新鲜速递:图解新颖LLM的CoPE位置编码

  • MIT提出基于Transformer的Cross-Layer Attention:江湖骗子还是奇思妙想

RAG专区

  • 奇思妙想:多头RAG

大模型语料(数据治理)

  • 论文精读:构建金融商业交易语料库

  • 论文精读:基于BERT的医学影像报告语料库构建

  • 论文精读:利用大型语言模型从儿科患者病历中提取社会决定因素:新型语料库与方法

  • 速递FineWeb:一个拥有无限潜力的15T Tokens的开源数据集


http://www.ppmy.cn/server/53505.html

相关文章

【python - 数据】

一、序列 序列(sequence)是一组有顺序的值的集合,是计算机科学中的一个强大且基本的抽象概念。序列并不是特定内置类型或抽象数据表示的实例,而是一个包含不同类型数据间共享行为的集合。也就是说,序列有很多种类&…

设计模式 - Observer Pattern 观察者模式

文章目录 定义观察者模式的实现构成构成UML图 观察者模式的代码实现场景代码实现 总结优点缺点应用场景 其他设计模式文章: 定义 观察者模式是行为型模式的一种,它定义对象间的一种一对多的依赖关系,使得每当一个对象改变状态,它…

Retrieval-Augmented Generation for Large Language Models A Survey

Retrieval-Augmented Generation for Large Language Models: A Survey 文献综述 文章目录 Retrieval-Augmented Generation for Large Language Models: A Survey 文献综述 Abstract背景介绍 RAG概述原始RAG先进RAG预检索过程后检索过程 模块化RAGModules部分Patterns部分 RAG…

[数据集][目标检测]电力场景下电柜箱门把手检测数据集VOC+YOLO格式1167张1类别

数据集格式:Pascal VOC格式YOLO格式(不包含分割路径的txt文件,仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件) 图片数量(jpg文件个数):1167 标注数量(xml文件个数):1167 标注数量(txt文件个数):1167 标注…

《重构》读书笔记【第1章 重构,第一个示例,第2章 重构原则】

文章目录 第1章 重构,第一个示例1.1 重构前1.2 重构后 第2章 重构原则2.1 何谓重构2.2 两顶帽子2.3 为何重构2.4 何时重构2.5 重构和开发过程 第1章 重构,第一个示例 我这里使用的IDE是IntelliJ IDEA 1.1 重构前 plays.js export const plays {&quo…

SQL面试真题解答 数据统计分析,求“同比、环比”等(SQL窗口函数使用)

SQL面试真题解答 数据统计分析,求“同比、环比”等(SQL窗口函数使用) 环比、环比增长率、同比、同比增长率,根据百度百科上的 说明: 环比增长率 环比增长率,一般是指和上期相比较的增长率。 环比增长率&a…

Hadoop 面试题(九)

1. 简述下面关于Hadoop系统中使用CombineFileInputFormat解决小文件问题的描述错误的是() ? A:CombineFileInputFormat是使用Hadoop API(抽象类CombineFileInputFormat)来解决小文件的问题 B:抽象类CombineFileInputF…

新型裂变营销,茶叶店茶馆会员卡模式,社交电商新玩法分享

大多数茶叶店只是简单地售卖茶叶,偶尔附赠一些茶点作为促销手段。然而,这家茶叶店的老板却采用了与众不同的商业模式,成功吸引了周围8家同行80%的客户。 接下来,让我们揭开这家茶叶店成功的秘密。 首先,他们推出了一个…