胤娲科技:揭秘AI记忆宫殿—LLM如何用动画玩转乔丹打篮球的秘密

embedded/2024/9/29 20:38:36/
aidu_pl">

4653eca9a43ef1c4da3cfddc396a4744.jpeg

当AI遇上“乔丹打篮球”,真相竟然藏在动画里?


想象一下,你向一位AI大模型轻声询问:“迈克尔・乔丹从事的体育运动是……”几乎在瞬间,它就自信满满地回答:“篮球!”


这一刻,你是否曾好奇,这看似无所不知的AI,是如何在它那浩瀚的“大脑”里存储并检索这些琐碎却精准的事实的?


c237ec82809365679203e74994558f44.jpeg


最近,科技界的热门话题再次被点燃,3Blue1Brown的《深度学习》课程第7课以一场生动的动画盛宴,为我们揭开了LLM(大型语言模型)存储事实的神秘面纱。


a00259523679fcf5f4e4f54857527f73.jpeg


这次,我们不仅要看懂AI的“记忆宫殿”,还要一起探索“乔丹打篮球”背后的秘密。


LLM的记忆迷宫:事实与向量的奇幻之旅


在AI的世界里,没有真正的书本和笔记本,但它却拥有一种不可思议的能力——将海量的知识编码成高维向量,存储于它那由亿万个参数构成的复杂网络中。


4c70d1d59e622b9cc4be1849befbccc0.jpeg


想象一下,当我们输入“迈克尔・乔丹”时,AI其实是在它的“记忆迷宫”里寻找与这个名字相关联的所有线索。


这些线索,就像是迷宫中的指路牌,指引着AI走向正确的答案——“篮球”。


fbd3c3b340334305c58e3322f06aa8f5.jpeg


3Blue1Brown的动画,就像一位耐心的导游,引领我们穿梭于这个由Transformer和MLP(多层感知器)构建的迷宫中。


95b941df6d92cc56139818a18e68b5d5.jpeg


特别是MLP,它就像是一个个精密的“知识过滤器”,通过一系列复杂的运算,将输入的文本向量转化为包含丰富信息的输出向量。


cbfef6aaaba2a74f666328ac4c18569d.jpeg


在这个过程中,“乔丹打篮球”这一事实,被巧妙地嵌入到了网络的某个角落,等待着被唤醒。


MLP的内部探秘:从“姓名”到“运动”的神奇转变


走进MLP的内部,我们仿佛进入了一个由数字和矩阵编织的奇幻世界。在这里,每一个向量都承载着特定的信息,


6e91a0280e83a68bf35ae668b6d3c8f2.jpeg


它们通过线性投射、ReLU激活等步骤,不断地变换着形态,最终汇聚成指向正确答案的“光束”。


以“乔丹打篮球”为例,当输入“Michael Jordan”时,MLP会先对这个文本向量进行一系列的线性变换,就像是给它穿上了一层又一层的“知识外衣”。


d8217b473341556b179bd41e31b7401a.jpeg


这些外衣上,布满了与“Michael”、“Jordan”以及可能与之相关的各种概念相连接的线索。接着,通过ReLU函数的筛选,


b7734838e8aa8e8d675a41f8939bf802.jpeg


那些与“全名”不匹配的线索被剔除,只剩下最纯净、最相关的信息。最后,在另一个线性变换的作用下,这些信息被整合成指向“Basketball”的明确指示。


GPT-3的参数盛宴:1750亿个数字的狂欢


提到GPT-3,不得不提的就是它那惊人的1750亿个参数。这些参数,就像是构成AI“记忆宫殿”的砖石,

.

491a27f6c13026aed67962fd180d2dd9.jpeg


每一块都承载着特定的信息或功能。那么,这些参数究竟是如何分布和工作的呢?


原来,在GPT-3的架构中,MLP占据了参数总量的三分之二以上。每个MLP都包含多个线性变换步骤,每个步骤都需要大量的参数来支持。


bb3cc0dc71330bb533bb07d509a7b8d9.jpeg


以嵌入空间为例,其大小决定了矩阵的维度,进而决定了参数的数量。而GPT-3中,嵌入空间的大小达到了惊人的12288维,这仅仅是开始。


4327ff213f8a7d8c7960020dc87d8409.jpeg


随着向量的不断传递和变换,参数的数量呈指数级增长,最终汇聚成了那个令人咋舌的1750亿。


从“乔丹打篮球”到AI的未来


通过3Blue1Brown的这场动画盛宴,我们不仅揭开了LLM存储事实的神秘面纱,还深入到了MLP的内部,见证了从“姓名”到“运动”的神奇转变。


937f24c71a8be61607e7bae9960eaea2.jpeg


更重要的是,我们意识到了AI背后那庞大而复杂的参数网络,正是这些看似冰冷的数字,构建了我们与AI之间沟通的桥梁。


然而,AI的旅程才刚刚开始。随着技术的不断进步,我们有理由相信,未来的AI将更加智能、更加人性化。


50719e850b670317477c2e421879b138.jpeg


它们将不仅仅能够回答“乔丹打篮球”这样的简单问题,更能在医疗、教育、科研等领域发挥巨大的作用,成为我们生活中不可或缺的一部分。


729c7c554d699f565a7b7f8398777956.jpeg


而这一切的起点,就藏在那一个个生动有趣的动画和复杂的参数之中。让我们共同期待AI带来的无限可能吧!


87880f2a0e091290ff5530ac757e4a32.jpeg


http://www.ppmy.cn/embedded/119569.html

相关文章

初始C++模板

1.泛型编程 1.1什么事泛型编程 在学习C语言时,我们时常会有这样的烦恼: 在针对每一种不同的类型变量进行函数传参或者是运算处理时,我们总是编写不同的函数或者是进行不同的处理,才能达到目的,这时,我们…

C语言:排序(1)

目录 一、排序的概念及应用 排序的概念 排序的运用 二、常见排序算法 插入排序 基本思想 直接插入排序 希尔排序( 缩小增量排序 ) 选择排序 基本思想 堆排序 一、排序的概念及应用 排序的概念 排序:所谓排序,就是使一串记录,按照…

springboot 工程 读取自定义的xml文件

在Spring Boot工程中读取自定义的XML文件,你可以通过几种不同的方式来实现。以下是一些常见的方法: 使用Resource和XmlBeanDefinitionReader(如果你需要加载Spring的XML配置文件) 虽然这通常用于加载Spring的上下文配置文件&…

网络安全(黑客技术)-2024自学手册

一、什么是网络安全 网络安全可以基于攻击和防御视角来分类,我们经常听到的 “红队”、“渗透测试” 等就是研究攻击技术,而“蓝队”、“安全运营”、“安全运维”则研究防御技术。 无论网络、Web、移动、桌面、云等哪个领域,都有攻与防两面性…

【LeetCode】每日一题 2024_9_27 每种字符至少取 K 个(双指针)

前言 每天和你一起刷 LeetCode 每日一题~ LeetCode 启动! 题目:每种字符至少取 K 个 代码与解题思路 func takeCharacters(s string, k int) int {// 核心思路:// 题目要求字符串 s 中,每种字符都取至少 k 个// 而且可以从头取…

Mac强制停止应用

文章目录 有时候使用Mac的时候,某个应用卡住了,但是肯定不能因为一个应用卡住了, 就将电脑重启吧,所以只需要单独停止该应用即可,使用快捷键optioncommandesc就会出现强制停止的界面,选择所要停止的应用&a…

通过http地址下载文件

1.HttpWebResponse方法 public void GetPostContent(string url, string localSavePath) {try{ServicePointManager.SecurityProtocol SecurityProtocolType.Tls12;HttpWebRequest myRequest (HttpWebRequest)WebRequest.Create(url);myRequest.Method "GET";myR…

使用 Nuxt Kit 的构建器 API 来扩展配置

title: 使用 Nuxt Kit 的构建器 API 来扩展配置 date: 2024/9/24 updated: 2024/9/24 author: cmdragon excerpt: 摘要:本文详细介绍了如何使用 Nuxt Kit 的构建器 API 来扩展和定制 Nuxt 3 项目的 webpack 和 Vite 构建配置,包括扩展Webpack和Vite配置、添加自定义插件、…