对想学习人工智能或者大模型技术从业者的建议

news/2024/9/14 2:11:58/ 标签: 学习, 人工智能, 数据库, langchain, 笔记

“ 技术的价值在于应用,理论与实践相结合才能事半功倍”

写这个关于AI技术的公众号也有差不多五个月的时间了,最近一段时间基本上都在保持日更状态,而且写的大部分都是关于大模型技术理论和技术方面的东西。‍‍‍‍‍‍‍‍‍

然后最近一段时间就发现了一个问题,写的越理论的东西看的人越多,越实际越细节的东西看的人越少,不知道是因为系统推送的原因,还是观看者的原因。‍‍‍‍‍

因此,根据这个现象就想提几个学习的建议,让大家少走一点弯路。‍‍‍‍‍‍‍‍‍‍‍‍‍

01

人工智能技术学习建议‍‍‍

这个关于学习人工智能技术的建议,也可以说是一个学习技术的方法论。

首先大家要明白一点——(任何)技术都是一个更偏向于实践的东西,具体来说就是学习技术实践要大于理论,要以实践为主理论为辅,而不是反其道而行之,但是在实际的经历和观察中,我发现很多人却是以理论为主,实践为辅。‍‍

_知行合一,在知中行,在行中知_‍‍‍‍‍‍‍‍‍

就拿这个公众号来说,越理论的东西看的人越多,真的涉及到实操的部分看的人反而变少了。

比如说,很多人对什么是人工智能,什么是神经网络,什么是大模型,什么是多模态大模型等等很感兴趣;但对大模型实际过程中的训练数据的收集与清洗,损失差和反向传播等核心操作却视若无睹。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

但是这些理论的东西,每个理解过人工智能技术的人都能说上几句;但真的让他来实际操作从大模型的选型,模型的训练和部署来打造一个能用的大模型,这时他就开始傻眼了。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

理论需不需要懂?‍‍‍‍

需要,但并不是特别需要;很多理论只是看别人的书和文章你是不会真正明白的,只有实际动手操作时才能真正理解理论。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

就类似于java面试八股文,随便一个面试者都可以说上几句;但一旦涉及到具体的业务场景或技术场景,这时很多人就傻眼了,而这也是不同面试者之间的差距。‍‍‍‍‍‍‍‍‍‍‍‍‍‍

理论并不等于技术,技术也不等于理论,技术更多时候是理论和实践的结合;在实践中检验理论,在理论中指导实践,最后理论和实践互相验证,互相修正。‍‍‍‍

所以说,学习大模型技术最重要的是上手实践一下,不一定非要像openAI,谷歌,meta一样搞那么大的模型,哪怕只是设计一个两三层的神经网络模型,然后自己完成模型的设计,训练和部署也比一直看理论更有用。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

或者是找一些开源的大模型项目,看看它们解决了哪些问题;是怎么做的,又为什么这么做,是否有其它解决方案;而且一些小模型个人电脑就可以跑的起来,或者找一些免费的GPU资源,比如谷歌的Colab平台。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

这样你才能知道不同模型之间的差别是什么,怎么使用模型解决不同领域的问题等。‍‍‍‍‍‍‍‍‍

_学习大模型的三个方向_‍‍

很多人学习人工智能技术就一心扑在技术上,认为自己把技术学好了就一定能找到工作,一定能成为公司技术部核心成员;但大家要明白的一个事实是,技术是为业务服务的,技术的作用是解决业务问题,而不是搞学术研究。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

学习大模型技术,个人认为有三个方向:‍

大模型基础技术大牛‍‍‍‍‍

说白了就是数学大牛,大模型技术本质就是一个数学模型,因此需要做这个方向的技术人员更多的是数学专业的大牛;比如说微分,概率,线性代数等。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

他们的作用是设计更好的机器学习算法和打造更好的技术学习模型,比如怎么设计一个更好的神经网络,怎么设计更好的损失函数,怎么优化反向传播算法等。‍‍‍‍‍‍‍‍

这种工作更加偏向于底层技术和学术研究,而且这种人才待遇好,要求高,基本上不是名牌大学毕业的很难参与进来。‍‍‍‍‍‍‍‍‍

大模型“运维”人员‍‍‍‍

之所以说是“运维”人员,是这个方向需要做的就是根据企业的业务需求,找到合适的商业或开源模型,然后能够收集和处理训练数据,然后完成模型的训练,部署和升级等任务;能够熟练使用不同的模型和工具处理不同领域的问题。因为他们特别像传统的服务器维护人员,因此叫大模型“运维”。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

这个技术方向就需要懂得大模型的基础理论,并且有很强的实操能力,然后有充足的业务经验,能够把大模型和业务场景相结合,因此这个更看重的是经验和实操,反而技术要求并不高,重要的是能够熟练使用各种工具。‍‍‍‍‍‍‍‍‍‍‍‍‍

大模型上层应用构建‍‍

再一个方向就是基于大模型构建上层应用,这个方向更像是一个传统的技术开发者,不需要了解大模型的运作原理,只需要能使用大模型的功能文档和接口文档即可,如果能懂一些大模型的理论就更好不过了。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

个人建议

对大部分人来说,选择后两种方式比较好,最好是能把后两种方向结合起来。因为研究大模型基础技术的成本太高,绝大部分企业都没有足够的资金和技术来实现,因此其就业的压力和竞争力可想而知。‍‍‍‍‍‍‍‍‍

其次,后两个方向只需要有一定的经验和学习能力就可以做到,甚至很多程序员可以直接转行成为第三种大模型应用开发者。‍‍‍‍‍‍‍‍

所以,对大部分人来说,最好的选择就是搞大模型应用,门槛相对较低,前景广阔。‍‍‍

因此,对个人来说一定要弄清楚自己的定位,否则就会导致自己没有努力的方向;然后这个也想学,那个也想学,最后什么都会又什么都不会。‍‍‍‍‍‍‍‍‍‍‍

人工智能机器人小程序,感兴趣的可以点击查看:

_学习写作_‍‍‍‍

对技术人员来说,写作应该是一项必不可少的技能之一。写作的作用并不是说要你的文笔有多好,而是要把自己学习和思考的过程给记录下来,哪怕是错的。‍

一是方便后续回顾,二是写作的过程是一个从新思考的过程,有些不明白不清晰的地方在写作的过程中就会重新进行思考,这时就会有一个更加清晰的认识。‍‍‍‍‍‍‍‍‍

有句老话叫:“厉害的不是你学会了什么,而是你能够用简单的语言把你学的东西讲明白”。‍‍‍‍‍‍‍‍‍‍‍‍

学习是一个输入端过程,而写作是一个输出的过程。‍‍‍

就那小编个人来说,写公众号最重要的目的就是记录自己的学习过程;你说小编写的文章内容都是对的?那也不见得,可能很多地方理解有误,但这个并不重要。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

有些东西当时没理解或者理解错了,后面可能有一天顿悟就明白过来了;而这也是为什么有些文章写的是同一个话题,但内容却不太一样的原因。‍‍‍

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

😝有需要的小伙伴,可以Vx扫描下方二维码免费领取🆓

👉1.大模型入门学习思维导图👈

学习一门新的技术,作为新手一定要先学习成长路线图,方向不对,努力白费。

对于从来没有接触过AI大模型的同学,我们帮你准备了详细的学习成长路线图&学习规划。可以说是最科学最系统的学习路线,大家跟着这个大的方向学习准没问题。(全套教程文末领取哈)
在这里插入图片描述

👉2.AGI大模型配套视频👈

很多朋友都不喜欢晦涩的文字,我也为大家准备了视频教程,每个章节都是当前板块的精华浓缩。

在这里插入图片描述
在这里插入图片描述

👉3.大模型实际应用报告合集👈

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。(全套教程文末领取哈)

在这里插入图片描述

👉4.大模型落地应用案例PPT👈

光学理论是没用的,要学会跟着一起做,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习(全套教程文末领取哈)

在这里插入图片描述

👉5.大模型经典学习电子书👈

随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。

img

在这里插入图片描述

👉6.大模型面试题&答案👈

截至目前大模型已经超过200个,在大模型纵横的时代,不仅大模型技术越来越卷,就连大模型相关的岗位和面试也开始越来越卷了。为了让大家更容易上车大模型算法赛道,我总结了大模型常考的面试题。

在这里插入图片描述

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

😝有需要的小伙伴,可以Vx扫描下方二维码免费领取🆓


http://www.ppmy.cn/news/1516592.html

相关文章

Mozilla为本地音频到文本翻译开发Whisperfile引擎

Mozilla Ocho 小组正进行 Mozilla 的"创新和实验"。Llamafile 用于将大型语言模型以单个文件的形式发布,以便在不同的硬件/软件间轻松执行。Whisperfile 是一项将音频轻松转化为文本的新引擎。 正如其名称所暗示的,Whisperfile 是围绕 OpenAI…

RabbitMQ如果有100万消息堆积在MQ,如何解决(消息堆积如何解决)面试版

什么情况下产生消息堆积 消息堆积:当生产者发送消息的速度 超过了 消费者处理消息的速度,就会导致队列中的消息堆积。 消息堆积会产生的问题:直到队列存储的消息达到上限。之后发送的消息就会成为死信,可能会被丢弃。 解决消息…

数据库表的nb3和sql后缀的处理方式

后缀是sql的话就直接运行sql文件 就可以把数据库添加到本地了(像这样) 右键你选择存放的数据库 -- 运行sql文件 -- 选择后缀是sql的文件 如果同事给你了一个后缀是nb3的话 那么就需要你去还原了 你想把这个表加到哪个库下就选择 右键备份 -- 还原备份从…

数据库查询大量数据避免内存溢出的方法

原理就是分批查询。每次查询一定数量数据之后记录id,进行数据处理之后再继续查询继续处理, allFrameObject mapper.findAllFrameObjectByMaxId(minTime, beginRow, 1000); while (CollectionUtils.isNotEmpty(allFrameObject)) {beginRow allFrameObj…

如何构建小学至大学素质评价档案系统 —— php Vue 实践指南

🍊作者:计算机毕设匠心工作室 🍊简介:毕业后就一直专业从事计算机软件程序开发,至今也有8年工作经验。擅长Java、Python、微信小程序、安卓、大数据、PHP、.NET|C#、Golang等。 擅长:按照需求定制化开发项目…

GPIO(通用输入/输出)、中断(hal库)

目录 GPIO(通用输入/输出)(hal库) GPIO工作模式 推挽输出(Push-Pull Output) 开漏输出(Open-Drain Output) 复用推挽输出(Alternate Function Push-Pull Output) 复…

金融涉案账户压降行动的实施成效与挑战

2024年上半年我国出台了关于金融行业相关管理办法 1 - 5 号令,不断完善相关法律法规,加强对欺诈行为的打击力度。加强了对互联网企业的监管力度,要求企业加强内部管理,建立健全用户信息保护机制,防止用户信息泄露和被滥…

Lora微调训练参数解读

前言 通过前面两次微调训练欺诈文本分类微调(六):Lora单卡和欺诈文本分类微调(七)—— lora单卡二次调优,我们已经初步理解了微调的整个过程,里面涉及到不少的参数配置,这篇文章就对…

redis面试(二十三)写锁释放

先加了写锁,后面再次加写锁或者读锁 anyLock: { “mode”: “write”, “UUID_01:threadId_01:write”: 2, “UUID_01:threadId_01”: 1 } 写锁的释放lua脚本在这里 RedissonWriteLock.unlockInnerAsync() 比如说现在的参数是这 KEYS[1] anyLock KEYS[2] redi…

卖旧电脑前怎么彻底清除数据?卖旧电脑不留隐患

在科技日新月异的今天,电脑已成为我们日常生活和工作中不可或缺的工具。然而,随着技术的不断进步,我们可能会考虑更换新的电脑设备,而将旧的电脑出售或转让。 在卖旧电脑前,彻底清除电脑中的数据至关重要,…

leetcode46:全排列

全排列 给定一个不含重复数字的数组 nums &#xff0c;返回其 所有可能的全排列 。你可以 按任意顺序 返回答案。 List<List<Integer>> list new ArrayList<>();public List<List<Integer>> permute(int[] nums) {LinkedList<Integer> …

Shader 中的渲染顺序

1、深度测试和深度写入 有了深度测试和深度写入发挥作用让我们不需要关心不透明物体的渲染顺序比如一个物体A 挡住了 物体B&#xff0c;即使底层逻辑中 先渲染A&#xff0c;后渲染B&#xff0c;我们也不用担心 B的颜色会把A覆盖&#xff0c;因为在进行深度测试时&#xff0c;远…

Java-BatchProcessingUtil结合CompletableFuture工具类

为了结合批处理与 CompletableFuture 并使用自定义线程池,我们可以创建一个功能全面的工具类 BatchProcessingUtil。这个工具类将支持以下功能: 批处理遍历列表中的每个元素。 使用自定义线程池执行批处理任务。 返回一个 CompletableFuture 对象以支持异步回调和结果处理…

BlazeFace: Sub-millisecond Neural Face Detection on Mobile GPUs

Abstract 我们提出了BlazeFace&#xff0c;这是一种轻量级且性能优异的面部检测器&#xff0c;专为移动GPU推理而设计。它在旗舰设备上运行速度可达200到1000 FPS。这种超实时性能使其能够应用于任何增强现实管道中&#xff0c;作为任务特定模型的输入来准确识别面部感兴趣区域…

从数据生成到图数据库:Linux下Neo4j的CSV导入

文章目录 简介找到import文件夹准备csv表格数据导入neo4jTeacherStudent 简介 介绍如何在Linux系统中设置和使用Neo4j数据库。 首先&#xff0c;找到Neo4j的import文件夹&#xff0c;通常位于Neo4j安装目录下的data文件夹内&#xff0c;并展示通过neo4j.conf配置文件查找和修…

MySQL 数据库的规范化与反规范化详解

在数据库设计中&#xff0c;规范化&#xff08;Normalization&#xff09;和反规范化&#xff08;Denormalization&#xff09;是两个重要的概念&#xff0c;它们直接影响数据的存储效率、数据一致性以及查询性能。本文将详细介绍 MySQL 中的第一范式、第二范式和第三范式&…

qt圆环饼状图,非常小的窗口都能显示

非常小的窗口都能显示 QT core gui charts#include <QtCharts> using namespace QtCharts;//创建饼状图 void MainWindow::createpieSewies() {//饼状图QPieSeries * my_pieSeries new QPieSeries();//中间圆与大圆的比例my_pieSeries->setHoleSize(0.35);//…

Python知识点:如何使用PostgreSQL与Psycopg2进行数据库操作

要使用PostgreSQL与Psycopg2进行数据库操作&#xff0c;首先需要确保你的环境中已经安装了PostgreSQL和Psycopg2库。以下是一个简单的指南&#xff0c;展示如何使用Psycopg2与PostgreSQL进行连接和执行基本的数据库操作。 1. 安装Psycopg2 如果你还没有安装Psycopg2&#xff…

【SQL基础】【leetcode】SQL50题

查询 &#xff08;1&#xff09;可回收且低脂的产品 题目链接 SELECT product_id FROM Products WHERE low_fatsY AND recyclableY;很简单&#xff0c;最基础的sql语句。 &#xff08;2&#xff09;寻找用户推荐人 题目链接 SELECT name FROM Customer WHERE referee_id …

嵌入式面经篇十——驱动开发

文章目录 前言一、驱动开发1、Linux 驱动程序的功能是什么?2、内核程序中申请内存使用什么函数?3、内核程序中申请内存和应用程序时申请内存有什么区别?4、自旋锁和信号量在互斥使用时需要注意什么?在中断服务程序里面的互斥是使用自旋锁还是信号量?5、驱动卸载异常可能是…