LLM——10个大型语言模型(LLM)常见面试题以及答案解析

devtools/2024/11/12 21:33:07/

今天我们来总结以下大型语言模型面试中常问的问题

1、哪种技术有助于减轻基于提示的学习中的偏见?

A.微调 Fine-tuning

B.数据增强 Data augmentation

C.提示校准 Prompt calibration

D.梯度裁剪 Gradient clipping

答案:C

提示校准包括调整提示,尽量减少产生的输出中的偏差。微调修改模型本身,而数据增强扩展训练数据。梯度裁剪防止在训练期间爆炸梯度。

2、是否需要为所有基于文本的LLM用例提供矢量存储?

答案:不需要

向量存储用于存储单词或句子的向量表示。这些向量表示捕获单词或句子的语义,并用于各种NLP任务。

并非所有基于文本的LLM用例都需要矢量存储。有些任务,如情感分析和翻译,不需要RAG也就不需要矢量存储。

最常见的不需要矢量存储的:

1、情感分析:这项任务包括确定一段文本中表达的情感(积极、消极、中性)。它通常基于文本本身而不需要额外的上下文。

2、这项任务包括将文本从一种语言翻译成另一种语言。上下文通常由句子本身和它所属的更广泛的文档提供,而不是单独的向量存储。

3、以下哪一项不是专门用于将大型语言模型(llm)与人类价值观和偏好对齐的技术?

A.RLHF

B.Direct Preference Optimization

C.Data Augmentation

答案:C

数据增强Data Augmentation是一种通用的机器学习技术,它涉及使用现有数据的变化或修改来扩展训练数据。虽然它可以通过影响模型的学习模式间接影响LLM一致性,但它并不是专门为人类价值一致性而设计的。

A)从人类反馈中强化学习(RLHF)是一种技术,其中人类反馈用于改进LLM的奖励函数,引导其产生与人类偏好一致的输出。

B)直接偏好优化(DPO)是另一种基于人类偏好直接比较不同LLM输出以指导学习过程的技术。

4、在RLHF中,如何描述“reward hacking”?

A.优化所期望的行为

B.利用奖励函数漏洞

答案:B

reward hacking是指在RLHF中,agent发现奖励函数中存在意想不到的漏洞或偏差,从而在没有实际遵循预期行为的情况下获得高奖励的情况,也就是说,在奖励函数设计不有漏洞的情况下才会出现reward hacking的问题。

虽然优化期望行为是RLHF的预期结果,但它并不代表reward hacking。选项A描述了一个成功的训练过程。在reward hacking中,代理偏离期望的行为,找到一种意想不到的方式(或者漏洞)来最大化奖励。

5、对任务的模型进行微调(创造性写作),哪个因素显著影响模型适应目标任务的能力?

A.微调数据集的大小

B.预训练的模型架构和大小

答案:B

预训练模型的体系结构作为微调的基础。像大型模型(例如GPT-3)中使用的复杂而通用的架构允许更大程度地适应不同的任务。微调数据集的大小发挥了作用,但它是次要的。一个架构良好的预训练模型可以从相对较小的数据集中学习,并有效地推广到目标任务。

虽然微调数据集的大小可以提高性能,但它并不是最关键的因素。即使是庞大的数据集也无法弥补预训练模型架构的局限性。设计良好的预训练模型可以从较小的数据集中提取相关模式,并且优于具有较大数据集的不太复杂的模型。

6、transformer 结构中的自注意力机制在模型主要起到了什么作用?

A.衡量单词的重要性

B.预测下一个单词

C.自动总结

答案:A

transformer 的自注意力机制会对句子中单词的相对重要性进行总结。根据当前正在处理的单词动态调整关注点。相似度得分高的单词贡献更显著,这样会对单词重要性和句子结构的理解更丰富。这为各种严重依赖上下文感知分析的NLP任务提供了支持。

7、在大型语言模型(llm)中使用子词算法(如BPE或WordPiece)的优点是什么?

A.限制词汇量

B.减少训练数据量

C.提高计算效率

答案:A

llm处理大量的文本,如果考虑每一个单词,就会导致一个非常大的词表。像字节对编码(BPE)和WordPiece这样的子词算法将单词分解成更小的有意义的单位(子词),然后用作词汇表。这大大减少了词汇量,同时仍然捕获了大多数单词的含义,使模型更有效地训练和使用。

子词算法不直接减少训练数据量。数据大小保持不变。虽然限制词汇表大小可以提高计算效率,但这并不是子词算法的主要目的。它们的主要优点在于用较小的单位集有效地表示较大的词汇表。

8、与Softmax相比,Adaptive Softmax如何提高大型语言模型的速度?

A.稀疏单词表示

B.Zipf定律

C.预训练嵌入

答案:B

标准Softmax需要对每个单词进行昂贵的计算,Softmax为词表中的每个单词进行大量矩阵计算,导致数十亿次操作,而Adaptive Softmax利用Zipf定律(常用词频繁,罕见词不频繁)按频率对单词进行分组。经常出现的单词在较小的组中得到精确的计算,而罕见的单词被分组在一起以获得更有效的计算。这大大降低了训练大型语言模型的成本。

虽然稀疏表示可以改善内存使用,但它们并不能直接解决Softmax在大型词汇表中的计算瓶颈。预训练嵌入增强了模型性能,但没有解决Softmax计算复杂性的核心问题。

9、可以调整哪些推理配置参数来增加或减少模型输出层中的随机性?

A.最大新令牌数

B. Top-k

C.Temperature

答案:C

在文本生成过程中,大型语言模型(llm)依赖于softmax层来为潜在的下一个单词分配概率。温度Temperature是影响这些概率分布随机性的关键参数。

当温度设置为低时,softmax层根据当前上下文为具有最高可能性的单个单词分配显着更高的概率。更高的温度“软化”了概率分布,使其他不太可能出现的单词更具竞争力。

最大新令牌数仅定义LLM在单个序列中可以生成的最大单词数。top -k采样限制softmax层只考虑下一个预测最可能的前k个单词。

10、当模型不能在单个GPU加载时,什么技术可以跨GPU扩展模型训练?

A. DDP

B. FSDP

答案:B

FSDP(Fully Sharded Data Parallel)是一种技术,当模型太大而无法容纳在单个芯片的内存时,它允许跨GPU缩放模型训练。FSDP可以将模型参数,梯度和优化器进行分片操作,并且将状态跨gpu传递,实现高效的训练。

DDP(分布式数据并行)是一种跨多个GPU并行分发数据和处理批量的技术,但它要求模型适合单个GPU,或者更直接的说法是DDP要求单个GPU可以容纳下模型的所有参数。

https://avoid.overfit.cn/post/5cbf407986584cfab3efd5ee3801b697

如何学习AI大模型

作为一名热心肠的互联网老兵,我决定把宝贵的AI知识分享给大家。 至于能学习到多少就看你的学习毅力和能力了 。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

一、全套AGI大模型学习路线

AI大模型时代的学习之旅:从基础到前沿,掌握人工智能的核心技能!

img

二、640套AI大模型报告合集

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。

img

三、AI大模型经典PDF籍

随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。

img

四、AI大模型商业化落地方案

img

作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量。


http://www.ppmy.cn/devtools/132845.html

相关文章

【时间之外】IT人求职和创业应知【31】

目录 新闻一:2024年“秦创原沣东杯”陕西省科技工作者创新创业大赛颁奖仪式暨沣东新城机器人产业发展大会盛大启幕 新闻二:声网CEO赵斌:RTE将成为生成式AI时代AI Infra的关键部分 新闻三:“5G工业互联网”融合应用试点城市名单…

棱镜七彩参加“融易行”产融对接南京站项目路演活动 展示供应链安全创新成果

近日,江苏省软件强链“融易行”产融对接南京站活动圆满举行,棱镜七彩作为江苏省重点软件企业受邀参加活动,并展示了公司在供应链安全与开源治理方面的创新成就。 本次活动由江苏省工业和信息化厅、南京市工业和信息化局主办,关键软…

苍穹外卖day09超出配送范围前端不提示问题

同学们在写苍穹外卖项目day09时调用了百度地图api来判断用户地址是否超出配送范围, 但是在黑马官方的课程或资料中,出现这样的问题时只会向用户端的控制台报错并不会提醒用户 如下图: 解决方法: 其实解决方法很简单只需要找到向…

ORACLE 闪回技术简介

闪回技术是若干技术的集合 包含对数据库整体的闪回 对表的闪回 对事务的闪回 经典面试题面试题:简述Oracle数据库闪回技术? 1.闪回Oracle数据库 2.闪回表 3.闪回事务 数据库闪回 要想实现数据库闪回 1.必须配置数据库的恢复区 SQL> show parameter …

网络安全从零开始学习CTF——CTF基本概念

这一系列把自己学习的CTF的过程详细写出来,方便大家学习时可以参考。 一、CTF简介 01」简介 中文一般译作夺旗赛(对大部分新手也可以叫签到赛),在网络安全领域中指的是网络安全技术人员之间进行技术竞技的一种比赛形式。 CTF起…

OAK相机:纯视觉SLAM在夜晚的应用

哈喽,OAK的朋友们,大家好啊,今天这个视频主要想分享一下袁博士团队用我们的OAK相机产出的新成果 在去年过山车SLAM的演示中,袁博士团队就展示了纯视觉SLAM在完全黑暗的环境中的极高鲁棒性。 现在袁博士团队进一步挖掘了纯视觉的潜…

ReactNative中实现图片保存到手机相册

在 Expo 中,要将图片保存到手机相册,你可以使用 Expo 的 MediaLibrary 模块来实现。以下是保存图片到相册的基本步骤: ### 步骤概览: 1. **导入所需模块**:ImagePicker import * as ImagePicker from expo-image-pick…

《AI 大模型:软件开发流程的全新变革之旅》

在科技日新月异的今天,AI 大模型的崛起正如同一场强烈的风暴,席卷着软件开发领域,重塑着这一领域的每一个环节和流程。从最初的需求捕捉到最终的软件上线,AI 大模型都展现出了前所未有的影响力。 需求分析:更精准、更…