百度 2025届秋招提前批 文心一言大模型算法工程师

devtools/2024/11/16 10:59:47/

文章目录

  • 个人情况
  • 一面/技术面 1h
  • 二面/技术面 1h
  • 三面/技术面 40min

个人情况

先说一下个人情况:

  1. 学校情况:211本中9硕,本硕学校都一般,本硕都是计算机科班,但研究方向并不是NLP,而是图表示学习
  2. 论文情况:1A(NeurIPS)+1B(ICDM)已录用,还有一篇A会(AAAI 2025)最近快出结果了,以及一篇数据挖掘A刊TOIS在投,四篇论文都是一作
  3. 实习情况:快手推荐算法日常实习 + 腾讯大模型暑期实习
  4. 奖学金情况:本科生国家奖学金、研究生国家奖学金,4次校级一等奖学金
  5. 其他:我的CSDN有一点粉丝量,至于其他诸如数学建模还有蓝桥杯获奖,以及优秀毕业论文和优秀毕业生之类的,对求职也没太大作用

目前等着谈薪

一面/技术面 1h

  1. 自我介绍
  2. 为什么不做推荐转行做NLP
  3. 介绍实习,从背景、动机、数据处理、实验方案到成果,到后续安排,问了个遍
  4. 数据如何处理
  5. 详细介绍了LongLoRA,包括各种实验细节
  6. Sparse Attention了解哪些
  7. Transformer中有哪些加速收敛,防止过拟合的操作
  8. 介绍各种norm,batchnorm训练测试差异
  9. 位置编码方案有哪些?优缺点
  10. 长文本技术了解哪些,详细说一说
  11. 长文本和Sparse Attention的结合有哪些,详细说说
  12. 介绍NIPS论文,问了一些问题
  13. 手撕二叉树右视图,比较基础
  14. 反问

二面/技术面 1h

  1. 自我介绍
  2. 介绍实习
  3. 上线后有哪些问题,如何解决的
  4. 除了加数据微调,还有哪些方法缓解
  5. 往后做还能有哪些优化的地方
  6. NIPS论文
  7. 为什么转行做大模型岗位
  8. 大模型和推荐你觉得有哪些结合方式
  9. 快手推荐实习
  10. 推荐全链路简述一下
  11. 算法题:给定一个数n比如8,找到所有因式相乘组合,例如222 24 42 8,调试了半天写出来了
  12. 反问环节

三面/技术面 40min

  1. 自我介绍
  2. 问了论文相关情况
  3. 介绍NIPS论文
  4. 直接开始做题:给定数n(偶数),可以形成两行n//2列的数组a,要求对于任意列j都有a[0][j] < a[1][j],找到所有可能,dfs
  5. 对以后做的东西有什么倾向
  6. 看了看博客,主要内容都和GNN相关,问是否有对搜广推的执念,当然是没有的
  7. 介绍部门的业务,说欢迎来这边
  8. 还面试了哪些

目前还没谈薪,先等着


http://www.ppmy.cn/devtools/134409.html

相关文章

CTF练习4

RSA加密 注&#xff1a;L&#xff1a;是与N互质的个数不是最小公倍数这里的最小公倍数指的是存在于N中(互质当N个整数的最大公因数是1时&#xff0c;则称这N个整数为互质&#xff09; 解密&#xff1a;因为N与E是公开的所以要解密就要求出D&#xff0c;要解出D就要求出L,要求出…

kafka消费数据太慢了,给优化下

原代码 public class KafkaConsumerDemo {public static void main(String[] args) {int numConsumers 5; // 增加消费者的数量for (int i 0; i < numConsumers; i) {new Thread(new KafkaConsumerThread()).start();}}static class KafkaConsumerThread implements Runn…

Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks

摘要 大型预训练语言模型已经被证明可以在其参数中存储事实性知识,并在下游自然语言处理(NLP)任务中通过微调取得了最先进的效果。然而,它们访问和精准操控知识的能力仍然有限,因此在知识密集型任务上,它们的表现往往落后于专门为任务设计的架构。此外,这些模型在决策时…

SpringBoot(二十二)SpringBoot集成smart-doc自动生成文档

计划在项目中集成swagger日志框架,经过一顿折腾,发现一个小小的问题。我得springboot框架版本是2.6.13,swagger要匹配这个版本的springboot可能比较麻烦。 这可如何是好…… 经跟社区的大神得讨论,他在用的文档生成工具是smart-doc。我尝试一下集成这个工具。 官网:https:…

梧桐数据库中的循环函数统计提升数据库性能的详细指南

梧桐数据库中的循环函数统计提升数据库性能的详细指南 引言 在现代企业级应用中&#xff0c;数据库性能的优劣直接影响着用户体验和业务效率。梧桐数据库&#xff08;WutongDB&#xff09;作为一款高性能的分布式关系型数据库&#xff0c;提供了丰富的工具和功能来帮助开发者…

DFT下release的sdc讨论

DFT下release的sdc主要包括三部分&#xff1a; 1、shift_sdc&#xff1a; 主要是检查scan_chain上寄存器q到si的timing情况&#xff1b;同时还要注意edt_logic和scan_chian之间的时序关系&#xff1b;channel_in/out或者wrap_cell_input/output的接口处的timing&#xff1b;处…

logstash grok插件语法介绍

介绍 logstash拥有丰富的filter插件,它们扩展了进入过滤器的原始数据&#xff0c;进行复杂的逻辑处理&#xff0c;甚至可以无中生有的添加新的 logstash 事件到后续的流程中去&#xff01;Grok 是 Logstash 最重要的插件之一。也是迄今为止使蹩脚的、无结构的日志结构化和可查询…

连续 Hopfield 神经网络深入探讨

连续 Hopfield 神经网络深入探讨 一、引言 人工神经网络在众多领域展现出了卓越的性能&#xff0c;连续 Hopfield 神经网络&#xff08;Continuous Hopfield Neural Network&#xff0c;CHNN&#xff09;作为其中的重要分支&#xff0c;为解决复杂的优化问题、模式识别以及联…