【面经】字节南京一面部分题目记录

server/2025/2/4 3:56:01/

南京字节一面题,可能因为项目不太匹配,全程八股比较多,也有两道手撕代码题,强度还是有的。为了方便大家学习,大部分答案由GPT整理,有些题给出了我认为回答比较好的博客链接。

文章目录

  • 一、python2 和 python 3 的区别?
  • 二、python的多线程是一个假线程,请问它具体是怎么“假”的
  • 三、http3与http2的区别
  • 四、算法题:二叉树A和二叉树B,判断B是不是A的子树
  • 五、设计题:Java 三个线程 第一个线程打印1 第二个线程打印2 第三个线程打印3(口述如何实现)
  • 六、场景题:假如电脑内存只有1个G,但是需要你统计大约100个G的数据(假设都是int型的 ),每个数字出现的次数,问题在于这100个G的数字,无论是这个原始文件还是统计结果我都是存不下的,但是我又需要你把这个结果输出,那这个事要怎么做呢?
  • 七、场景题:我现在有一个IP黑名单,我需要你设计一个服务去调用查看黑名单,我这个调用的QPS非常高,可能会达到阈值,你怎么来设计这个服务呢? 去保持这种查询的稳定性,并且还可以往里面加新的IP,并且支持高可运行性。


python2__python_3__10">一、python2 和 python 3 的区别?

(1)语法差异:Python 3引入了一些语法上的改变。例如,Python 3中的print语句变成了函数调用print(),并且print后面需要加括号。此外,Python 3的整数除法运算符/将得到浮点数结果,而Python 2中的整数除法运算符/将截断小数部分。
(2)Unicode支持:在Python 2中,字符串默认使用ASCII编码,而在Python 3中,默认使用Unicode编码。这使得Python 3更好地支持国际化和处理非ASCII字符。
(3)异常处理:在Python 2中,except语句使用逗号分隔多个异常类型,而在Python 3中,使用as关键字将异常实例赋值给变量。
(4)xrange变为range:在Python 2中,range函数返回一个列表,而xrange函数返回一个迭代器。在Python 3中,range函数返回一个类似于Python 2中xrange的迭代器,而xrange函数被移除。
(5)其他标准库变化:Python 3中有一些标准库的改动,包括urllib、unittest和io等模块。
需要注意的是,由于Python 2的支持已于2020年停止,推荐使用Python 3来编写新的代码。如果您有现有的Python 2代码,可能需要进行一些修改才能在Python 3中运行。可以使用2to3工具来自动转换大部分代码,但某些特定的语法和库可能需要手动修改。

python2与python3的区别
上面这个博客总结得挺好,建议直接看这个博客

python_24">二、python的多线程是一个假线程,请问它具体是怎么“假”的

答:Python的多线程之所以被称为“假线程”,主要是因为全局解释器锁(Global Interpreter Lock, GIL)的存在。GIL限制了真正的并行执行,即使在多线程环境中,Python也无法充分利用多核CPU的优势。以下是对这一现象的详细解释:
GIL(全局解释器锁)

  1. 定义: GIL是一种机制,用于在多线程环境中保护访问Python对象的内存安全。它确保同一时刻只有一个线程执行Python字节码,防止多个线程同时执行时出现竞态条件(race conditions)和其他并发问题。
  2. 工作机制:
    o 在CPython解释器中(最常用的Python实现),GIL允许一个线程运行一定数量的字节码指令或在特定的I/O操作后,便会释放锁。
    o 其他线程必须等待GIL被释放才能获得执行权。
  3. 影响:
    o CPU密集型任务:对于需要大量CPU运算的任务(如数值计算、图像处理),GIL会显著限制多线程的效率,因为同一时刻只有一个线程能获得GIL,导致多线程的性能表现与单线程相近。
    o I/O密集型任务:对于大量I/O操作(如网络请求、文件读写)的任务,多线程仍然有优势。因为线程在等待I/O操作完成时会释放GIL,其他线程可以继续执行。
    举例说明
    在这里插入图片描述

假设有两个线程,A和B,它们都需要执行CPU密集型的计算:

在这种情况下,即使有两个线程,Python程序也无法同时利用多个CPU核心,因为GIL限制了同一时间只有一个线程能执行Python代码。因此,运行时间几乎不会比单线程快。

【扩展】解决办法:
为了克服GIL的限制,Python提供了一些替代方案:

  1. 多进程: 使用multiprocessing模块,可以创建多个进程,每个进程都有自己的Python解释器和GIL,可以实现真正的并行执行。
    在这里插入图片描述

2、C扩展和JIT编译: 使用C语言编写性能关键的部分,或者使用如PyPy等支持JIT编译的Python解释器,可以减少GIL的影响。
3、异步编程: 使用asyncio模块,实现协程并发处理,对于I/O密集型任务是一个很好的选择。

三、http3与http2的区别

在这里插入图片描述
补充:由于HTTP3 基于QUIC作为传输层协议,具有延迟更短、遇到错误重连时恢复时间更短的优点,且QUIC本身具有内置的安全性,默认启用加密,所以HTTP3也更安全。
这个总结写得挺好,可以直接看这个:
HTTP1 HTTP2 HTTP3的区别

四、算法题:二叉树A和二叉树B,判断B是不是A的子树

力扣572题 属于简单题 递归就行

五、设计题:Java 三个线程 第一个线程打印1 第二个线程打印2 第三个线程打印3(口述如何实现)

这一类题可以用的方法蛮多的,信号量Semaphore,锁Lock,notify啊等等都能解决。
手撕面试题:多个线程交替打印问题
上面这个专栏有总结一些打印题 里面就有

六、场景题:假如电脑内存只有1个G,但是需要你统计大约100个G的数据(假设都是int型的 ),每个数字出现的次数,问题在于这100个G的数字,无论是这个原始文件还是统计结果我都是存不下的,但是我又需要你把这个结果输出,那这个事要怎么做呢?

(用GPT 给出了一种分治的方法)
1、分块读取数据:一次读取一小部分数据,以避免内存溢出。
2、使用哈希桶分块:将每一小部分数据按哈希值分配到多个桶文件中。
3、统计哈希桶数据:对每个桶文件中的数据进行统计,并将结果写入临时文件。
4、逐步合并和输出结果:从每个桶文件中读取数据进行统计,并逐步将结果写入最终输出文件,以避免在内存中保持所有统计结果。(当内存中的统计结果超过一定数量,比如0.99G,我们就先将统计结果写入输出文件并清空内存)

【我怎么感觉上面有点不太对。。。我感觉就是用时间换空间 ,先分块,把100G数据分块,每块1个G,然后用哈希桶,比如:
在这里插入图片描述
当然实际要根据数据量修改桶的数量,比如题目这种情况我感觉桶得再多点 每次选定一个桶(比如余数都是1的数) 然后去遍历这100个块,每遍历一个块把结果放桶里,直到100个块遍历完,把桶的结果输出到外存,然后清空内存换个桶继续】

七、场景题:我现在有一个IP黑名单,我需要你设计一个服务去调用查看黑名单,我这个调用的QPS非常高,可能会达到阈值,你怎么来设计这个服务呢? 去保持这种查询的稳定性,并且还可以往里面加新的IP,并且支持高可运行性。

要点一:用BitMap存储IP黑名单,每个IP对应一个bit位,1表示在黑名单中,0表示不在。IPv4地址有32位,最多需要2^32个bit(约512MB)来存储所有可能的IP地址。
要点二:使用Redis等分布式缓存存储BitMap,支持高并发读取和写入。
要点三:使用KafkaRabbitMQ异步处理黑名单更新,避免直接写入影响查询性能。

设计思路:

查询服务:

接收IP地址,转换为BitMap中的偏移量。(示例如图)
在这里插入图片描述

查询Redis中的BitMap,返回是否在黑名单中。

如果Redis未命中,从数据库加载并更新Redis。

更新服务:

接收新IP地址,转换为BitMap偏移量。

通过消息队列异步更新数据库和Redis中的BitMap。

为了提高高可用性,从中间件的常用trick入手,如部署Redis集群,配置数据库主从复制,使用Nginx或HAProxy进行负载均衡,分散查询请求等入手发散。



http://www.ppmy.cn/server/164795.html

相关文章

C# 继承与多态详解

.NET学习资料 .NET学习资料 .NET学习资料 在 C# 面向对象编程中,继承与多态是两个极为关键的特性,它们赋予了程序强大的复用性和灵活性。理解并掌握这两个特性,是成为一名优秀 C# 开发者的必经之路。 一、C# 继承 1.1 继承的定义与概念 …

Pyside6(PyQT5)的QSqlQueryModel的常用方法

QSqlQueryModel 是 PySide6 中一个用于执行 SQL 查询并处理查询结果的模型类。它可以方便地将查询结果展示在视图组件中,如 QTableView 或 QListView。以下是 QSqlQueryModel 的一些常用方法: 1. setQuery(query, dbNone) 参数: query: SQL 查询字符串…

C++——list的了解和使用

目录 引言 forward_list与list 标准库中的list 一、list的常用接口 1.list的迭代器 2.list的初始化 3.list的容量操作 4.list的访问操作 5.list的修改操作 6.list的其他操作 二、list与vector的对比 结束语 引言 本篇博客要介绍的是STL中的list。 求点赞收藏评论…

Elasticsearch 指南 [8.17] | Search APIs

Search API 返回与请求中定义的查询匹配的搜索结果。 http GET /my-index-000001/_search Request GET /<target>/_search GET /_search POST /<target>/_search POST /_search Prerequisites 如果启用了 Elasticsearch 安全功能&#xff0c;针对目标数据流…

TikTok 推出了一款 IDE,用于快速构建 AI 应用

字节跳动(TikTok 的母公司)刚刚推出了一款名为 Trae 的新集成开发环境(IDE)。 Trae 基于 Visual Studio Code(VS Code)构建,继承了这个熟悉的平台,并加入了 AI 工具,帮助开发者更快、更轻松地构建应用——有时甚至无需编写任何代码。 如果你之前使用过 Cursor AI,T…

NLP模型大对比:Transformer >Seq2Seq > LSTM > RNN > n-gram

结论 Transformer 大于 传统的Seq2Seq 大于 LSTM 大于 RNN 大于 传统的n-gram n-gram VS Transformer 我们可以用一个 图书馆查询 的类比来解释它们的差异&#xff1a; 一、核心差异对比 维度n-gram 模型Transformer工作方式固定窗口的"近视观察员"全局关联的&q…

《DeepSeek手机版:开启AI移动新时代》

DeepSeek 手机版爆火&#xff1a;现象与背景 在当今数字化时代&#xff0c;AI 技术的发展日新月异&#xff0c;如同一股汹涌澎湃的浪潮&#xff0c;深刻地改变着我们的生活。而在这股浪潮中&#xff0c;DeepSeek 手机版宛如一颗璀璨的新星&#xff0c;迅速崛起&#xff0c;引发…

[牛客]公交线路(dijkstra+链式前向星)

登录—专业IT笔试面试备考平台_牛客网 #include<bits/stdc.h> using namespace std; #define endl \n typedef long long ll; const int N1e65,M1e85; int cnt0,head[N]; int n,m,s,t; struct node {int v,w,next; }edge[M]; void addedge(int u,int v,int w) {cnt;edge…