数据分析题面试题系列2

ops/2024/10/23 12:59:41/

 一.如何估算星巴克一天的营业额

a.需求澄清:区域?节假日?产品范围?

b.收入=销售杯数*单价=(营业时间*每小时产能*每小时产能利用率)*平均单价

Hypo该星巴克门店的营业时间为12小时(取整),忙时4h,闲时8h,制作一杯饮料时长3min,一小时最大生产量60/3*2=40杯(两台机器)

③Calculation(数据计算):

平均单价=20元*10%+35元*80%+40元*10%≈34元

高峰销售总额=4h*40杯*100%(转换率)*34=5440元

低峰销售总额=8h*40杯*80%(转换率)*34=8704元

合计=高峰销售总额+低峰销售总额=14144元

二.

总结是分功能和内容两方面阐述

产品近期新老用户流失率均较高,你觉得可能是什么原因?数据侧又可以做哪些事情?

考虑因素有哪些:季节、地域、ui、单价、信息、用户习惯改变

3、比较两种方案哪个好:以到底是买一送一好还是五折好的案例为标准

 1.确立业务机制、分析对象、业务目标、分析目标

2.确立好可量化的短期和长期目标

3.将指标量化成两个方案可比较的公式

4.分析出影响因素(价格、时长)可以分新老用户考虑

5.总结影响因素和比较指标之间的关系(比如新用户越多,价格越低,活动越有吸引力)

6.考虑实践,分类讨论给结论,可以做AB测试,分可以按不同客群给策略和不可以按不同客群给策略来做(注意两种尽量都做一遍,方便复盘)

3、

针对简历中提到的指标异常分析,你是如何定义指标异常的?

🔻 回答思路参考:

结合我过往经历,我认为指标异常整体分为三大部分,即明确异常定义、异常识别做法、异常处理方式:

首先,明确异常定义,建立标准后才能判断指标是否异常,一共分为2个步骤:

调研现状,了解基线,常用的方式有:

分析业务历史数据来了解指标的正常范围;

参考行业标准或竞争对手的数据作为基线。

设定阈值,建立标准,常用的方式有:

统计方法:使用统计方法(如平均值、标准差、四分位数范围)来设定正常值的范围。

人工规则:例如根据业务逻辑、经验、kpi等来设定阈值。

⚠️注意点:
这里同时需要by简历经历背景,谈观点和实际做法,如果仅是如上描述,就是八股文背诵,缺乏可信度和区分度。
 

其次,异常识别方法,有了标准后可以根据现状做监控和判断,常用的方法有3类:

图示法:例如

箱线图:通过箱线图可视化数据分布,超出箱型图“胡须”的点通常被认为是异常值。

散点图:在变量之间绘制散点图,观察是否有远离大多数点的离群点。

描述性统计方法:例如

3sigma原则:结合历史数据计算指标的均值方差,构建3sigma区间

四分位数和IQR:使用四分位数范围(IQR)来定义正常值的范围,通常认为低于Q1-1.5IQR或高于Q3+1.5IQR的点是异常。

基于距离/密度/聚类判断法:常见有k-最近邻、LOF、DBSCAN、孤立森林。

⚠️注意点:
这里同时需要结合具体经历做细节过程做法的展开,提高经历的区分度。
 

最后,异常处理方式,也就是识别指标异常后,要做进一步归因分析+论证、以及经验沉淀,这里:

针对归因分析,主要分为2个部分:

找根因:主要是结合指标构成+业务可落地方向做维度下钻,计算贡献度找根因,例如:xxx...⚠️注意:这里可以结合简历中实际经历信息,做具体分析思路过程的展开。

验效果:针对上述找到的问题,严谨且完整的分析需要进一步确认异常是否由因素变化引起,如果策略有调整异常是否恢复等等

针对沉淀部分,主要是为了提高后续监控和归因效率,主要分为2方面:

是否有必要归纳到自动化工具做监控、产出根因报告,方便业务能够及时根据异常情况调整业务策略。

以及,针对异常出现的严重性,评估异常对业务的影响程度。对于非常重要的指标,可以进一步考虑利用模型提前预测,尤其针对时序数据,可以做异常判别模型,达到提前报警介入的目的

4.你觉得小红书产品有什么可以优化的地方

a.聊使用感受

b不要按个人感受去提改进建议,因为可能商业模式不是你理解的那样,这就需要提前去检索它的商业模式(搞清规模体量、用户特征、发展阶段、竞争格局、竞对的优劣势、当下业务策略以及方向)

c重点说这个岗位方向的优化点

d类似过往经历补充

5.业务要上线新主播首次开播的教学引导,如何评估效果

步骤:定义问题-数据模型-汇报可视化

1、教学功能是否得到使用(曝光率、观看进度、市场)

2、看完之后效果怎么样,直接效果:有多少人成功开播/教学内容应用情况(使用率、频次、时长)

3、能不能间接服务于平台的经营业绩增长

一方面可以看数据:是否使这些人成为腰部主播(数据表现是否更好),或者看这些人数据(场观、互动、用户停留时长)趋于稳定的周期是否更短或是表现更好4、另一方面直接发问卷问他们对功能的感知程度、使用情况、认可度


http://www.ppmy.cn/ops/127824.html

相关文章

vxe-table 导入导出功能全解析

一、vxe-table 导入导出功能概述 vxe-table 的导入导出功能在数据处理中具有至关重要的作用。在现代数据管理和处理的场景中,高效地导入和导出数据是提高工作效率的关键。 对于导入功能而言,它允许用户将外部的表格数据,如 Excel 文件&…

【RTT-Studio】详细使用教程十七:FreeModbus通信--LCD

文章目录 一、简介二、Modbus通信三、LCD通信四、配置FreeModbus通信协议四、完整代码五、测试验证 一、简介 Modbus协议是一种用于工业控制的网络通讯协议,可以片面的理解为,Modbus协议一种机器与机器之间进行数据、信息传递的一种格式规范。   Modbu…

大模型落地实战指南:从选择到训练,深度解析显卡选型、模型训练技、模型选择巧及AI未来展望---打造AI应用新篇章

0.前言大模型发展史 早期阶段(1950s~1980s) 在1950年代初期,人们开始尝试使用计算机处理自然语言文本。然而,由于当时的计算机处理能力非常有限,很难处理自然语言中的复杂语法和语义。随着技术的发展,自然…

linux命令之lvdisplay用法

lvdisplay 显示逻辑卷属性 补充说明 lvdisplay命令 用于显示LVM逻辑卷空间大小、读写状态和快照信息等属性。如果省略"逻辑卷"参数,则lvdisplay命令显示所有的逻辑卷属性。否则,仅显示指定的逻辑卷属性。 语法 lvdisplay(参数)参数 逻辑…

大数据——本地威胁检测的全球方法

大数据似乎是众多专业人士关注的话题,从在自然灾害发生时帮助挽救生命,到帮助营销团队设计更有针对性的策略以接触新客户。 对于安全工程师来说,大数据分析被证明是抵御不断演变的网络入侵的有效防御手段,这得益于基于大量不同网…

PL/I语言的起源?有C语言,有B语言和A语言吗?为什么shell脚本最开始可能有#!/bin/bash字样?为什么不支持嵌套注释?

PL/I语言的起源 在20世纪50~60年代,当时主流的编程语言是COBOL/FORTRAN/ALGOL等,IBM想要设计一门通用的编程语言,已有的编程语言无法实现此要求,故想要设计一门新语言,即是PL/I. PL/I是Programming Language/One的缩写…

基于SpringBoot+Vue的厨艺交流系统的设计与实现(源码+定制开发)厨艺知识与美食交流系统开发、在线厨艺分享与交流平台开发、智能厨艺交流与分享系统开发

博主介绍: ✌我是阿龙,一名专注于Java技术领域的程序员,全网拥有10W粉丝。作为CSDN特邀作者、博客专家、新星计划导师,我在计算机毕业设计开发方面积累了丰富的经验。同时,我也是掘金、华为云、阿里云、InfoQ等平台…

bash之基本运算符

一.算术运算符 vim test.sh #!/bin/basha10 b20valexpr $a $b echo "a b : $val"valexpr $a - $b echo "a - b : $val"valexpr $a \* $b echo "a * b : $val"valexpr $b / $a echo "b / a : $val"valexpr $b % $a echo "b % a …