数据分析思维(十一):应用篇——用数据分析解决问题

ops/2025/1/13 12:04:20/

此前篇章:

数据分析思维(一):业务指标(数据分析并非只是简单三板斧)

数据分析思维(二):分析方法——5W2H分析方法、逻辑树分析方法、行业分析方法

数据分析思维(三):分析方法——多维度拆解分析方法

数据分析思维(四):分析方法——对比分析方法、A/B测试

数据分析思维(五):分析方法——假设检验分析方法

数据分析思维(六):分析方法——相关分析方法

数据分析思维(七):分析方法——群组分析方法

数据分析思维(八):分析方法——RFM分析方法

数据分析思维(九):分析方法——AARRR模型分析方法

数据分析思维(十):分析方法——漏斗分析方法


数据分析解决问题

一、数据分析解决问题的过程

1、明确问题

2、分析原因

两个点:

  • 哪里出了问题?
  • 为什么会出现这个问题?

3、提出建议

找到原因并还没有完事,还需要找到对应的解决办法,这才是数据分析的终点。

二、如何明确问题?

弄清楚问题很重要,这决定了后面工作的成败。

2.1 明确问题常见的错误

误区案例:一个小伙子看到一个老头,老头脚边有一条狗。小伙子问:“你的狗咬人不

?”。老头说:“不咬人。”于是小伙摸了狗,被狗咬了:“你不是说你的狗不咬人吗?”老头回答:“对啊,但是这不是我的狗。”

小伙子想摸狗,但是没有正确定义问题。这种错误在生活中随处可见。又例如,领导问你告诉你:”可能是客单价高,最近利润下降了。“于是你就将老板的问题定义为:”客单价高导致利润下降,要怎么办“。但是这样定义有什么风险呢?

答案是,在定义的问题中,已经包括了原因(这个场景中”是客单价高“),这样你的后续工作都变成了收集与客单价相关的价格数据。但是,利润下降确实可能是客单价高导致的,但是这样定义问题你可能会忽略其他可能导致利润下降的原因。

因此,在定义问题时,避免将经验“主观”地加入问题中,避免“我觉得或我认为是xxx导致的”等代入问题的定义中。数据分析不是主观臆断,应是一种客观分析。

2.2 如何明确问题

明确问题可以参考下图的方法:

1)明确数据来源和准确性

在明确问题时,也要保证数据本身是准确的,才能进行后面的步骤。例如,看一篇新闻,你要知道是不是假新闻,最直接可以看是否是官方发布的,而不是什么八卦平台,否则这篇新闻看了等于没看,因为是假的。同样,数据分析时也一样,从数据中,我们发现了问题,前提是数据要准确,否则,分析解决这个问题没有什么实际意义。

如何做呢?可以从时间、地点、数据来源 来确认问题表现为哪些现象。

  • 时间:问题是由哪个时间范围的数据发现的?
  • 地点:是哪个地区的数据?
  • 数据来源:数据源自于哪里?是否核对过?

例如(后续内容均以这个案例讲解),通过观察销售部门(数据来源)提供的1~6月上半年(时间)全国(地点)每个月的实际利润和计划利润表:

发现目前需要解决的问题:上半年(1~6月)利润落后于计划的原因是什么?如何在完成下半年计划利润的同时,完成上半年未达标的利润?

2)业务指标理解

对于业务指标,可以分析指标的含义、以及和谁比

案例中,“利润”是指标,我们可以去问相关部门:“利润这个指标是这么定义的”。然后明确指标的定义:

利润 = 销售收入 - 销售成本 - 营业外支出

继续追问:销售收入和销售成本又怎么定义?

最后得出:

销售收入 = 客单价 * 用户数

销售成本 = 销售费用 + 商品采购成本

营业外支出 = 各项非营业支出(比如罚款支出、捐赠支出等)

 其中,人均付费在电商领域也叫客单价

此外,需要解决的问题中若含有“高”、“大”、“小”等字眼,要问清楚和谁比!(对比分析)。这个案例中,利润下降就是实际利润与计划利润对比得出的问题。

三、如何分析原因?

影响问题的原因有很多,如果把所以原因都分析一遍,那么这个工作量是非常大的。因此,在原因分析的过程中,要优先分析那些关键的因素。

如何知道哪些是关键的因素呢?可以使用这3步来分析:

  1. 使用多维度拆解分析方法对问题进行拆分,将一个复杂问题细化成各个子问题。
  2. 对拆解的每个部分,使用假设检验分析方法找到哪里出了问题。分析的过程可以使用对比分析方法等多个方法辅助完成。
  3. 分析出哪里出了问题后,多问自己为什么出了这个问题,然后使用相关分析方法进行深入分析。

3.1 案例原因分析过程

前文已知案例问题:上半年(1~6月)利润落后于计划的原因是什么?如何在完成下半年计划利润的同时,完成上半年未达标的利润?

根据问题,我们需要找到“哪里出了问题”,可以使用“多维度分析方法”根据“利润”定义对利润这一指标进行拆解,如下:

要拆解问题到什么程度,没有同一标准,需要根据实际业务和问题灵活把握。接下来,使用假设检验分析方法对每一个子问题部分进行验证。

1)营业外支出

提出假设:营业外支出增加导致上半年利润落后于计划。

收集数据:营业外支出汇总表

得出结论,上半年没有营业外支出,假设不成立,因此,不是由于营业外支出增加导致问题产生。 

2)销售成本

提出假设:销售增加导致上半年利润落后于计划。

收集数据:今年、去年上半年销售成本数据 。

其中,总销售成本同比 = (今年总 - 去年总)/ 去年总

分析:总销售成本同比=3.18%,说明今年上半年的总销售成本比去年是增加了3.18%。为了方便分析,对数据进行可视化:

结论:今年上半年的销售成本出现明显增长。

那么是什么原因导致销售成本增加的呢?因为,销售成本 = 销售费用 + 商品采购成本,接下来进一步分析。

a)分析销售费用

收集数据:

 可视化:

可见,上半年的销售费用是逐步增加的 ,但是,这不一定是由于销售费用增加导致利润下降的。为什么呢?

因为,销售成本增加,是为了提升销售增长的,如果销售费用增加带来销售收入增长是合理的。因此,我们需要将销售费用、销售收入结合起来分析。这需要关注一个指标:即费率比,费率比越低,说明通过投入的费用带动销售增长的效果越好。

费率比 = 投入的费用 / 产生的销售收入。

收集数据:销售费用、销售收入

可视化:

结论:可见,费率比是逐步下降的,说明销售费用增加是合理的。销售费用增加不是导致利润下降的主要原因。

b)分析商品采购成本

收集数据:

从表格可以发现,今年的平均采购成本是低于去年的平均采购成本的。

结论:商品采购成本不是影响利润下降的主要原因。

进一步的,由于销售费用、采购成本都不是主要原因,因此,销售成本不是导致利润下降的主要原因。假设不成立。

3)销售收入

提出假设,销售收入减少导致上半年利润落后于计划。

收集数据: 

结论:总销售收入同比为 -8.07%,说明销售收入减少是造成利润落后于计划的主要原因。

那么是什么原因呢?由于销售收入 = 客单价 * 用户数,接下来进一步分析。

a)分析客单价

收集数据:

结论:由于今年上半年的平均客单价是高于去年的,因此,肯单价不是主要原因。

b)分析用户数

收集数据:

结论:今年上半年的平均用户数是低于去年上半年的,因此,用户数减少是导致利润下降主要原因。

如果分析到这里就结束,那么分析结果将无法产生实际的意义。因为只看用户数下降还不能决定“接下来要采取那些具体措施才能解决问题”。因此,要继续分析导致“用户数”下降的原因是什么。

现在把“用户数”按用户、产品、竞品这3个维度进行拆解。根据具体问题可以决定优先分析的维度。在案例中,可以从竞品维度来比较用户数。通过和竞争对手比较可以发现,公司用户数比同行竞争对手低很多。

 进一步分析用户数低的原因,可以梳理本公司、竞争对手的业务流程,方便从业务流程中提出假设。

业务流程:

第一步:用户选择所需商品

第二步:用户比较不同店铺(本店和竞争对手)中的商品价格

第三步:用户付款后,销售部门安排送货上门,即售后服务。

再次使用假设检验分析方法,依次假设其中的一个步的问题导致用户数下降:

1——用户找不到所需的商品(没有新产品)。

2——没有价格优势。

3——售后服务用户不满意。(可以通过用户满意度问卷进行分析验证)

具体分析过程就忽略了,我就直接写结论了:

  • 假设1不成立。虽然不是因为用户找不到所需商品所致,但是也与本店们没有即使展出新产品,老产品多有关。
  • 假设2成立。通过分析发现,本店铺没有价格优势:商品定价跟竞争对手相同,但是竞争对手经常举办促销活动,被优惠价格吸引,用户流失到竞争对手那去了。
  • 假设3成立。用户满意度逐步下降。

原因1可以快速解决,原因2和原因3并不是立马能解决的。公司资源有限,一个阶段只能解决一个问题,这两个因素,哪个对用户数下降影响最大,最需要优先解决呢?

这时候就需要通过相关分析方法进行分析了。

我们可以通过计算商品的价格、用户满意度和用户数的相关系数,观察相关系数大小来决定优先级。 相关系数的计算可以通过数据分析工具进行计算,比如Python、Excel等。

原因分析小结:

四、如何提出建议 ?

这一步,是根据前面找到的原因提出建议。在这一步,常用的分析方法是通过回归分析或者AARRR模型分析方法。

4.1 回归分析 

只知道a和b高度相关,领导是无法根据“相关”采取行动的。虽然找到了利润没达标的原因,但是不知道要改善到什么程度才能实现下半年利润目标(下半年利润目标包括上半年未达标的部分利润,假设总的目标为4008.63万)。这时候就需要计算出某个原因能够对目标造成多大程度的影响。

我们可以是计算出利润与销售收入的相关系数的,如下:

画出散点图,做出回归线,预测下半年销售收入要达到多少才能达成下半年利润计划。 

涉及回归分析的内容就不多赘述了,是一种用于辅助决策者决策的方法。

通过分析,提出部分建议:

五、总结 

数据分析解决问题的过程:

注意事项:

  • 找到问题的原因并不是数据分析发终点,还要给出针对建议。
  • 决策建议不能太多,会增加决策成本,还会让决策者迷失,无从下手。相对简单的问题,可以提4个左右选项;复杂问题可以提4~7个选项。  
  • 决策是可以落地实施的具体措施,不可以模糊不清。

# 文章仅供学习参考使用,参考教材《数据分析思维——分析方法和业务知识》


http://www.ppmy.cn/ops/149725.html

相关文章

ElasticSearch 同义词匹配

synonym.txt 电脑, 计算机, 主机 复印纸, 打印纸, A4纸, 纸, A3 平板电脑, Pad DELETE /es_sku_index_20_20250109 PUT /es_sku_index_20_20250109 {"settings": {"index": {"number_of_shards": "5","number_of_replicas&quo…

深入理解 HTTP 的 GET、POST 方法与 Request 和 Response

HTTP 协议是构建 Web 应用的基石,GET 和 POST 是其中最常用的请求方法。无论是前端开发、后端开发,还是接口测试,对它们的深入理解都显得尤为重要。在本文中,我们将介绍 GET 和 POST 方法,以及 Request 和 Response 的…

李宏毅机器学习课程笔记03 | 类神经网络优化技巧

文章目录 类神经网络优化技巧局部最小值local minima 与 鞍点saddle pointSaddle Point 的情况更常见 Tips for training:Batch and MomentumSmall Batch vs Large Batch回顾:optimization优化 找到参数使L最小问题:为什么要用Batch&#xff…

Python Selenium库入门使用,图文详细。附网页爬虫、web自动化操作等实战操作。

文章目录 前言1 创建conda环境安装Selenium库2 浏览器驱动下载(以Chrome和Edge为例)3 基础使用(以Chrome为例演示)3.1 与浏览器相关的操作3.1.1 打开/关闭浏览器3.1.2 访问指定域名的网页3.1.3 控制浏览器的窗口大小3.1.4 前进/后…

Python网络爬虫入门教程:从抓取数据到应用实现

引言 在大数据时代,信息就是力量。各种网站每天产生着海量的数据,这些数据中蕴藏着巨大的商业价值和研究价值。如何快速、自动化地从互联网上获取这些信息,成为了数据科学、人工智能、市场分析等领域中的一个重要课题。Python,作…

OpenAI掌舵人解读OpenAI新进展:迈向超级智能。

1.奥特曼称已掌握构建通用人工智能 近日,OpenAI的掌舵人山姆奥特曼在《反思》一文中称,他们已掌握构建通用人工智能(AGI)的秘诀,并正大步迈向这一里程碑。此前,他在社交媒体X上留下的“六字箴言”——“nea…

UML系列之Rational Rose笔记二:包图

rose绘制包图,有简单的有复杂的; 正常图简单的话,直接新建package使用就行,改变package的大小,改变名称当作不同的包就行;基本没有什么学习难度;在此,笔者直接介绍一下回执标准一点…

用 Python 从零开始创建神经网络(十九):真实数据集

真实数据集 引言数据准备数据加载数据预处理数据洗牌批次(Batches)训练(Training)到目前为止的全部代码: 引言 在实践中,深度学习通常涉及庞大的数据集(通常以TB甚至更多为单位)&am…