数据中台:业务模型 VS 算法模型,到底该怎么用?

embedded/2024/9/23 17:39:15/

提到数据,就必须提到各种模型。小伙伴们经常有疑惑:从4P、SWOT、RFM到线性回归、决策数、Kmean聚类,都有人管它们叫模型,那这些模型到底有啥区别?今天一文讲清,大家看完再也不迷路哦。

一个例子,看懂二者区别

模型一词,本身指的是“对现实世界的抽象”,通过少数关键信息,描述复杂的问题。

提炼关键信息的方式有2种:如果从业务角度做提炼,就是:业务模型;如果用数学、统计学、运筹学、机器学习方法论提炼,就是:算法模型。

举个简单的例子,我们常说“营销4P模型”,这个4P其实是从业务逻辑出发的。站在业务视角,只要我做好了商品、渠道、价格、促销,就能把货卖出去。

但是落到数据层面,就有很大区别。商品和渠道属性很难量化,我们只能通过打标签的方式,粗略对比不同标签下销售指标差异(如下图):

图片

商品价格/促销与销量的关系,容易用数据量化,因此催生出一个经典的算法模型:价格弹性模型。首先采集不同价格下商品销量;第二步,拟合函数,总结出量价模型;第三步就可以拿模型推测涨价效果,或者求出利润最大化的价格了(如下图):

在这里插入图片描述

注意!方法都是为解决问题而设计的,两种方法各有优势。

业务模型的优势

业务模型最大的优势,在于能从业务角度给出问题的解释。

比如:

是不是我的策略不对?

是不是我的选品不行?

是不是我的执行力不行?

类似“策略”、“选品”、“执行力”这些业务上思考 ,很难直接用x、y的加减乘除关系来衡量。此时就得构造业务分析模型,先把“策略”、“选品”等名词量化,再用逻辑树的方法,对问题进行拆分,构造一个层层深入的分析逻辑,用排除法找到正确答案(如下图)。

在这里插入图片描述

业务模型的第二个优势,在于容易观察业务行动的效果。

比如上图中,基于逻辑树,业务改进了执行动作,增加了人力投入。我们可以直接观察:逻辑树顶端问题,是否变好了,从而判断分析是否真的到位(如下图)。

图片

业务模型的第三个优势,在于清晰业务主体责任。

比如都是做预测,如果直接用回归算法或者平滑算法给出一个结论,那么业务部门就没法看到自己行为的效果,还会迷惑地问:“那我下周加班不加班,结果一样吗?”“如果我搞不掂A客户,转而做B客户,是不是预测会不一样?”(如下图)

图片

此时如果用业务模型来预测,可以直接把整体指标按部门拆开,让各部门填写自己预期情况。虽然具体参数可能需要拍脑袋得出来,但是每个部门能直接看到自己需做到什么水平,从而反向激励业务必须行动。即使没有完成任务,也能清楚看到“是谁没完成”。从而更快速地思考对策。

算法模型的优势

算法模型最大的优势,并不是比人聪明,而是运算速度快+省事。比如经典的互联网推广问题,各种限制条件一堆:“推广总预算,每个渠道转化率,每个渠道可以预约档期数量”等等。

此时,如果用人力去安排,可能要计算半天,但熟悉运筹学的同学们都知道,这是个典型的线性规划模型,只要能写清楚建模假设, 就很容易出结果(如下图)。

图片

更方便的是,如果以后有调整,比如:

1、修改总投放费用

2、渠道档期数变化

3、渠道转化率变化

那么只要修改模型参数,就能快速出结果了,非常方便(如下图):

图片

算法模型的第二个优势,是能发现业务没注意到的情况。

比如做商品分析的时候,业务上是可以手动输出一份《商品关联规则表》,但这个表格的规则是固定的。如果用关联规则算法,则可以突破业务思路的限制,发现更多潜在关联销售逻辑。虽然不见得是“啤酒与尿布”这么夸张的东西,但是也对启发业务思路很有帮助(如下图)。

图片

算法模型的第三个优势,就是处理大规模数据了。

典型的业务模型RFM,做用户分层时,如果每个指标分3类,那么就有333=27类,在业务上已经复杂到很难匹配对应策略了。但是如果用协同过滤算法,完全可以做到千人千面,这也是算法模型的巨大优势。

之所以互联网公司倾向于用算法做推荐,主要是源自互联网平台上的商品量以十亿计,极难手动匹配规则。

业务与算法,如何完美配合

想要做好顺畅配合,建议大家在项目启动前,先花时间梳理好:到底要解决什么问题。而不是一上来先说:我要个模型。先捏个模型出来,再拿着锤子找钉子。

如果要解决的问题本身不清晰,比如:

1、诊断类问题:到底指标异动是因为内部还是外部原因?

2、标准类问题:到底该怎么定义“高价值用户”、“有效的策略”?

3、测试类问题:我有个新想法,还没实行,不知道有没有效果?

此时建议做业务模型,先把问题梳理清楚,把定义明确好,拿到测试数据,再看进一步怎么做?

如果要解决的问题定义清晰,且有数据积累,就很适合做算法模型。特别是即使业务很努力,也很难提升效果的时候,比如用户流失挽留,新用户电话销售等场景,天然响应率低,通过模型筛选目标群体能极大提升业务效率,此时效果好。


http://www.ppmy.cn/embedded/94097.html

相关文章

高防服务器的机制和原理

高防服务器是一种具备强大防御能力的服务器,旨在保护网站免受各种网络攻击,如DDoS(分布式拒绝服务)攻击、CC(ChallengeCollapsar)攻击等。今天小编将从流量过滤与清洗、负载均衡与反向代理、实时监控与报警…

Django如何移除数据库字段?

关键步骤: 第一步:python manage.py makemigrations 你的项目名称第二步: python manage.py migrate (.venv) PS D:\python_workpace\django_xitong_shezhi\pythonProject\myproject> python manage.py makemigrations myproject Migra…

element-plus 中自定义 el-input 的边框 border

文章目录 需求分析 需求 如图所示,自定义 el-input 的边框 取消前 取消后 分析 在 Element Plus 的 el-form 表单组件中,如果你想要去掉 el-input 组件的外边框,只保留下边框,可以通过 CSS 来实现。这通常涉及到修改 el-inpu…

SpringBoot基础(二):配置文件详解

SpringBoot基础系列文章 SpringBoot基础(一):快速入门 SpringBoot基础(二):配置文件详解 目录 一、配置文件分类二、配置文件优先级1、不同版本优先级2、不同位置优先级 三、配置文件格式1、yml和yaml格式1.1、字符串1.2、布尔类型1.3、整数型1.4、浮点…

Security Onion开源IDS入侵检测系统最新版搭建教程

Security Onion是一个由防御者为防御者构建的免费开放平台。它包括网络可见性、主机可见性、入侵检测蜜罐、日志管理和案例管理。Security Onion已被下载超过200万次,并被世界各地的安全团队用于监控和保护他们的企业。 从网络可见性的角度来看,Securit…

MySQL学习——程序开发工具

Program Development Utilities(程序开发工具)是一系列辅助程序员在软件开发过程中提高效率和质量的工具。这些工具涵盖了从代码编辑、编译、调试到测试、性能分析等多个方面。 本文介绍一些在开发MySQL程序时可能很有用的实用程序。 在shell脚本中&am…

如何看待“低代码”开发平台的兴起?

近年来,“低代码”开发平台如雨后春笋般涌现,为企业和开发者提供了以极低的编程门槛快速构建应用程序的能力。这一技术正在悄然改变传统软件开发的格局,引发了IT行业的广泛讨论。低代码平台究竟是提高效率的利器,还是降低编程门槛…

Python 学习路径:从零基础到高级应用

当然可以!学习 Python 是一个循序渐进的过程。下面是一个分阶段的学习流程,适合初学者参考: 第一阶段:基础入门 目标: 理解 Python 基础语法,能够编写简单的程序。 安装 Python: 下载并安装最…