MaaS玩家:希望AI大模型价格战再狠一点

ops/2024/9/22 21:34:06/


明知产能严重过剩的新能源企业却还在重金扩产,多半因为他们花的不是自己的钱;明知极度烧钱的AI大模型却开始打价格战,多半因为他们并不靠这东西挣钱。

所有投资人必备的一项技能,就是中观行业景气度及商业模式对比。很明显,AI有很多的商业逻辑与其他行业非常相似。就比如:有实力的才能卷、免费的往往才是最贵的。

打响这场AI大模型价格战第一枪的,是2020年便投资上亿元筹建AI超算机、拥有1万张英伟达A100 GPU的幻方,旗下深度求索DeepSeek-V2(32k)利用KV cache和batch size权重配比把价格压到了GPT-4o的1/35。第二枪跟随的,是字节的豆包,AI大模型看上去直接进入了以厘计价的时代。最终,百度的两款轻量化AI模型直接宣布免费,价格战直接开到了竞速终点。

但这几个名字放到一起,似乎有些别扭:幻方作为管理600亿资金规模的顶级量化私募,他们好像不是靠AI大模型挣钱;字节左手抖音右手今日头条,AI大模型难道是为了做营销号吗?百度直接宣布免费,难不成中国用户不用浏览器、不看广告、不用百度云了吗?

同样的,@百融云-W(6608.HK)这种MaaS厂商也是同样思路,难不成企业用户不使用AI模型库了吗?

投资人能听到的故事,都是资本家愿意讲出来让你听的;商战到底是怎么打的,得听资本家们没说什么。

所谓的AI大模型降价,指的是“输入”价格,而不是“输出”价格。也就是用户输入给AI大模型的问题,比如《红楼梦》完整版共96万字,大概是160万tokens,这部分按token量计价的输入端确实在打价格战,但AI大模型反馈的回答属于输出价格,这部分并没有降价。比如字节的“0.8元/百万tokens,比行业价格低99.3%”,指的就是输入价格,但是豆包通用模型Pro-32k的输出价格仍是2元/百万tokens。

那AI企业如果不靠大模型挣钱,他们的利润来自哪里?答案有两个:一是模型微调,也就是根据企业用户的需求定制开发,这个模式按照微调的计算资源耗费与开发周期来计费;二是模型部署,就是一家企业客户独占一台服务器的AI计算资源,将AI模型私有化,这样就不会有其他客户分流属于你的AI资源和算力。

AI大模型,本质上只是一个集合了监督学习、算法、强化学习的基础设施,而已。那企业究竟想用AI做到的是什么?换句话说,AI公司到底要赚的是哪份钱呢?

答:基于客户最离不开的AI功能,开发基于大模型的商业模式。最典型的就是百融云的MaaS(模型即服务)模式。

当初互联网刚普及的时候,用户吐槽流量费太高只是表象,本质上是因为父老乡亲们想打游戏、刷短视频。换到AI时代,之前客户吐槽大模型太贵用不起,本质上是因为他们不需要一个模型放在那儿,而是帮他们快速地做各种冗余数据的智能解析。

所以,AI大模型价格战对用户有利不假,但看清本质,选出能借此趋势把MaaS业务推向市场的公司,才是有大智慧的投资人。股市中7亏2平1赚,必须看到与绝大部分人认知不一样的逻辑,才有赚钱的机会。

衍生自AI大模型的MaaS业务究竟是哪方面让客户必须使用?举一个非常现实的行业例子,想一个问题:这个年代,有谁不借银行的钱?

近期,国有大行参股国家大基金三期、截至2024年一季度中国住户部门贷款余额81.45万亿元的两条新闻引发了深度思考。为什么经济思维印象流中,地产萎靡则信贷乏力的逻辑失效了?为什么国有大行也在参与半导体这种资本回报率已经很低的产业?

原因在于中国金融系统的特征:中国的企业债券市场规模虽然持续扩容,但相对海外市场而言仍然偏低,且其中大部分是金融债和城投债。为什么这样?因为贷款只要经过一家银行里的几个部门就可以操作了。

企业的业务、生产规模、用电量,以及纳入征信系统内的个人用户信息,对于银行的尽调成本是极低的,这是银行信贷的天然优势。但是债券发行方却必须面向整个市场宣传自己,没有背书的信用,就必须要用更高的利率做风险补偿。

那既然基础的企业及用户信息,银行本身就拥有,那他们需要AI大模型和百融云的MaaS业务做什么呢?

答案是:AI智能分析、决策、自动建模。

MaaS的本质,就是一个AI模型库,有海量的AI模型可供调用,比如资产分析、消费评分、估值建模、产品分类推荐、智能营销响应等等。对于银行等金融机构而言,如何把信贷业务中最新的贷款申请者行为信息、财富管理潜在客户最新的收入及资产情况、资本市场各类产品(股票、债券、基金)的实时报价与净值,用AI能力结合起来做综合评估,且需要数据不出本地同时能保障隐私安全,最终完成信贷投放审批和业务全流程,这才是他们始终离不开百融云这种MaaS厂商的根本原因。

再举一个财富管理领域的具体例子,一位客户提出了“有5万元可供投资”的需求,百融云的MaaS服务就会调用所有的AI模型库,最终形成的模型调用结果就会是:“您的投资风格是稳健型,您是我行尊贵的铂金客户,我行目前有平均年化收益3%的理财产品,起投金额正是5万……”。

所以当AI大模型开始打价格战之后,更低的“输入”价格会让客户更多地运用AI服务,同时随之而来的是单价没变、但使用频次海量增长的“输出”价格。同时对于资金实力不像金融业一样雄厚的其他行业客户来讲,AI大模型的价格战会让他们真正开始拥抱AI,反而促进了MaaS企业客户量广度和深度的爆发式增长。

没错,广大用户希望AI大模型价格战打的更狠一些,这样就越便宜;这也是百融云这种MaaS厂商的夙愿,因为他们终于等到了AI渗透率爆发的时点。


http://www.ppmy.cn/ops/47218.html

相关文章

Django 解决 CSRF 问题

在 Django 出现 CSRF 问题 要解决这个问题&#xff0c;就得在 html 里这么修改 <!DOCTYPE html> <html><head></head><body><form action"/login/" method"post">{% csrf_token %}</form></body> </…

【异常分析:四分位距与3σ原则】

文章目录 前言四分位距&#xff08;IQR&#xff09;3σ原则使用步骤计算四分位距应用3σ原则 代码 前言 异常分析的目标是识别数据中的异常值&#xff0c;这些异常值可能是由于错误的记录、设备故障或者其他未知原因导致的。四分位距&#xff08;interquartile range, IQR&…

WebStorm 2024.1.1 Mac激活码 前端开发工具集成开发环境(IDE)

WebStorm 2024 Mac激活码 搜索Mac软件之家下载WebStorm 2024 Mac激活版 WebStorm 2024 功能介绍 WebStorm 2024是由JetBrains公司开发的一款专为前端开发设计的集成开发环境&#xff08;IDE&#xff09;。它提供了一整套功能&#xff0c;旨在提高Web开发者的工作效率和代码质…

数字塔问题

#include<iostream> using namespace std; //从下向上得到最优值 void dtower(int a[][100],int s[][100],int n) {for(int in; i>1; i--){for(int j1; j<i; j){if(in)s[i][j]a[i][j];else{int ts[i1][j];if(t<s[i1][j1])ts[i1][j1];s[i][j]a[i][j]t;}}} } void…

音视频开发13 FFmpeg 音频 相关格式分析 -- AAC ADTS格式分析

这一节&#xff0c;我们学习常用的音频的格式 AAC&#xff0c;重点是掌握 AAC的传输格式 ADTS 头部的信息&#xff0c;目的是 &#xff1a; 当音频数据有问题的时候&#xff0c;如果是AAC的编码&#xff0c;在分析 头部信息的时候能够根据头部信息 判断问题是否出现在 头部。 A…

探秘Android系统启动的神秘面纱

系统启动过程对于任何操作系统来说都是一个非常关键的环节&#xff0c;Android作为移动设备领域中占据主导地位的操作系统&#xff0c;其启动过程也是个值得深入研究的重点话题。本文将为您解开Android启动过程的神秘面纱&#xff0c;详细剖析其中的每一个步骤&#xff0c;并通…

LLM的基础模型3:Transformer变种

大模型技术论文不断&#xff0c;每个月总会新增上千篇。本专栏精选论文重点解读&#xff0c;主题还是围绕着行业实践和工程量产。若在某个环节出现卡点&#xff0c;可以回到大模型必备腔调或者LLM背后的基础模型新阅读。而最新科技&#xff08;Mamba,xLSTM,KAN&#xff09;则提…

进程间通信(27000字超详解)

&#x1f30e;进程间通信 文章目录&#xff1a; 进程间通信 进程间通信简介       进程间通信目的       初识进程间通信       进程间通信的分类 匿名管道通信       认识管道       匿名管道       匿名管道测试       管道的四种…