公司会倒闭,但大模型肯定不会

news/2025/2/1 19:40:42/

咋玩抖音的我,前几天在抖音上发了一张图片,没想到竟然有1000多的播放量。

当然这个播放量不算高,甚至在抖音的体系里属于很低的,但是比我预料的可能只有个位数的播放量是高了不少。

图片

这张图片是我用某国产 AI 软件生成的,本意是想表达“将士军前半死生,美人帐前犹歌舞”的意境。

AI 画出来之后,我感觉配色和意境还不错,就发到了抖音上。

这里想说的是,大概几个月前,我曾经尝试过该国产模型绘画的能力,当时的感觉只能说是乏味可陈。

可如今,经过了这几个月的迭代,模型输出图片的能力却让我眼前一亮。

比如下面这张,我随意输入了帮我画“一个小孩在河边玩耍,需要水墨画风格”。

图片

意境和配色感觉都还不错。

再比如下面这张,输入:“古风美女,面若桃花、柳叶弯眉”。

图片

结果也还不错,至少意境是达到了。

一连串试了好几个,AI 的表现基本可以给70分以上了,而且生成速度很快。

虽然画质和细节处理可能还比不上国外跟牛的大模型比如 MJ, 但是从国内大模型迭代的速度来看,我还是很看好的。

为什么大模型可以把一句话转换为图片呢?

我找到了一张图片可以解释这个问题。

图片

这是 openai CLIP 模型的训练过程:左上是文本的输入,左下是图片的输入,

通过将文本输入和对应的图片输入相对比(在右侧的矩阵中找到文本和图像的相似性),从而找到文本编码后的矩阵和图片编码后的矩阵的映射关系。

从而在文本生成图片时,图片部分通过解码器,便找到了文本和图片特征空间的对应,也就完成了文本到图片的生成,当然这只是粗略的解释,细节还可以继续深究。

总的来说就是需要找到文本和图像在模型中的一套统一的特征表示,或者特征的映射关系。

也就是说,文本和图片,在模型中有个第三者,两种之间的转换通过这个第三者来完成。

之前听到过一些说法,说大模型创业公司很多都会死去,最终可能只会剩下一两个大模型。

尤其是光年之外濒临破产被美团收购之后,这样的说法更多。

公司倒闭死去很正常,试问有哪一年哪个行业不会有一批创业公司死去呢?

但是体验了一下 AI 绘画之后,更加坚信了一点:公司会死,但大模型不会。

希望国产大模型继续加油~


http://www.ppmy.cn/news/1226953.html

相关文章

关于卓越服务的调研报告

NetSuite知识会发起的本次调研从2023年11月2日开始,到11月12日结束。16日已向参与调研的朋友邮件回复,感谢您的付出!今朝分享此报告,各位同学参考。 调研问题与反馈总结 问题1:您能想到哪些服务组织能够提供高满意度&…

【总结】坐标变换和过渡矩阵(易忘记)

xCy,此为x到y的坐标变换。 [β1,β2,…,βn] [α1,α2,…αn]C,此为基α到基β的过渡矩阵。 这个概念经常忘记。。。alpha到beta看来就是alpha后面加一个过渡矩阵了,很直观。坐标变换就是根据过渡矩阵和基本形式推一推得到吧,记…

Leetcode—剑指OfferII LCR 022.环形链表II【中等】

2023每日刷题(三十三) Leetcode—LCR 022.环形链表II 算法思想 参考k神的博客 实现代码 /*** Definition for singly-linked list.* struct ListNode {* int val;* struct ListNode *next;* };*/ struct ListNode *detectCycle(struct List…

linux在非联网、无网络环境下,使用yumdownload、reportrack方法安装rpm包

文章目录 前言1、下载yum-utils​​2、yumdownloader3、repotrack4、区别:总结 前言 当开发者在联网环境下使用Linux时,可以轻松地通过yum或apt-get安装软件。然而,在公司和企业中,由于安全原因,生产环境通常无法访问…

mongodb——原理简介,docker单机部署

MongoDB noSQL数据库 特点 数据文件存储格式为 BSON (JSON 的扩展) {“name”:“joe”}这是 BSON 的例子,其中"name"是键,"joe"是值。键值对组成了 BSON 格式。面向集合…

vue3中如何使用Pinia

Pinia 是 Vue 3 中的状态管理库,类似于 Vue 2 中的 Vuex。Pinia 的最大特点是使用了 Vue 3 的新特性,比如 Composition API 和 Proxy,提供了更好的性能和开发体验。 相比之下,Vue 2 中的 Vuex 依赖于 Vue 2 的响应式系统&#xf…

电商平台革新:食派士小程序的无代码开发与广告推广集成

食派士小程序:无代码开发的连接神器 食派士小程序,作为上海食派士商贸发展有限公司的专利产品,是一种凭借无代码开发,就能实现与各种系统的连接和集成的电商解决方案。它采用无代码开发的方式,避免了API开发的复杂过程…

新版mmdetection3d将3D bbox绘制到图像

环境信息 使用 python mmdet3d/utils/collect_env.py收集环境信息 sys.platform: linux Python: 3.7.12 | packaged by conda-forge | (default, Oct 26 2021, 06:08:21) [GCC 9.4.0] CUDA available: True numpy_random_seed: 2147483648 GPU 0,1: NVIDIA GeForce RTX 3090 …