马斯克宣布xAI将在8月份推出Grok-2大模型 预计年底推出Grok-3

news/2024/10/6 17:36:34/

在今年内,由特斯拉创始人马斯克创立的人工智能初创公司xAI将推出两款重要产品Grok-2和Grok-3。马斯克在社交平台上透露了这一消息,其中Grok-2预计在今年8月份面世,而Grok-3则计划于年底前亮相。

在这里插入图片描述
除此之外,马斯克还表示,他计划在年底推出的一款大型人工智能模型Grok-0将使用10万块英伟达的H100进行训练,并有可能超越现有人工智能水平并激发全球用户对AI技术的兴趣。

尽管成立时间不长,但xAI在人工智能领域已经取得了令人瞩目的进展。去年7月13日才宣布成立的该公司,在不到一年的时间里就完成了首个旗舰模型Grok-0的训练,参数量达到330亿。随后,他们又先后推出了Grok-1、Grok-1.5和Grok-1.5V等多款产品。

目前发布的这些多款Grok模型虽然间隔时间很短,但功能逐渐增强。其中,3月28日发布的Grok-1.5增加了长文本处理能力;4月12日发布的 Grok -1.5V 增加了视觉推理能力 , 可以根据自然语言和图像交错进行推理 。除了在产品上的卓越成就外,xAI在资本市场上也获得了认可。他们在5月26日在官网上宣布从B轮融资中筹集了60亿美元资金,投资者包括红杉资本、安德森·霍洛维茨基金、富达管理与研究公司以及沙特王国控股公司等。

在这里插入图片描述

这里所说的H100是英伟达开发的图形处理单元,也称为Hopper,是专门用于处理大语言模型(LLMs)数据的AI芯片。随着科技公司竞相开发更智能的AI产品,这些芯片成了硅谷的热门商品。

每块英伟达H100人工智能芯片的价格估计在3万美元左右,也有人估计价格高达4万美元,如果批量购买的话可能会有折扣。

通过简单计算,单单训练Grok 3就用了价值30亿至40亿美元的人工智能芯片,目前不确定这些芯片是否是马斯克公司直接购买的,此前报道称,马斯克旗下的xAI公司正在与甲骨文谈判,计划在未来几年内花费100亿美元租用云服务器。近年来,马斯克的公司已直接购买了大量的H100芯片。据报道,马斯克曾将原本供特斯拉使用的价值5亿美元的H100芯片转给了X公司。

相较于Grok 2,使用10万块H100训练Grok 3无疑是一个巨大的提升。今年4月,马斯克在接受挪威主权基金负责人尼科莱·坦根(Nicolai Tangen)的采访时表示,训练Grok 2需要大约2万块H100。

目前,xAI已发布了Grok-1和Grok-1.5版本,最新版本仅对X平台上的早期测试者和现有用户开放。马斯克在周一的帖子中透露,Grok 2计划于今年8月推出,并暗示Grok 3将于年底发布。

10万块H100芯片听起来很多,但其他科技巨头,如Meta,也在大量购买GPU芯片。Meta首席执行官马克·扎克伯格(Mark Zuckerberg)今年1月曾表示,到2024年底,Meta将购买约35万块英伟达H100芯片,并表示包括其他类型的GPU在内,Meta将拥有约60万块芯片。

如果是这样的话,Meta将为构建自家人工智能能力花掉大约180亿美元。

这些芯片的积累也导致了过去一年中顶尖AI人才的招聘竞争变得异常激烈。AI初创公司Perplexity的创始人兼首席执行官阿拉文德·斯里尼瓦斯(Aravind Srinivas)谈到了他试图从Meta挖角一位资深研究人员的经历,但对方因扎克伯格拥有大量AI芯片而拒绝了他的邀请。

“我试图聘请一位非常资深的Meta研究员,他们的回答是:‘等你有了1万块H100 GPU再来找我。’”斯里尼瓦斯说。


http://www.ppmy.cn/news/1474017.html

相关文章

希亦、小吉、觉飞内衣洗衣机值得买吗?王牌对决测评还不来看看!

内衣洗衣机是近几年新兴的家电产品,以清洁效果好、除菌能力强,被很多人种草入手了!但网上有不少人虽感兴趣,但不清楚如何选。担心买到质量差,清洗不干净的产品。所以为了帮助大家可以更好的了解哪个品牌的内衣洗衣机比…

一 、分布式软总线原理

分布式软总线(Distributed Soft Bus)是HarmonyOS(鸿蒙操作系统)中的关键技术之一,它负责提供设备间统一的分布式通信能力,使得不同终端设备能够像在同一台设备上一样进行高速、低延迟的数据传输和任务协同。在C++实现分布式软总线时,主要涉及以下几个核心部分: 设备发现…

如何使用小红书矩阵系统:提升内容管理与发布效率的指南

小红书作为一个流行的社交电商平台,吸引了大量的内容创作者和品牌入驻。为了更高效地管理内容和提升用户体验,小红书矩阵系统提供了一套强大的工具和功能。本文将详细介绍如何使用小红书矩阵系统,帮助您最大化利用其核心功能。 小红书矩阵系…

昇思25天学习打卡营第6天|关于函数与神经网络梯度相关技术探讨

目录 Python 库及 MindSpore 相关模块和类的导入 函数与计算图 微分函数与梯度计算 Stop Gradient Auxiliary data 神经网络梯度计算 Python 库及 MindSpore 相关模块和类的导入 Python 中的 numpy 库被成功导入,并简称为 np。numpy 在科学计算领域应用广泛&#x…

【TS】TypeScript 联合类型详解:解锁更灵活的类型系统

🌈个人主页: 鑫宝Code 🔥热门专栏: 闲话杂谈| 炫酷HTML | JavaScript基础 ​💫个人格言: "如无必要,勿增实体" 文章目录 TypeScript 联合类型详解:解锁更灵活的类型系统一、联合类型的定义二…

谷粒商城学习笔记-05-项目微服务划分图

文章目录 一,商城业务服务-前端服务二,商城业务服务-后端服务三,存储服务四,第三方服务五,服务治理六,日志七,监控预警系统1,Prometheus2,Grafana3,Prometheu…

暴雨受邀参加第三届中国数据中心服务器与设备峰会

7月2-3日,第三届中国数据中心服务器与设备峰会在上海召开,作为国内最聚焦在服务器领域的专业峰会,吸引了来自全国的行业专家、服务器与机房设备厂家,企业IT用户,数据中心业主共同探讨AIGC时代下智算中心设备的设计之道…

����: �Ҳ������޷��������� javafx.fxml ԭ��: java.lang.ClassNotFoundException解决方法

如果你出现了这个问题,恭喜你,你应该会花很多时间去找解决方法。别问我怎么知道的... 解决方法: 出现乱码的原因:配置vm时 这些配置看似由有空格,换行,实则没有。所以解决办法就是,重新配置你…