Cyber Weekly #46：Manus和QwQ-32B

赛博·新闻

1、阿里发布全球最强开源模型QwQ-32B

本周四（3月6日），阿里巴巴正式发布并开源通义千问推理模型QwQ-32B，该模型凭借320亿参数实现性能直逼6710亿参数的DeepSeek-R1（仅激活370亿参数），在数学推理、代码生成及通用能力上达到国际顶尖水平。QwQ-32B通过两轮大规模强化学习，突破传统奖励模型限制，直接校验答案正确性及代码执行效果，显著提升训练效率。其核心亮点包括：支持消费级显卡本地部署（如3090Ti输出速度超30token/s），集成Agent智能体能力实现工具调用与动态推理，采用Apache2.0协议完全开源（含模型权重、代码及训练脚本）。开源后迅速登顶HuggingFace全球模型榜单，衍生模型突破10万，成为全球最大开源模型族群之一。用户可通过QwenChat网页版、通义APP免费体验，企业可申请API接口。该模型的发布标志着阿里在“小参数高性能”推理领域的重大突破，为AGI路径提供新范式，

2、中国通用型AI Agent产品Manus刷屏

同样在本周四（3月6日），中国AI公司Monica.im正式发布全球首款通用型AI Agent产品「Manus」，宣称其在GAIA基准测试中性能超越OpenAI同层次大模型，可自主完成复杂任务。作为真正意义上的智能体，Manus不仅能提供建议，还能直接执行多领域任务，如简历筛选、房产选购、旅行规划等，支持异步处理文件和跨平台协作，甚至生成网页、表格等成果。目前产品处于内测阶段，官网预约用户突破120万，Discord社区吸引超10万开发者，二手平台邀请码炒至5万元。

3、腾讯混元「图生视频模型」正式发布并开源

还是在本周四（3月6日），腾讯混元正式发布并开源130亿参数量的图生视频模型HunyuanVideo-I2V，该模型支持通过静态图片生成5秒短视频，并具备自动背景音效合成、2K高清分辨率、对口型及动作驱动等核心功能。用户上传图片后，可通过简短文本描述控制画面动态效果（如镜头调度、局部动作），人物图片还可实现语音同步（支持文字或音频输入）和舞蹈模板驱动，适用于写实视频、动漫角色、CGI场景等多种创作需求。开源内容包含模型权重、推理代码及LoRA训练脚本，开发者可基于业务数据微调生成专属特效，目前已在GitHub、HuggingFace等平台开放下载。官方提供免费体验通道（每日赠送次数）和腾讯云API接口，测试显示其生成效果可对标OpenAISora，企业应用案例中某电商平台转化率提升37%。该模型通过图像潜在连接技术实现多模态融合，利用MLLM增强图像语义理解，标志着AI视频创作进入零门槛时代。

赛博·洞见

1、一手体验首款通用Agent产品Manus-唯有惊叹。

作者卡兹克，本文深度体验了全球首款通用AI Agent产品Manus，其通过任务分解、工具调用与云端执行能力，实现了从单一问答到复杂任务自动化的跨越。Manus在GAIA基准测试中以86.5%的通过率超越OpenAI的DeepResearch，展现了多模态处理、推理规划和实时信息整合的综合实力。作者通过发票处理、论文转PPT、股票分析等案例，展示了其自动化流程：用户仅需提供明确指令，Manus即可自动解压文件、调用OCR识别、编写代码、生成可视化报告，并支持交互图表与动态时间线输出。尽管存在如表格格式调整等细节瑕疵，但其任务执行效率与结果质量已达到专业级水平。Manus的出现标志着AI从辅助工具向自主执行系统的进化，可能重塑编程、数据分析等领域的工作方式。同时，作者强调人类在创意决策、责任承担中的不可替代性，呼吁关注人机协作的新范式。值得注意的是，Manus与同期开源的Qwen-32B模型均为中国团队研发，彰显了国内在AI Agent与大模型领域的技术突破。

2、AI持久战，怎么打？

文章以《论持久战》为切入点，批判AI行业普遍存在的短期投机心态，倡导以长期主义思维深耕AI领域。作者指出当前行业呈现两极分化："速胜派"盲目追逐技术热点（如Agent、Sora等），依赖"炸裂"概念炒作，最终因预期落空陷入悲观；"失败派"则因大厂垄断而丧失信心。这种心态导致行业陷入"上半年乐观、下半年悲观"的循环，企业盲目跟风技术更新（如DeepSeek套壳），实则缺乏战略定力。作者以雷军造车为例，强调长期主义的关键作用。雷军坚持"人车家全生态"战略，耗时三年打造小米汽车Su7，通过"产品刀法+供应链工程"实现突破，验证了后发者通过高完成度项目破局的可能性。相比之下，部分企业家沉迷IP营销与概念炒作，与雷军形成鲜明对比。对普通人而言，文章提出三点建议：

寻找细分领域支点，通过微小优势结合AI杠杆实现突破；
拒绝速胜心态，长期积累是核心竞争力（如自媒体需百万字沉淀）；
利用AI工具降低创作门槛，保持表达欲与创造欲。

作者认为，AI时代本质是加速暴露个人能力，唯有长期主义者才能在喧嚣中建立护城河，最终实现价值。

3、美国红杉最新播客：AI的“随机思维”，把计算机的确定性打破了！

这篇文章聚焦红杉美国播客对AI“随机思维”的探讨，指出人工智能正推动计算范式从确定性向概率性转变，这种转变不仅改变工具属性，更将重塑人类思维方式与工作模式。AI输出的随机性（如对话结果差异、内容生成的不可复制性）打破了计算机长期以来的确定性逻辑，要求人类从追求绝对可控转向接受不确定性，通过迭代开发、实验验证和批判性思维管理AI的“概率性建议”。这种思维转变如同从“执行者”升级为“管理者”——人类需成为AI的“老板”，在利用其高效处理信息的同时，承担结果筛选与决策责任。文章强调，随机思维本质是科学思维的延伸，鼓励创业者和知识工作者以开放实验应对变化，将AI视为“工作外骨骼”而非替代工具。未来，组织管理将向AI代理协调演进，IT团队可能转型为“AI人力资源部门”，而人类的核心价值将转向战略规划、创意决策等更高抽象层次。这种思维革命不仅是技术适应，更是应对社会、经济不确定性的进化策略，最终推动人类在概率世界中保持创造力与适应性。

4、从R1到Sonnet3.7，Reasoning Model首轮竞赛中有哪些关键信号？

文章分析了近期头部AI实验室发布的推理模型（如OpenAI的o3-mini、xAI的Grok3、Anthropic的Claude3.7Sonnet等）在首轮竞赛中的表现与趋势。核心指出当前推理模型尚未形成绝对领先的SOTA，各模型在数学推理、代码能力、多模态融合等方面各有侧重：OpenAI与xAI的模型在基础能力和竞赛解题上表现突出，Anthropic则通过混合推理架构（Hybrid Reasoning Model）和RL技术在解决真实工程问题（如代码生成、代理工具使用）上保持优势，并通过ClaudeCode产品构建AI编码基础设施。文章强调底座模型预训练仍是核心竞争力，而混合推理模式（支持动态切换快速/慢速思考）将成为未来标配，同时RLScaling（通用强化学习）的效果已超越垂直领域微调。此外，AI编码能力的突破（如Claude3.7单次生成千行可靠代码）和代理工具的迭代（支持长周期推理与验证环境）正推动AI-native开发工作流的形成。尽管行业处于RLScaling早期阶段，各实验室的持续创新表明通用智能的第二幕竞争已全面展开，未来需关注模型动态计算能力、持续学习机制及多模态高阶能力的突破。

5、AI法律独角兽Harvey CEO：基于结果的定价是未来；AI原生用户体验在于模拟与人合作的体验

本文是对AI法律独角兽Harvey CEO Aatish Nayak的访谈，围绕其产品策略、市场定位和行业洞察展开。Harvey专注于法律和专业服务领域，借助AI自动化处理合同起草、尽职调查等法律任务，其成功源于精准的市场时机、专业的团队构成和独特的产品设计。在市场方面，ChatGPT的发布推动了行业对AI的接受，客户需求增长，且法律行业竞争激烈，律所需展示创新能力以吸引客户。团队上，法律专家深度参与销售、产品和AI团队，将法律流程转化为算法，使产品与律所工作流程高度契合。产品设计采用“AI原生用户体验”，模拟同事协作，通过反馈循环增强用户信任，其聊天界面结合动态UI组件，支持异步任务和透明操作过程。商业模式上，Harvey初期采用基于席位的收费模式，未来计划转向基于结果的定价。技术架构依赖外部模型，通过微调等技术构建复合AI系统，注重企业级安全和数据隐私。行业趋势方面，CEO认为企业级AI应用需深入特定工作流程，结合多方面优势，短期内AGI不会取代行业专家，企业需时间适应AI，未来AI原生用户体验和行业深度整合是关键，同时要解决信任和协作问题。总体而言，Harvey凭借独特策略在法律AI领域占据领先地位，其经验对其他行业的AI应用具有借鉴意义。

6、大模型“注意力简史”：与两位AI研究者从DeepSeek、Kimi最新改进聊起

文章围绕大模型中注意力机制的改进展开，通过访谈两位AI研究者探讨了DeepSeek的NSA和Kimi的MoBA等最新成果。核心指出，注意力机制作为大模型的核心，最初旨在解决长文本问题，但传统全注意力机制因显存开销和计算复杂度限制难以应对日益增长的输入输出长度需求。稀疏注意力通过动态选择关键上下文块实现效率提升，NSA和MoBA通过硬件协同优化（如块级操作、算子优化）在预训练阶段引入稀疏性，既保持甚至超越全注意力的性能，又显著降低计算成本。研究者强调，长文本能力的提升不仅依赖算法改进，还需结合系统层（如FlashAttention）和硬件层优化，而多模态叠加长思维链生成将进一步推动注意力机制的进化。未来方向包括存储优化、多模态稀疏模式适配以及AGI驱动的科研创新，其中稀疏注意力的硬件协同设计为长文本处理提供了可行路径，而AGI的自我迭代能力可能成为突破能源限制的关键。

7、对话“Manus”两位创始人：2025，AI Agent即将引爆

本文聚焦于AI Agent产品"Manus"的发布及其引发的行业变革讨论。文章指出，以"Manus"为代表的AI Agent已突破传统助手的局限，能够独立完成复杂任务并交付成果，其应用场景覆盖旅行规划、股票分析、教学辅助等领域，标志着AI从提供建议向实际执行的跨越。两位创始人张涛和季逸超在混沌圆桌会议中强调，AI时代的核心竞争力在于发现问题与需求的能力，而非技术本身，技术将逐渐成为基础设施，创业者需从需求出发挖掘应用价值。他们认为，AI不会完全取代人类，但会放大人类能力，传统组织应通过"示范效应"推动AI渗透，而非强行变革。对于行业趋势，DeepSeek等模型的爆发将加速Infra基础设施发展，2025年或成为AIAgent与Infra结合的关键节点。文章还探讨了AI对就业的影响，指出重复性工作将被替代，但人类的责任承担和决策能力仍不可替代，建议通过提升问题解决能力和适应人机协作实现价值重构。

8、从最近火热的Trae说说编程IDE发展趋势

本文聚焦于以Trae为代表的新一代AI编程IDE的发展趋势。文章表明，Trae的出现标志着AI编程进入新阶段，其智能程度较之前有显著提升，能较好地完成一些编程任务，像编写扎金花统计分析程序和暴力破解密码程序等。不过，AI编程仍存在局限性，例如会出现函数名虚构、程序执行报错等问题，还无法完全替代人类编程。在IDE发展历程中，传统IDE如JetBrains功能繁多但操作复杂，而未来基于AI的IDE会更简化，能让AI代劳大量工作。目前，Trae和Cursor等新兴AI编程IDE在使用体验上优于国外的Cursor，但与VSCode相比还有差距，因为VSCode有强大的生态系统和跨平台远程功能。AI编程的发展会对程序员行业产生影响，可能会使程序员需求减少，改变行业高工资的现状。但AI也能辅助程序员，释放他们的创造力。同时，AI的发展还可能引发社会经济模式的变革，未来或许会出现人只需消费而无需工作的新经济模式。总体而言，AI编程是编程IDE的发展方向，但还需不断完善，行业要适应这种变化，关注生态和长期发展。

9、″从DeepSeek学到了什么?”Anthropic CPO 2万字深度解密:大模型研发路线,中国崛起,AI和未来

本文通过Anthropic首席产品官Mike的访谈，深度探讨了大模型研发与AI行业的未来趋势。Mike指出，AI价值将更多体现在垂直领域的差异化竞争中，初创公司需以独特数据、行业知识或市场策略构建护城河，而成熟企业则需平衡现有业务与AI升级。他强调模型迭代应基于当前能力探索边界，而非等待完美版本，并提出差异化的三大支柱：顶尖人才、垂直领域专注及深度合作伙伴关系。在数据与评估方面，未来需结合人类数据与合成环境训练，同时建立更贴近人类体验的定性评估体系。面对中国AI的崛起，Mike认为西方低估了中国团队的创新能力（如DeepSeek的快速迭代），并反思其对Anthropic加速产品发布节奏的影响。关于开发者角色，他预测未来开发者将转型为"AI工作流管理者"，聚焦任务委派与跨学科协作。医疗领域被视为AI突破的关键，可能通过药物发现与细胞模型研究大幅提升人类寿命。此外，Mike还提到模型选择的用户体验矛盾及品牌忠诚度的重要性，呼吁关注AI的伦理与隐私挑战。整体而言，访谈揭示了大模型研发需技术突破与场景落地并重，中国团队的崛起正推动全球AI竞争进入新阶段。

10、「世界模型」能改变世界吗？李飞飞的世界实验室是啥？8000字看懂World Model演进史

本文系统梳理了世界模型（World Model）的技术演进与未来趋势，探讨其重塑人类社会的潜在影响。世界模型作为AI的下一代模态，通过整合多模态数据与动态模拟能力，正在从实验室走向商业化应用。从2018年Ha和Schmidhuber提出的基础框架，到2024年DeepMind Genie2实现3D环境交互，再到2025年微软MUSE结合Xbox生态加速游戏开发，技术突破持续推动虚拟世界的真实性与交互性。当前世界模型已能生成实时3D场景、模拟物理规则并支持玩家输入，但仍面临状态记忆、计算成本、版权归属等挑战。未来，其应用将超越游戏领域，渗透至机器人控制、影视创作、教育等场景，甚至可能重构人类劳动价值体系。作者认为，世界模型或将成为解决AI时代财富分配不均的关键，通过虚拟空间的意义建构，为个体提供超越现实的价值实现路径，但其发展需平衡技术创新与伦理挑战，最终可能推动人类社会向虚实融合的新纪元演进。

11、桥水达利欧：美国分裂、AI竞赛、全球失序，未来五年将如何演变?

本文通过桥水基金创始人达利欧的访谈，深度剖析了未来五年全球格局的核心变量。达利欧指出，美国正面临严重的社会分裂，财富分化、教育体系失效与价值观对立可能引发"隐藏内战"，而法律体系与联邦制度难以有效调和极端矛盾。在技术领域，AI将成为重塑社会的核心力量，其指数级发展可能带来生产力革命，但也会加剧就业市场动荡与不平等。达利欧认为，AI的本质是工具，其影响取决于人性与制度安排：若缺乏全球协作机制与公平分配政策，技术红利可能成为放大冲突的"倍增器"。在中美竞争层面，美国在算法创新上保持优势，但中国在制造业与技术落地能力上加速追赶，两国博弈将推动全球产业链重构。此外，传统教育模式可能被AI颠覆，个性化学习将普及，而顶尖学术机构仍需承担原始创新使命。达利欧强调，未来社会的稳定取决于能否在技术效率与人性价值间找到平衡，重建社区互助精神与共同价值观，避免技术加剧社会撕裂。其核心警示在于：技术无法解决人性短视与政治博弈，唯有通过制度创新与全球协作，才能应对AI时代的系统性风险。

13、A16Z Top100｜DeepSeek、海螺、可灵上位，但谁是盈利最多的AI产品？

本文聚焦A16Z最新发布的全球AI消费应用排行榜，揭示了当前AI领域的竞争格局与发展趋势。ChatGPT凭借多模态功能（GPT-4o）、高级语音模式及推理能力升级（o1模型），用户规模在六个月内实现翻倍增长，展现持续生命力。中国团队开发的DeepSeek异军突起，以高效能低成本的技术突破（如560万美元训练成本）迅速跻身全球第二，但其地缘争议与合规挑战并存。AI视频领域迎来质量突破，Hailuo、KlingAI等新玩家通过专业功能（如摄像机控制、口型同步）与Sora形成差异化竞争，推动视频生成迈向实用化。AI编程工具呈现两极分化：Cursor等代理IDE服务开发者，Bolt等文本转网页平台赋能非技术用户，两类产品用户群存在部分重叠。移动端数据显示，流量与收入并不完全匹配，垂直领域如语言学习（Speak）、营养应用（CalAI）虽用户基数较小，但付费转化率突出。榜单还反映出AI应用市场的快速迭代特征，17家新公司进入网络排名，边缘榜单产品（如Runway、PolyBuzz）展现新兴潜力。整体而言，AI消费应用正从新奇体验转向深度实用，技术创新与商业模式探索并重，未来竞争将围绕场景渗透、用户粘性及盈利模式展开。