今日AI热点新闻:
1.腾讯重磅开源五款3D生成模型,最快30秒完成生成
2.昆仑万维开源首款多模态思维链推理模型 R1V
3.全新 AI 工厂操作系统 Dynamo,推理能力提升 30 倍
4.Blackwell Ultra 平台发布,AI 性能提升 1.5 倍
5.字节跳动调整 AI 研究策略,取消 AGI 团队考核机制
6.英伟达刷新 DeepSeek-R1 推理世界纪录
7.马斯克旗下 xAI 收购 AI 视频生成公司 Hotshot,或对标 OpenAI Sora
腾讯重磅开源五款3D生成模型,最快30秒完成生成
腾讯近日宣布,一口气开源五款3D生成模型,并已在腾讯混元3D官网上线,供用户体验。
- Turbo系列模型:该系列模型在保持高精度与高质量的前提下,实现了数十倍的几何生成加速,使3D模型的生成时间缩短至30秒以内。这一突破得益于腾讯混元提出的3D生成加速框架 FlashVDM,该框架打破了传统模型在生成效率上的瓶颈,使大规模3D模型的生成迈入秒级时代。
- 多视图版本模型:如Hunyuan3D-2-MV,该模型结合多个视角的输入信息,更精准地捕捉细节,生成符合用户预期的高质量3D资产。
- Mini轻量级系列模型:通过优化模型架构和提升运行效率,有效降低算力成本。其中的几何模型可在NVIDIA RTX 4080显卡甚至Apple M1 Pro芯片上运行,进一步拓宽了3D生成技术的应用场景。
昆仑万维开源首款多模态思维链推理模型 R1V
昆仑万维今日宣布,正式开源首款工业级多模态思维链推理模型——Skywork R1V,成为中国首家开源多模态推理模型的企业。即日起,R1V的模型权重与技术报告已开放下载。
据介绍,视觉推理模型是能够执行多步逻辑推理和分析的AI模型,擅长处理需要“思维链”(Chain-of-Thought)推理的视觉任务。例如:
- 复杂的视觉逻辑推理
- 视觉数学问题求解
- 图像中的科学现象分析
- 医学影像的诊断推理
R1V强调层层递进的推理能力,可精准理解并分析图像内容,为视觉AI推理技术带来全新突破。
模型权重下载链接:
- Hugging Face:Skywork-R1V-38B
- GitHub:SkyworkAI/Skywork-R1V
英伟达 GTC 2025 开幕,黄仁勋揭示 AI 未来版图
在 GTC 2025 的开幕主题演讲中,英伟达创始人兼 CEO 黄仁勋 在长达 150 分钟的演讲中,全面展示了从 AI Agent、数据中心 AI 芯片 到 具身智能 等多个领域的技术进展,为 AI 产业的未来发展指明方向。
全新 AI 工厂操作系统 Dynamo,推理能力提升 30 倍
英伟达此次推出了 Dynamo,一个专为 AI 推理优化的 推理服务库,黄仁勋将其比作 新时代的 VMware,能够自动编排 AI 在推理任务中的计算路径,显著提升每秒生成的 token 数量。英伟达表示,在 Blackwell 架构上使用 Dynamo 进行优化,可将 DeepSeek-R1 模型的吞吐量提升 30 倍。Dynamo 完全开源,进一步推动 AI 推理效率的革新。
Blackwell Ultra 平台发布,AI 性能提升 1.5 倍
在硬件领域,英伟达正式发布 Blackwell Ultra,这是 Blackwell AI 工厂平台的下一代进化版本,旨在 进一步提升 AI 推理能力。该平台包含:
- GB300 NVL72系统
- HGX B300 NVL16系统
据英伟达介绍,Blackwell Ultra 的 AI 性能比前代产品高出 1.5 倍,为数据中心提供更强的计算能力。
此外,英伟达还更新了 2026-2027 年 AI 芯片路线图,正式公布即将推出的 Rubin(以天文学家 Vera Rubin 命名)及其升级版 Rubin Ultra,这一系列芯片将进一步推动 AI 计算性能的提升。
全球首个开放可定制人形机器人推理模型 GR00T N1
继去年发布 GR00T 模型后,英伟达今年推出了 GR00T N1,这是一款 全球首个开放的、完全可定制的通用人形机器人推理与技能基础模型。
- GR00T N1基于 合成数据生成与仿真学习 技术,采用**“快思考与慢思考”双系统架构**。
- 慢思考负责 环境感知、指令理解、行动规划。
- 快思考负责 将规划转换为精准、流畅的机器人动作。
这一模型的推出,标志着英伟达在 具身智能 领域迈出了重要一步。
字节跳动调整 AI 研究策略,取消 AGI 团队考核机制
3 月 18 日,字节跳动 豆包大模型部门(Seed) 召开全员会议,会议由 新任 AI 基础研究负责人吴永辉 与 模型应用负责人朱文佳 共同主持。
此次会议再次强调了 字节 CEO 梁汝波 提出的 “探索智能上限” 发展方向,并确认 大模型研究将得到充足算力支持。
值得注意的是,吴永辉宣布:
- 取消 Seed Edge 项目(AGI 长期研究团队)季度 OKR 和半年考核,以便团队能更加专注于长期的 AGI 研究。
这一调整,表明字节跳动正在 弱化短期绩效压力,强化长期 AI 研究投入,为更具前瞻性的 AI 发展方向铺路。
英伟达刷新 DeepSeek-R1 推理世界纪录
在 NVIDIA GTC 2025 上,英伟达宣布了 DeepSeek-R1 的最新推理性能世界纪录。
在 满血 6710 亿参数 的 DeepSeek-R1 模型上,单个 NVIDIA DGX 系统,搭载 八块 NVIDIA Blackwell GPU,可实现:
- 每位用户每秒超过 250 个 token
- 系统整体每秒吞吐量超过 30,000 个 token
这一突破,进一步验证了 Blackwell 架构 在大模型推理领域的领先性能。
马斯克旗下 xAI 收购 AI 视频生成公司 Hotshot,或对标 OpenAI Sora
据 TechCrunch 报道,马斯克旗下人工智能公司 xAI 已收购 AI 视频生成初创公司 Hotshot,这家公司的技术被认为与 OpenAI 的 Sora 视频生成模型相似。
Hotshot 联合创始人兼 CEO 阿卡什·萨斯蒂(Aakash Sastry) 周一在 X(推特)上宣布了这一消息,并表示:
“过去两年里,我们作为一个小团队构建了三个视频基础模型——Hotshot-XL、Hotshot Act One 和 Hotshot。我们很高兴加入 xAI,并将在全球最大算力集群 Colossus 上进一步扩展这些工作。”
Hotshot:从图片 AI 到文本生成视频
Hotshot 总部位于旧金山,由萨斯蒂和约翰·穆兰(John Mullan) 创立,最初专注于基于 AI 的图片创作和编辑工具,后逐步转向 文本生成视频 AI 模型 领域。
xAI 或正研发视频生成模型,与 OpenAI Sora 竞争
此次收购表明,xAI 可能正在开发自有 AI 视频生成模型,以与 OpenAI Sora、谷歌 Veo 2 等竞品展开竞争。马斯克 今年 1 月曾在直播中暗示,xAI 正在研发 “Grok 视频”,预计将在 “几个月内” 发布,或将成为其 Grok 聊天机器人平台 的重要扩展功能。
随着 AI 视频生成技术的加速发展,xAI 的这一举措意味着 马斯克希望在 AI 视觉生成领域占据一席之地,未来或将与 OpenAI、谷歌等巨头正面交锋。
CAxrWFy ZWIBZdzG UtAGjL jzZrYL wIk rTmA
AuGHw sIYtFb Zcr lnsg aRveC TrIS
Bma VbUECyhS AyApmd qja OKRXnv KAW jFVkp