今日AI热点新闻:
1.OpenAI发布全新AI Agent工具 助力智能体构建
2.阿里开源全模态模型R1-Omni 情感识别能力再升级
3.谷歌推出Gemini 2.0机器人专属AI模型 加速智能机器人发展
4.谷歌发布Gemma 3:全球最强单GPU AI模型
5.Meta自研AI训练芯片进入测试阶段 采用RISC-V架构
6.谷歌联合创始人秘密研发AI 3D打印飞机 或重塑航空制造
7.前字节跳动AI负责人骆怡航出任生数科技CEO
8.蔡崇信:AI开源开放将为中小企业带来巨大机遇
9.法国出版商与作家协会起诉Meta 指控其大规模侵犯版权
OpenAI发布全新AI Agent工具 助力智能体构建
北京时间3月12日,OpenAI举办了一场19分钟的线上发布会,正式推出一系列专为AI Agent构建设计的新工具与API。这些新工具旨在帮助开发者更轻松地创建能够自主完成任务的智能体。
OpenAI官方表示,过去一年间,公司在新模型功能方面持续创新,包括高级推理、多模态交互和最新的安全技术,这些突破性进展为AI智能体处理复杂、多步骤任务奠定了坚实基础。
阿里开源全模态模型R1-Omni 情感识别能力再升级
阿里巴巴通义实验室正式开源R1-Omni模型,这是业界首个应用可验证奖励强化学习(RLVR)技术的全能多模态大语言模型。研究团队通过RLVR优化了开源Omni模型HumanOmni-0.5B,使其在推理能力、情感识别准确性以及泛化能力等核心指标上实现显著提升。
R1-Omni能够更精准地理解视觉和听觉信息如何共同作用于情绪识别,并能明确展现不同模态信息在特定情绪判断中的关键影响,进一步拓宽了AI在情感计算领域的应用潜力。
谷歌推出Gemini 2.0机器人专属AI模型 加速智能机器人发展
据财联社报道,当地时间3月13日,谷歌正式发布两款基于Gemini 2.0的新型人工智能(AI)模型,旨在提升机器人在不同场景下的灵活性和交互能力,推动其在现实世界中的应用落地。
据悉,新模型专为各种形态的机器人设计,包括人形机器人以及工厂、仓库等环境中的工业机器人。其中,Gemini Robotics是一款集成视觉、语言和行动的AI模型,能够理解自然语言指令并通过物理动作执行复杂任务,赋予机器人更强的自主操作能力。
另一款Gemini Robotics-ER则专注于空间推理能力,帮助机器人更准确地感知环境,并为开发者提供强大的推理工具,以便他们基于该模型创建更智能的机器人应用。
谷歌DeepMind工程师Kanishka Rao表示,将Gemini模型引入机器人领域,有望推动智能机器人向更通用、更智能的方向发展。“我们的世界复杂多变,而通用智能机器人需要能够应对这种复杂性。”他说道。
谷歌发布Gemma 3:全球最强单GPU AI模型
3月12日,谷歌正式推出Gemma 3人工智能模型,这是其在Gemini AI技术基础上推出的新一代“开放”Gemma AI模型。谷歌官方博客称,Gemma 3专为开发者设计,支持在多种设备上无缝运行,无论是智能手机还是高性能工作站,均可高效执行任务。
Gemma 3具备强大的多模态处理能力,支持超过35种语言,并能够分析文本、图像及短视频。谷歌声称,该模型是“全球最强的单加速器AI模型”,在单GPU环境下的表现超越了Meta的Llama、DeepSeek及OpenAI等竞品。同时,该模型针对Nvidia GPU及专用AI硬件进行了深度优化。谷歌还发布了一份26页的技术报告,详细阐述其性能优势及架构优化方案。
Meta自研AI训练芯片进入测试阶段 采用RISC-V架构
据知情人士透露,Meta的首款自研AI训练芯片已进入内部测试阶段,并基于RISC-V指令集架构,由全球领先的芯片制造商台积电代工流片。目前,Meta已小规模部署该芯片,以评估其性能并为未来大规模生产做准备。
尽管芯片的具体规格尚未披露,也不清楚Meta工程师是否进行了详细的基准测试,但外媒报道称,该芯片已经开始执行部分实际任务。如果测试结果理想,Meta计划于2026年正式大规模部署自研AI训练芯片,从而降低对Nvidia等供应商的依赖。(TechWeb)
谷歌联合创始人秘密研发AI 3D打印飞机 或重塑航空制造
据《商业内幕》3月12日报道,谷歌联合创始人拉里·佩奇正在资助一个秘密项目,探索利用AI与3D打印技术革新飞机制造。该项目由前Kittyhawk首席技术官克里斯·安德森领导,并成立了一家名为Dynatomics的初创公司,总部位于加州帕洛阿尔托。
Dynatomics成立于2023年6月,专注于AI优化3D打印流程,以突破传统航空制造的技术瓶颈。安德森长期关注增材制造(3D打印)在航空领域的潜力,认为该技术可显著降低成本,并提高飞机生产的灵活性和规模化能力。
该项目核心团队成员包括斯坦福大学航空机器人专业的研究人员,他们正致力于开发融合AI与先进制造技术的航空制造新方案。安德森曾表示,如果飞机能像汽车一样实现大规模生产并降低成本,全球交通格局或将迎来颠覆性变革。(凤凰网)
前字节跳动AI负责人骆怡航出任生数科技CEO
3月12日消息,原字节跳动旗下火山引擎AI应用产品负责人骆怡航正式加入生数科技,担任CEO一职。生数科技方面已向媒体确认该消息。与此同时,公司原联合创始人兼CEO唐家渝现任公司总裁,负责战略发展、品牌管理、人事行政、财务、法务及知识产权等核心职能。
生数科技此前发布的“中国版Sora”——Vidu,是国内首个具备长时长、高一致性和高动态性的视频大模型,备受市场关注。此次人事调整或预示着公司将进一步深化其在AI视频生成领域的布局。
蔡崇信:AI开源开放将为中小企业带来巨大机遇
3月12日上午,阿里巴巴集团董事长蔡崇信在新加坡的一场论坛上谈及AI开源开放的影响。他表示,AI开源的核心价值在于降低中小企业和创业者使用AI的门槛,从而推动未来应用生态的繁荣。
“技术进步的关键不在于中国是否拥有比美国更强的AI,而在于开源如何帮助更多人掌握AI的力量。”蔡崇信强调,AI不应是大型企业的专属领域,中小企业将在开源浪潮中受益,而今天的开放创新将奠定未来AI应用的繁荣基础。
法国出版商与作家协会起诉Meta 指控其大规模侵犯版权
3月12日,法国国家出版联盟(SNE)、国家作者与作曲家联盟(SNAC)及文学家协会(SGDL)联合宣布,已对Meta提起诉讼,指控其涉嫌大规模盗用受版权保护内容,以训练其人工智能模型。
“我们正在见证一场大规模的盗窃行为。”SNAC总代表Maia Bensimon表示。SNE总干事Renaud Lefebvre更将此次诉讼比作“大卫与歌利亚之战”,称其具有示范意义,可能影响AI领域的版权监管格局。作为Facebook、Instagram和WhatsApp的母公司,Meta近年来深度涉足AI领域,而此次诉讼或将为AI训练数据的合规性问题带来新的法律挑战。
74hux8