字节豆包团队提出 UltraMem 架构,推理成本最高可降低 83% | 今日AI热点新闻

广告也精彩
字节豆包团队提出 UltraMem 架构,推理成本最高可降低 83% | 今日AI热点新闻

OpenAI 宣布即将发布 GPT-5,整合多项技术并取消独立推出 o3 模型

今日AI热点新闻:

1.OpenAI 宣布即将发布整合多项技术的 GPT-5,并取消推出的 o3 模型
2.字节豆包团队提出 UltraMem 架构,推理成本最高可降低 83%
3.OpenAI 最新研究:o3 在 IOI 2024 竞技编程挑战中斩获金牌
4.腾讯云支持 DeepSeek 接入微信小程序,实现智能对话与文本生成
5.消息称 OpenAI 自研芯片团队规模达 40 人,由谷歌前工程师领导
6.OpenAI 承诺 AI 模型不审查观点,保障思想自由
7.云南白药集团上线 DeepSeek 大模型,加速中医药数字化升级
8.传 Meta 计划收购韩国 FuriosaAI 或推进自研 AI 芯片
9.百度计划发布下一代 AI 模型 Ernie 5.0,强化多模态能力
10.雷军盛赞 DeepSeek:AI 时代已至,每个人都应学习 AI 知识

 

OpenAI 宣布即将发布 GPT-5,整合多项技术并取消独立推出 o3 模型

当地时间 2 月 12 日,OpenAI 首席执行官 Sam Altman 宣布,公司计划在未来几个月内推出全新一代 AI 模型——GPT-5。该模型将整合 OpenAI 现有的多项技术,包括 o3,并应用于 ChatGPT 及 API 平台。基于这一调整,OpenAI 不再计划将 o3 作为独立模型发布。

此外,在 GPT-5 正式推出前,OpenAI 计划于未来几周内率先发布过渡版本 GPT-4.5,内部代号“Orion”。这一版本预计将在性能和效率方面实现显著优化,为 GPT-5 的发布奠定基础。

 

字节豆包团队提出 UltraMem 架构,推理成本最高可降低 83%

2 月 12 日,据字节跳动豆包大模型 Foundation 团队消息,团队近期推出了一种名为 UltraMem 的稀疏模型架构,该架构通过计算与参数解耦,有效优化推理过程中的访存问题,在保持模型效果的同时显著提升推理效率。

据介绍,相较于传统的 MoE(专家混合)架构,UltraMem 在推理速度方面提升 2 至 6 倍,推理成本最高可降低 83%。这一突破性优化有望推动大模型推理技术的进一步发展,为 AI 应用落地提供更高效的算力支撑。(科创板日报)

 

OpenAI 最新研究:o3 在 IOI 2024 竞技编程挑战中斩获金牌

2 月 12 日,OpenAI 发布最新研究论文 《Competitive Programming with Large Reasoning Models》(《大型推理模型在竞技编程中的应用》),详细披露了其推理模型 o1、o1-ioi 和 o3 在国际信息学奥林匹克竞赛(IOI 2024)及全球知名在线编程竞赛 CodeForces 中的表现。

论文显示,在 IOI 2024 竞赛的严格规则下,o3 模型取得 395.64 分,成功达成金牌成就。此外,在 CodeForces 平台上,o3 的表现与人类顶尖选手相当,进一步展现了 OpenAI 在 AI 竞技编程领域的突破性进展。

研究还提及,中国的 DeepSeek-R1 和 Kimi k1.5 通过独立实验验证,采用 思维链学习(CoT, Chain-of-Thought) 方法后,可显著提升 AI 在数学解题与编程挑战中的综合能力。(来源:IT之家)

 

腾讯云支持 DeepSeek 接入微信小程序,实现智能对话与文本生成

2 月 12 日,腾讯云官宣开发者可通过最新 小程序基础库,仅需 3 行代码,即可快速接入 DeepSeek 大模型,实现智能对话、文本生成等 AI 功能。新用户可享受 首月免费套餐,包含 100 万 token。

据悉,腾讯云 AI 能力不仅适用于微信小程序,还支持 订阅号、服务号、小程序客服 等多种微信生态应用,并计划在近期扩展至 企业微信。未来,腾讯云还将推出 工具调用、多 Agent 串联、工作流编排 等 AI 能力,进一步助力开发者构建智能应用。

此前,腾讯云已上线 DeepSeek-R1 及 V3 原版模型 API,并将其集成至大模型知识引擎,支持 联网搜索(接入搜狗搜索增强 API),成为国内首批提供此类能力的云计算厂商。(来源:IT之家)

 

消息称 OpenAI 自研芯片团队规模达 40 人,由谷歌前工程师领导

2 月 12 日,外媒报道称,OpenAI 正在加速推进自研芯片计划,其首款 AI 加速芯片预计将在未来几个月内完成设计。该芯片设计团队目前规模约 40 人,由 谷歌前工程师 Richard Ho 领导,并计划与博通(Broadcom)展开合作。

据此前报道,OpenAI 的首款芯片在完成设计后,将由台积电(TSMC)负责流片,并采用 3nm 制程工艺。如果一切顺利,台积电有望 在 2026 年量产 这款专用 AI 芯片,为 OpenAI 提供更强的算力支持,以降低对现有 GPU 供应链的依赖。(来源:TechWeb)

 

OpenAI 承诺 AI 模型不审查观点,保障思想自由

2 月 13 日,OpenAI 在其最新更新的 模型规范(Model Spec) 中明确表示,其 AI 模型 不会回避敏感话题,也不会屏蔽特定观点,以确保思想自由和开放讨论的空间。

在规范中,OpenAI 强调:「我们的模型绝不能试图以直接或间接的方式引导用户追求其自身的议程。」此外,公司进一步阐述:「OpenAI 坚信思想自由,包括拥有、听取和讨论各种观点的权利。模型不应以任何方式规避或审查某些话题,以防在大规模应用后,无意中将某些观点排除在公共讨论之外。」

这一声明反映了 OpenAI 在 AI 价值观上的调整,旨在降低外界对于 AI 可能存在的偏见和审查机制的担忧。(来源:IT之家)

 

云南白药集团上线 DeepSeek 大模型,加速中医药数字化升级

2 月 9 日,云南白药集团宣布正式上线国产开源大模型 DeepSeek,结合企业实际业务需求,推动中医药产业的数字化转型。

据云南白药官方消息,公司将依托 企业级数字员工“白小柒”、“重小楼”及协同平台“白药钉”,全面提升智能化办公与协同效率。此次大模型的引入,旨在优化业务流程、提升智能客服水平,并助力中医药产业的数字化升级,为传统中医药行业注入 AI 创新动力。(来源:云南白药官微)

 

传 Meta 计划收购韩国 FuriosaAI 或推进自研 AI 芯片

2 月 12 日,知情人士透露,Meta 正在与韩国 AI 芯片初创公司 FuriosaAI 进行收购谈判,交易最早可能在本月达成。报道称,Meta 是众多有意收购 FuriosaAI 的企业之一。若收购成功,Meta 或将进一步推进 自研 AI 芯片 计划,以降低对英伟达的依赖,应对全球芯片供应紧张的挑战。

FuriosaAI 成立于 2017 年,由 前三星电子和 AMD 员工 June Paik 创立,专注于高性能 AI 芯片研发。近期,该公司刚刚从韩国风投机构 CRIT Ventures 融资 20 亿韩元(约 140 万美元),迄今累计融资 约 1.15 亿美元。韩国互联网巨头 Naver 及风投公司 DSC Investment 均为其早期投资方。最新文件显示,June Paik 个人持有该公司 18.4% 股份

若 Meta 成功收购 FuriosaAI,将进一步增强其在 AI 基础设施方面的自主权,并在 AI 计算领域与英伟达等芯片巨头展开更直接的竞争。(来源:智通财经)

 

百度计划发布下一代 AI 模型 Ernie 5.0,强化多模态能力

2 月 12 日,据媒体报道,百度计划在 2025 年内推出下一代人工智能模型 Ernie 5.0。消息人士透露,该模型被称为“基础模型”,将在 多模态能力 方面实现重大突破,但目前尚未公布具体技术细节。

此次消息发布,正值 苹果将部分 AI 业务客户转向阿里巴巴,引发市场对百度 AI 竞争力的关注。业内普遍认为,百度此举旨在 稳固市场地位,提振投资者信心,同时进一步推动 AI 技术升级,以在激烈竞争中保持领先优势。(来源:AIBase)

 

雷军盛赞 DeepSeek:AI 时代已至,每个人都应学习 AI 知识

在 2 月 12 日的 元宵节直播 中,小米创始人、董事长兼 CEO 雷军 公开谈及国产 AI 大模型 DeepSeek,对其成就表示高度认可。他称 DeepSeek 团队“非常了不起”,并对他们在 AI 领域取得的成果表示钦佩。

雷军回忆道,早在两年前,他就曾建议年轻人学习 AI 相关知识。他表示:“已经进入 AI 时代,每个人可能都要学习 AI 知识,学会使用 AI 工具,这将极大提升工作效率,也会给生活带来诸多便利。

这一观点凸显了 AI 技术在未来社会的重要性,同时也反映出 AI 在智能设备、办公自动化等领域的广泛应用趋势。(来源:AIBase)

 

广告也精彩
广告也精彩

暂无评论

暂无评论...