DeepSeek发布三大开源项目,梁文锋参与并行计算优化技术开发 | 今日AI热点新闻

广告也精彩
DeepSeek发布三大开源项目,梁文锋参与并行计算优化技术开发 | 今日AI热点新闻

DeepSeek发布三大开源项目,梁文锋参与并行计算优化技术开发

今日AI热点新闻:

1.DeepSeek发布三大开源项目,梁文锋参与并行计算优化技术开发
2.腾讯推出全新快思考模型混元 Turbo S,秒回表现超越同行
3.OpenAI发布GPT-4.5研究预览版,面向ChatGPT Pro用户开放
4.Kimi发布新型模型k1.6,编程能力超越GPT o3-mini
5.字节跳动发布国内首个AI IDE,Trae AI IDE下周回归
6.百度文心大模型4.5系列预计3月中旬发布
7.亚马逊重构Alexa语音助手,支持Anthropic的Claude模型
8.摩尔线程成功支持DeepSeek开源通信库DeepEP及并行算法DualPipe
9.Meta计划推出独立AI应用,竞争OpenAI与Alphabet
10.宁德时代与百度签署战略合作协议,联合推动无人驾驶与AI应用
11.OpenAI CEO Sam Altman透露公司GPU资源已耗尽,GPT-4.5上线进展延迟

 

DeepSeek发布三大开源项目,梁文锋参与并行计算优化技术开发

2025年2月27日,DeepSeek宣布开源三项重要工具和资源,包括DualPipe工具、EPLB(专家并行负载均衡器)以及一套用于训练和推理框架的性能分析数据。这一系列新发布的项目将在其GitHub页面上提供详细介绍,特别是DeepSeek-V3和R1模型背后的并行计算优化技术。值得注意的是,DeepSeek创始人梁文锋也参与了DualPipe项目的开发,并在其介绍中被列为核心开发人员。

腾讯推出全新快思考模型混元 Turbo S,秒回表现超越同行

2025年2月27日,腾讯在其官方社交平台宣布,旗下新一代快思考模型——混元 Turbo S正式发布。与DeepSeek的R1以及腾讯自家之前推出的混元T1等需要较长思考时间的“慢思考”模型不同,混元 Turbo S的优势在于其“秒回”能力,即能够迅速给出回答,吐字速度提高一倍,首字时延减少44%。此外,混元 Turbo S在知识、数学推理、创作等多个领域表现突出,在多个公开基准测试中,展现了与业界领先模型如DeepSeek V3、GPT-4、Claude等相媲美的强大能力。腾讯计划逐步在其元宝平台上进行灰度上线,用户可通过选择“Hunyuan”模型并关闭深度思考选项来体验这一全新技术。

OpenAI发布GPT-4.5研究预览版,面向ChatGPT Pro用户开放

2025年2月27日,OpenAI在最新的System Card报告中发布了GPT-4.5的研究预览版,这是该公司迄今为止推出的最大、最具知识深度的语言模型。该模型目前已对每月订阅200美元的ChatGPT Pro用户开放,预计下周将面向ChatGPT Plus(每月20美元订阅)用户推出。OpenAI首席执行官Sam Altman表示,届时公司将扩展数万块GPU的运算能力,以支持该模型的计算需求。然而,尽管GPT-4.5在多个领域具备强大的能力,但在多个AI基准测试中,其表现仍略逊于DeepSeek、Anthropic以及OpenAI自家新一代推理模型。

Kimi发布新型模型k1.6,编程能力超越GPT o3-mini

2025年2月27日,Kimi公司正式曝光了其最新的模型——k1.6。根据全球知名动态基准测试平台LiveCodeBench的数据显示,k1.6的编程能力已经超越了GPT o3-mini和GPT o1等主流模型。Kimi k1.6基于其先前版本k1.5进行了进一步训练,性能仍在不断提升。月之暗面研究员Flood在社交平台上表示,k1.6虽然尚未正式发布,但基于其初步表现,团队对其未来的潜力感到乐观。月之暗面联合创始人张予彤也在朋友圈中分享了对LiveCodeBench成绩的喜悦,并对智能模型的持续进化表达了期待。

字节跳动发布国内首个AI IDE,Trae AI IDE下周回归

2025年2月27日,字节跳动宣布,其首款面向开发者的AI编程产品——Trae AI IDE,将于下周正式登陆中国内地市场。Trae最初于今年1月发布,并由字节跳动旗下新加坡公司SPRING PTE提供服务。该IDE具备多项功能,包括AI问答、代码自动补全、以及基于Agent的AI编程等,能够帮助开发者实现自动化编码任务,部分项目可实现端到端的开发流程。用户在提问后,系统将自动生成完整的代码项目。官方表示,Trae特别优化了中文开发场景,支持智能AI协作,旨在提升编程效率并减少重复性任务。无论是初学者还是经验丰富的开发者,都可以通过Trae的智能辅助功能提升编码速度和质量。此外,Trae的聊天构建模式对需要快速构建项目的团队提供了显著帮助。

百度文心大模型4.5系列预计3月中旬发布

据知情人士透露,百度计划于2025年3月中旬推出其下一代文心大模型4.5系列。该系列模型将在推理能力上进行提升,并加强多模态功能。此次升级预计将为百度在AI领域带来更强的综合性能,推动其在智能应用和技术创新方面的进一步发展。

亚马逊重构Alexa语音助手,支持Anthropic的Claude模型

2025年2月26日,亚马逊宣布将对其语音助手Alexa进行全面重构,并推出名为Alexa+的新版本。与现有Alexa不同,Alexa+将采用人工智能初创公司Anthropic的Claude生成式AI模型,以提升其智能响应能力。Alexa+服务定价为19.99美元/月,但亚马逊Prime会员将可以免费体验此项服务。此次更新标志着亚马逊在智能助手领域的技术创新,旨在为用户提供更加智能化、个性化的语音交互体验。

 

 

摩尔线程成功支持DeepSeek开源通信库DeepEP及并行算法DualPipe

2025年2月27日,摩尔线程宣布已成功适配并支持DeepSeek开源通信库DeepEP和并行算法DualPipe,并发布了相关开源代码仓库:MT-DeepEP与MT-DualPipe。DeepEP是一个用于MoE(混合专家)模型训练与推理的专家并行(Expert Parallelism, EP)通信库,主要用于大规模模型训练,尤其是需要EP的集群训练。通过优化通信信道的使用,DeepEP显著提升了训练效率。摩尔线程基于MUSA Compute Capability 3.1全功能GPU进行了DeepEP的适配。

Meta计划推出独立AI应用,竞争OpenAI与Alphabet

2025年2月27日,Meta宣布计划在2025年第二季度推出Meta AI独立应用,旨在与OpenAI和Alphabet等竞争对手一较高下,进一步推动AI技术在日常生活中的普及。Meta AI是一款生成式人工智能数字助理,能够根据用户提示提供响应并生成图像。今年4月,Meta AI替代了Facebook、Instagram、WhatsApp和Messenger的搜索功能,成为一款功能强大的AI助手。Meta预计,作为独立应用的Meta AI将为用户提供更为深入和互动的数字助理体验,目前该应用仅通过Meta公司的官方网站和应用程序向用户开放。

对于Meta的这一新动作,OpenAI创始人Sam Altman在社交平台上做出回应,他表示:“如果Meta决定挑战我们,而我们能以一种出其不意的方式反击,那将会非常有趣。也许我们也会推出一款社交应用。”

宁德时代与百度签署战略合作协议,联合推动无人驾驶与AI应用

2025年2月27日,宁德时代宣布与北京百度网讯科技有限公司签署战略合作协议,双方将在无人驾驶与数智化领域展开深度合作。根据协议,双方将共同推动无人驾驶出行服务的普及,并致力于AI技术在工业领域的应用与推广。合作内容将包括但不限于宁德时代的动力电池、换电产品、滑板底盘技术等在无人驾驶汽车产品中的开发与应用。此外,双方还将探索在各自公司及其关联方的优势资源共享与合作机会。

OpenAI CEO Sam Altman透露公司GPU资源已耗尽,GPT-4.5上线进展延迟

2025年2月27日,OpenAI发布了其最新的通用大型语言模型GPT-4.5,并宣布将首先面向软件开发者和ChatGPT Pro订阅用户开放。OpenAI在博客中表示,GPT-4.5相较于前代产品具有更强的知识基础、提升的情感智能和更高的用户意图遵循能力,能显著改善写作、编程和解决实际问题的效果。早期测试表明,用户与GPT-4.5的互动体验更加自然,模型在多种任务中的表现优于以往版本。

然而,OpenAI首席执行官Sam Altman在社交平台X上透露,由于GPU资源已被完全消耗,GPT-4.5将无法同时向ChatGPT Plus和Pro版本的用户开放。Altman表示,GPT-4.5是一个“巨型且昂贵”的模型,未来向其他ChatGPT用户提供访问权限前,仍需要数以万计的GPU支持。此外,由于其庞大的规模,GPT-4.5的使用成本较高:每百万个输入词元(约75万个字)收费75美元,每百万个输出词元收费150美元,成本为GPT-4的30倍和15倍。

 

广告也精彩
广告也精彩

暂无评论

暂无评论...