今日AI热点新闻
1.OpenAI向所有付费用户推出语音助手服务
2.Google发布新模型,OpenAI紧随其后:高级语音模式正式上线
3.字节跳动推出豆包视频生成大模型
4.OpenAI首席执行官阿尔特曼预测“智能时代”即将到来 AI将独立取得科学成就
5.OpenAI官方账号被黑客入侵 变身加密货币诈骗工具
6.苹果AI存储空间要求:128GB版本iPhone恐无法满足
7.微软将在墨西哥投资13亿美元发展云计算和人工智能
8.OpenAI发布MMMLU数据集:更广泛深入地评估AI模型,支持简体中文
OpenAI向所有付费用户推出语音助手服务
美东时间9月24日,OpenAI宣布,所有订阅ChatGPT Plus和Team计划的付费用户将可以使用新的高级语音模式(Advanced Voice)。该功能将在未来几天内逐步上线,支持包括中文在内的50多种语言,并将首先在美国市场推出。预计下周,OpenAI Edu和Enterprise计划的订阅者也将获得此功能。
据介绍,新的ChatGPT语音助手具备两项主要功能:一是允许用户存储“自定义指令”,二是具备“记忆”功能,以便根据用户的偏好调整语音助手的表现。此外,OpenAI还新增了五种语音选项,并撤回了被指责为“山寨”某些声音的选项。同时,OpenAI提升了部分外语的对话速度、流畅度和口音。
需要注意的是,新的语音功能适用于OpenAI的AI模型GPT-4o,而不适用于最近发布的预览模型o1。
Google发布新模型,OpenAI紧随其后:高级语音模式正式上线
9月25日,Google正式推出了两款新模型——Gemini-1.5-Pro-002和Gemini-1.5-Flash-002。这些模型是Google系列中的中型版本,Gemini Pro面向付费用户,而Gemini Flash则是基于Gemini Pro的简化版本,自今年5月Google I/O首次亮相以来,用户可以在Gemini中免费使用,开发者也享有一定的免费API使用配额。
此次模型升级的亮点包括,1.5 Pro的价格降低超过50%,而1.5 Flash的速率限制提升了2倍,1.5 Pro的速率限制则增加约3倍,输出速度提高2倍,延迟降低3倍,同时过滤器切换采用选择加入的方式。
然而,Google的发布时机似乎被OpenAI的提前行动所影响。OpenAI同日宣布,其高级语音模式将于今日起向Plus和Team用户推出。在5月Google发布Gemini模型大更新前,OpenAI曾抢先召开发布会,宣布即将推出高级语音模式,令媒体高度关注。
字节跳动推出豆包视频生成大模型
9月24日,字节跳动旗下火山引擎在深圳举办AI创新巡展,推出了豆包视频生成-PixelDance和豆包视频生成-Seaweed两款大模型,面向企业市场进行邀请测试。这标志着字节跳动正式进入AI视频生成领域。
据火山引擎介绍,豆包视频生成模型基于DiT架构,采用高效的DiT融合计算单元,能够在大动态和运镜中实现自由切换,具备变焦、环绕、平摇、缩放和目标跟随等多种镜头语言能力。经过深度优化的Transformer结构显著提升了模型的泛化能力,支持多种风格的生成,包括3D动画、2D动画、国画、黑白画和厚涂,适配于电影、电视、电脑和手机等多种设备。目前,新款豆包视频生成模型正在进行内测,未来将逐步向所有用户开放。
OpenAI首席执行官阿尔特曼预测“智能时代”即将到来 AI将独立取得科学成就
OpenAI首席执行官萨姆·阿尔特曼(Sam Altman)近日在博文中指出,AI模型即将成为具有自主性的个人助理,能够代表我们执行特定任务,例如协调医疗保健事务。展望未来,阿尔特曼认为AI系统将变得如此强大,以至于它们将帮助人类创造更先进的系统,并在各个领域取得显著的科学成就。
阿尔特曼认为,科技的发展经历了从石器时代到农业时代,再到工业时代的变迁,而现在我们正踏上通往“智能时代”的道路,这条路由计算能力、能源和人类的意志共同铺就。他预测,“超级智能”(superintelligence)将在未来“几千天内”出现。
OpenAI官方账号被黑客入侵 变身加密货币诈骗工具
OpenAI在社交平台X上的一个官方账号遭黑客入侵,成为加密货币诈骗活动的宣传工具。美国东部时间周一晚上6:24,拥有近54,000名关注者的OpenAI新闻资讯账号(@OpenAINewsroom)发布了一条已删除的推文,推广一种名为“$OPENAI”的加密代币。
该推文声称:“我们很高兴宣布推出$OPENAI,该代币将桥接人工智能与区块链技术。所有OpenAI用户均可认领初始供应的一部分$OPENAI代币。持有$OPENAI将使您能够访问我们所有未来的测试计划。”推文中还附有指向虚假OpenAI网站的链接,该网站并非openai.com。
访问该网站后,用户发现可以认领$OPENAI加密货币。点击相关按钮后,网站要求用户连接钱包。截至发稿时,OpenAI和社交平台X尚未对此事件作出回应,OpenAI新闻资讯账号也未发布任何解释该事件经过的推文。该账号于本月初上线。
苹果AI存储空间要求:128GB版本iPhone恐无法满足
据悉,Apple Intelligence将在iOS 18.1发布时同步上线。苹果官方文档指出,该功能仅限于iPhone 15 Pro、iPhone 15 Pro Max、iPhone 16全系列以及搭载M1芯片及更新版本的iPad和Mac设备。最新资料显示,支持Apple Intelligence的设备需至少预留4GB存储空间,这意味着128GB存储的iPhone可能无法满足这一要求。
需要注意的是,4GB只是苹果部分AI功能的基本存储需求。随着Apple智能功能的持续优化和升级,未来将推出更多功能,对存储空间的需求也将增加。因此,消费者在购买iPhone时,如果希望体验Apple智能功能,建议至少选择256GB存储版本。
微软将在墨西哥投资13亿美元发展云计算和人工智能
微软计划在未来三年内向墨西哥投资13亿美元,用于建设云计算和人工智能基础设施,提升网络连接性并帮助中小企业采用人工智能技术。目标是在三年内服务500万墨西哥民众和3万家当地中小企业。
OpenAI发布MMMLU数据集:更广泛深入地评估AI模型,支持简体中文
OpenAI在Hugging Face平台上发布了多语言大规模多任务语言理解(MMMLU)数据集,旨在评估大型语言模型(LLMs)在各种任务中的性能,包括常识推理、解决问题和理解能力等。MMMLU数据集涵盖范围广泛,深度考察认知能力,支持简体中文等多种语言,能够进行跨语言的综合评估,弥补了自然语言处理研究中代表性不足的语言模型评估问题。