今日AI热点新闻:
1.OpenAI计划于2025年推出自主AI智能体“Operator”,可独立控制计算机
2.字节跳动视频生成模型PixelDance即将上线 即梦AI先行推出
3.苹果发布 Final Cut Pro 11:引入AI智能工具,支持空间视频编辑
4.谷歌Gemini正式登陆iOS,挑战OpenAI ChatGPT
5.传神语联网推出任度大模型:双网络架构实现数推分离
OpenAI计划于2025年推出自主AI智能体“Operator”,可独立控制计算机
据科技媒体《The Verge》报道,OpenAI公司计划于2025年1月推出一款名为“Operator”的智能体。这款AI将作为研究预览和开发工具面向公众发布,具备独立操作计算机并执行各种任务的能力。
“Operator”并非OpenAI在这一领域的唯一进展,竞争对手Anthropic近日也推出了名为“computer use”的功能,而谷歌也在准备于12月发布类似的AI工具。
OpenAI首席产品官凯文·韦尔表示,2025年可能会成为自主AI系统进入主流市场的关键时刻。
字节跳动视频生成模型PixelDance即将上线 即梦AI先行推出
根据11月14日的最新消息,字节跳动的全新视频生成模型PixelDance将很快在即梦AI平台上线,并对公众开放使用。据知情人士透露,这一上线时间将早于字节跳动的Sora平台正式发布。
在大模型领域,字节跳动的动作频频。9月24日,公司发布了两款视频生成模型——PixelDance与Seaweed,并通过即梦AI和火山引擎面向创作者及企业客户进行了小范围邀请测试。据了解,PixelDance除了将在即梦AI平台推出,还计划在豆包平台开展内测。
苹果发布 Final Cut Pro 11:引入AI智能工具,支持空间视频编辑
11月14日,苹果公司正式推出了针对Mac和iPad的Final Cut Pro软件重大更新。自2011年发布第10版以来,Final Cut Pro终于迎来了第11版,带来了一系列“智能”功能改进,充分利用了苹果M系列芯片的强大性能。
在新版本中,苹果推出了“Magnetic Mask”工具,这是一款AI驱动的功能,能让视频编辑者轻松隔离视频中的人物和物体,无需使用绿屏或进行繁琐的手动转描。另一项新增的AI功能“转录为字幕”则利用大型语言模型自动分析视频中的语音,并在时间线上生成隐藏字幕,极大提高了字幕编辑的效率。
此外,Final Cut Pro 11还支持编辑空间视频,用户可以从iPhone 15 Pro、iPhone 16或佳能R7相机导入素材,进行色彩校正、效果添加,以及使用标题等功能提升视频内容的质量和表现力。
谷歌Gemini正式登陆iOS,挑战OpenAI ChatGPT
11月14日消息,谷歌本周在苹果App Store上正式推出了其Gemini人工智能聊天机器人的iOS版本。这一举措标志着谷歌Gemini与OpenAI的ChatGPT之间的竞争正式从PC端转移到了智能手机平台,为C端用户带来了更多选择。
传神语联网推出任度大模型:双网络架构实现数推分离
11月14日,传神语联网发布了其大模型的最新探索成果和实践经验。公司董事长何恩培表示,随着技术的进步,大模型正逐步从“Scaling Law”时代进入“实时学习”时代。
此次发布的任度大模型采用了双网络架构,成功实现了数推分离。具体来说,模型将推理网络与数据学习网络进行了有效分离。数据学习网络专注于客户数据的动态管理与迭代训练,为模型持续注入知识和新鲜养分;而推理网络则依托海量数据的预训练基础,具备强大的推理和泛化能力。
这一创新架构的提出,标志着大模型技术向更加高效、灵活的方向发展,也为实时学习和模型迭代开辟了新的可能性。