YouTube推出AI「一站式服务」,助力创作者生成创意、标题和完整视频 | 今日AI热点新闻

广告也精彩
YouTube推出AI「一站式服务」,助力创作者生成创意、标题和完整视频  | 今日AI热点新闻

字节跳动将于9月24日发布豆包视频生成模型

今日AI热点新闻

1.字节跳动将于9月24日发布豆包视频生成模型
2.谷歌论文揭示o1模型原理,AI大模型竞争或转向硬件
3.YouTube推出AI「一站式服务」,助力创作者生成创意、标题和完整视频
4.微软与贝莱德等成立300亿美元AI基础设施投资基金,英伟达提供技术支持
4.马斯克讽刺加州AI法案:“加州需要新的领导”
5.OpenAI重金押注,NEO世界模型正式登场
6.谷歌将采用C2PA认证技术以判定图片是否由AI生成
7.OpenAI或在9月24日推出ChatGPT高级语音模式

 

字节跳动将于9月24日发布豆包视频生成模型,AI领域竞争转向硬件

字节跳动宣布,其豆包大模型将在9月24日正式发布视频生成模型,同时带来更多模型家族的能力升级。此次发布将在深圳举行的2024火山引擎AI创新巡展中进行,时间定于9月24日14:30。届时,字节跳动将详细介绍火山引擎的整体布局及豆包大模型的最新进展,并分享火山引擎AI产品的最新成果,以及多个行业的AI应用落地实践。

目前,国内包括快手、智谱等公司已推出了各自的视频生成模型,阿里巴巴的通义大模型也计划在2024年云栖大会期间(9月19日至9月21日)正式发布其视频生成大模型,显示出国内AI领域的激烈竞争。

 

谷歌论文揭示o1模型原理,AI大模型竞争或转向硬件

另一方面,谷歌DeepMind团队于2024年8月6日发布了一篇名为《优化LLM测试时计算比扩大模型参数规模更高效》的论文,探讨了在解决复杂问题时,通过增加测试时的计算量来提升大模型(LLM)决策质量的可行性。研究发现,相较于单纯增加模型参数,增加测试时计算(test-time compute)显得更加有效。这一结论与OpenAI近期发布的o1模型原理不谋而合。o1模型通过生成一系列中间推理步骤,逐步优化自身的思维过程,能够在不同策略间切换并识别错误,从而提升整体性能。

此外,谷歌与斯坦福大学的研究人员在2024年1月发表的论文《思维链赋能Transformer解决本质上的串行问题》中提出了类似观点,重点探讨了“思维链”(Chain of Thought, CoT)技术,旨在解决Transformer模型在串行推理方面的局限。

这些研究表明,AI大模型的竞争正逐渐从单纯的模型参数规模扩展,转向更高效的测试时计算和硬件能力的提升。随着技术的不断进步,AI竞争已经不仅仅依赖于模型的复杂性,硬件能力逐渐成为关键因素。例如,OpenAI近期曝光的芯片计划表明,其首款芯片将采用台积电的A16级工艺,专为Sora视频应用设计。这一动向表明,AI大模型的竞争已开始向硬件领域扩展,算力强大的公司可能在未来的竞争中占据优势。

 

YouTube推出AI「一站式服务」,助力创作者生成创意、标题和完整视频

在本周三举行的「Made on YouTube」特别活动上,谷歌宣布了一系列即将引入YouTube的AI功能,旨在革新视频制作方式。新推出的工具将大大简化创作者的工作流程,使他们能够更高效地生成内容。YouTube将新增一个名为「灵感」(Inspiration)的选项卡,借助AI技术帮助创作者构思视频创意,推荐视频标题、缩略图,甚至自动编写视频大纲。

此外,YouTube还推出了一个名为Veo的工具,集成了谷歌DeepMind的视频生成模型,能够自动生成视频背景,并支持生成最长6秒的完整视频片段。预计这些功能将在今年晚些时候或2025年初向全球创作者推出。

除了视频制作工具,YouTube还计划推出AI自动配音功能,使视频能够自动转换成多种语言,帮助创作者接触更广泛的观众群体。同时,YouTube还将在App中新增社区互动AI工具,以提升创作者与粉丝的互动体验。YouTube CEO Neal Mohan表示,平台将继续致力于推动创作者社区的繁荣,确保创造力在YouTube上蓬勃发展,同时助力创作者经济的成长。

 

微软与贝莱德等成立300亿美元AI基础设施投资基金,英伟达提供技术支持

9月18日消息,微软宣布与贝莱德(BlackRock)、全球基础设施合作伙伴(GIP)及阿联酋AI投资公司MGX携手成立了「全球AI基础设施投资伙伴关系」(GAIIP),这只基金计划投资于AI基础设施的建设,涵盖数据中心和能源项目,旨在满足全球日益增长的算力需求。

英伟达也加入了该伙伴关系,为AI数据中心和AI工厂提供专业技术支持,以推动整个AI生态系统的发展。微软表示,GAIIP的重点投资领域主要集中在美国,但也会扩展至美国的合作伙伴国家,助力全球AI创新与经济增长。

据悉,该基金最初计划逐步释放300亿美元的私募股权资本,资金将来自投资者、资产所有者及企业,外加债务融资,最终有望带动总计1000亿美元(约合7094亿人民币)的投资潜力。这笔资金不仅将用于AI基础设施建设,还将为这些设施提供可持续能源来源,推动AI技术的进一步发展和广泛应用。

 

马斯克讽刺加州AI法案:“加州需要新的领导”

9月18日消息,加州州长加文·纽森日前签署了两项新法案,旨在帮助演员和表演者保护他们的数字复制品免受人工智能(AI)的侵害。这些法案主要针对音像作品中的数字肖像和表演,防止未经授权的AI技术生成或复制演员的形象。对此,埃隆·马斯克在社交媒体平台“X”上发布了几段网友讽刺该法案的视频,并直言“不敢相信”,并表示“加州需要新的领导”。马斯克此番评论引发了广泛讨论,许多人认为这是他对加州立法的强烈不满和对其领导层的不信任。

 

OpenAI重金押注,NEO世界模型正式登场

OpenAI大力投资的人形机器人初创公司1X,近日揭开了其备受期待的「世界模型」的神秘面纱。这一模型能够基于真实世界数据,生成不同场景中的行为预测,为机器人NEO带来了全新的能力。通过「世界模型」,NEO可以精确预测与物体的互动方式,比如叠衣服、拉开窗帘等家庭日常行为。此前,这类具有高度可变性的物体难以被纳入虚拟世界的模拟中。然而,借助1X的技术,机器人不仅能够理解环境,还能在神经网络中重塑、模拟和优化与世界的互动过程。这一突破性进展将有助于推动高保真视频生成和机器人行为规划,为未来的AI技术发展提供新的可能。

 

谷歌将采用C2PA认证技术以判定图片是否由AI生成

据第一财经报道,谷歌即将更新搜索结果中的“关于这张图片”功能,使用户能够了解图片是否由人工智能(AI)工具创建或编辑。为此,谷歌将引入C2PA认证技术,该技术包含图片的来源信息,并在硬件和软件之间创建一个数字化的追踪路径。C2PA(内容真实性和出处联盟)由亚马逊、微软、Adobe、Arm、OpenAI、英特尔以及谷歌等公司共同支持。然而,尽管C2PA得到了广泛的行业支持,其实际采用速度仍较缓慢。

目前,徕卡和索尼相机已经率先支持这一开放技术标准,能够为照片添加详细的元数据,包括相机设置、拍摄时间、地点等信息。尼康和佳能等相机制造商也已承诺采用C2PA标准。不过,苹果和谷歌是否会在未来为iPhone和Android设备提供该技术支持,尚在等待进一步确认。谷歌将C2PA整合到搜索结果中的举措,标志着这一计划的首次重大测试,也有望推动这一标准在全球范围内的更广泛应用。

 

OpenAI或在9月24日推出ChatGPT高级语音模式

据科技媒体Testingcatalog报道,OpenAI可能会在9月24日正式推出ChatGPT的高级语音模式。该媒体指出,OpenAI最近更新了高级语音模式的FAQ页面,并在代码中发现了“hasSeenAdvancedVoice/2024-09-24”的字符串,暗示部分移动用户或将受邀提前体验这一功能。

这一功能的发布将进一步扩展ChatGPT的应用范围,增强其在语音交互方面的能力,预计将提升用户体验,特别是在移动端上的使用感受。

 

广告也精彩
广告也精彩

暂无评论

暂无评论...