YouTube推出AI「一站式服务」，助力创作者生成创意、标题和完整视频 | 今日AI热点新闻

热门AI资讯 2个月前 admin

11 0 0

字节跳动将于9月24日发布豆包视频生成模型

今日AI热点新闻

1.字节跳动将于9月24日发布豆包视频生成模型
2.谷歌论文揭示o1模型原理，AI大模型竞争或转向硬件
3.YouTube推出AI「一站式服务」，助力创作者生成创意、标题和完整视频
4.微软与贝莱德等成立300亿美元AI基础设施投资基金，英伟达提供技术支持
4.马斯克讽刺加州AI法案：“加州需要新的领导”
5.OpenAI重金押注，NEO世界模型正式登场
6.谷歌将采用C2PA认证技术以判定图片是否由AI生成
7.OpenAI或在9月24日推出ChatGPT高级语音模式

字节跳动将于9月24日发布豆包视频生成模型，AI领域竞争转向硬件

字节跳动宣布，其豆包大模型将在9月24日正式发布视频生成模型，同时带来更多模型家族的能力升级。此次发布将在深圳举行的2024火山引擎AI创新巡展中进行，时间定于9月24日14:30。届时，字节跳动将详细介绍火山引擎的整体布局及豆包大模型的最新进展，并分享火山引擎AI产品的最新成果，以及多个行业的AI应用落地实践。

目前，国内包括快手、智谱等公司已推出了各自的视频生成模型，阿里巴巴的通义大模型也计划在2024年云栖大会期间（9月19日至9月21日）正式发布其视频生成大模型，显示出国内AI领域的激烈竞争。

谷歌论文揭示o1模型原理，AI大模型竞争或转向硬件

另一方面，谷歌DeepMind团队于2024年8月6日发布了一篇名为《优化LLM测试时计算比扩大模型参数规模更高效》的论文，探讨了在解决复杂问题时，通过增加测试时的计算量来提升大模型（LLM）决策质量的可行性。研究发现，相较于单纯增加模型参数，增加测试时计算（test-time compute）显得更加有效。这一结论与OpenAI近期发布的o1模型原理不谋而合。o1模型通过生成一系列中间推理步骤，逐步优化自身的思维过程，能够在不同策略间切换并识别错误，从而提升整体性能。

此外，谷歌与斯坦福大学的研究人员在2024年1月发表的论文《思维链赋能Transformer解决本质上的串行问题》中提出了类似观点，重点探讨了“思维链”（Chain of Thought, CoT）技术，旨在解决Transformer模型在串行推理方面的局限。

这些研究表明，AI大模型的竞争正逐渐从单纯的模型参数规模扩展，转向更高效的测试时计算和硬件能力的提升。随着技术的不断进步，AI竞争已经不仅仅依赖于模型的复杂性，硬件能力逐渐成为关键因素。例如，OpenAI近期曝光的芯片计划表明，其首款芯片将采用台积电的A16级工艺，专为Sora视频应用设计。这一动向表明，AI大模型的竞争已开始向硬件领域扩展，算力强大的公司可能在未来的竞争中占据优势。

YouTube推出AI「一站式服务」，助力创作者生成创意、标题和完整视频

在本周三举行的「Made on YouTube」特别活动上，谷歌宣布了一系列即将引入YouTube的AI功能，旨在革新视频制作方式。新推出的工具将大大简化创作者的工作流程，使他们能够更高效地生成内容。YouTube将新增一个名为「灵感」（Inspiration）的选项卡，借助AI技术帮助创作者构思视频创意，推荐视频标题、缩略图，甚至自动编写视频大纲。

此外，YouTube还推出了一个名为Veo的工具，集成了谷歌DeepMind的视频生成模型，能够自动生成视频背景，并支持生成最长6秒的完整视频片段。预计这些功能将在今年晚些时候或2025年初向全球创作者推出。

除了视频制作工具，YouTube还计划推出AI自动配音功能，使视频能够自动转换成多种语言，帮助创作者接触更广泛的观众群体。同时，YouTube还将在App中新增社区互动AI工具，以提升创作者与粉丝的互动体验。YouTube CEO Neal Mohan表示，平台将继续致力于推动创作者社区的繁荣，确保创造力在YouTube上蓬勃发展，同时助力创作者经济的成长。

微软与贝莱德等成立300亿美元AI基础设施投资基金，英伟达提供技术支持

9月18日消息，微软宣布与贝莱德（BlackRock）、全球基础设施合作伙伴（GIP）及阿联酋AI投资公司MGX携手成立了「全球AI基础设施投资伙伴关系」（GAIIP），这只基金计划投资于AI基础设施的建设，涵盖数据中心和能源项目，旨在满足全球日益增长的算力需求。

英伟达也加入了该伙伴关系，为AI数据中心和AI工厂提供专业技术支持，以推动整个AI生态系统的发展。微软表示，GAIIP的重点投资领域主要集中在美国，但也会扩展至美国的合作伙伴国家，助力全球AI创新与经济增长。

据悉，该基金最初计划逐步释放300亿美元的私募股权资本，资金将来自投资者、资产所有者及企业，外加债务融资，最终有望带动总计1000亿美元（约合7094亿人民币）的投资潜力。这笔资金不仅将用于AI基础设施建设，还将为这些设施提供可持续能源来源，推动AI技术的进一步发展和广泛应用。

马斯克讽刺加州AI法案：“加州需要新的领导”

9月18日消息，加州州长加文·纽森日前签署了两项新法案，旨在帮助演员和表演者保护他们的数字复制品免受人工智能（AI）的侵害。这些法案主要针对音像作品中的数字肖像和表演，防止未经授权的AI技术生成或复制演员的形象。对此，埃隆·马斯克在社交媒体平台“X”上发布了几段网友讽刺该法案的视频，并直言“不敢相信”，并表示“加州需要新的领导”。马斯克此番评论引发了广泛讨论，许多人认为这是他对加州立法的强烈不满和对其领导层的不信任。

OpenAI重金押注，NEO世界模型正式登场

OpenAI大力投资的人形机器人初创公司1X，近日揭开了其备受期待的「世界模型」的神秘面纱。这一模型能够基于真实世界数据，生成不同场景中的行为预测，为机器人NEO带来了全新的能力。通过「世界模型」，NEO可以精确预测与物体的互动方式，比如叠衣服、拉开窗帘等家庭日常行为。此前，这类具有高度可变性的物体难以被纳入虚拟世界的模拟中。然而，借助1X的技术，机器人不仅能够理解环境，还能在神经网络中重塑、模拟和优化与世界的互动过程。这一突破性进展将有助于推动高保真视频生成和机器人行为规划，为未来的AI技术发展提供新的可能。

谷歌将采用C2PA认证技术以判定图片是否由AI生成

据第一财经报道，谷歌即将更新搜索结果中的“关于这张图片”功能，使用户能够了解图片是否由人工智能（AI）工具创建或编辑。为此，谷歌将引入C2PA认证技术，该技术包含图片的来源信息，并在硬件和软件之间创建一个数字化的追踪路径。C2PA（内容真实性和出处联盟）由亚马逊、微软、Adobe、Arm、OpenAI、英特尔以及谷歌等公司共同支持。然而，尽管C2PA得到了广泛的行业支持，其实际采用速度仍较缓慢。

目前，徕卡和索尼相机已经率先支持这一开放技术标准，能够为照片添加详细的元数据，包括相机设置、拍摄时间、地点等信息。尼康和佳能等相机制造商也已承诺采用C2PA标准。不过，苹果和谷歌是否会在未来为iPhone和Android设备提供该技术支持，尚在等待进一步确认。谷歌将C2PA整合到搜索结果中的举措，标志着这一计划的首次重大测试，也有望推动这一标准在全球范围内的更广泛应用。

OpenAI或在9月24日推出ChatGPT高级语音模式

据科技媒体Testingcatalog报道，OpenAI可能会在9月24日正式推出ChatGPT的高级语音模式。该媒体指出，OpenAI最近更新了高级语音模式的FAQ页面，并在代码中发现了“hasSeenAdvancedVoice/2024-09-24”的字符串，暗示部分移动用户或将受邀提前体验这一功能。

这一功能的发布将进一步扩展ChatGPT的应用范围，增强其在语音交互方面的能力，预计将提升用户体验，特别是在移动端上的使用感受。

版权声明：admin 发表于 2024-09-19 6:46:59。
转载请注明：YouTube推出AI「一站式服务」，助力创作者生成创意、标题和完整视频 | 今日AI热点新闻 |

暂无评论

暂无评论...