谷歌推出新AI技术:为无声视频自动配音 | 今日AI热点新闻

广告也精彩

谷歌推出新AI技术:为无声视频自动配音 | 今日AI热点新闻

谷歌推出新AI技术:为无声视频自动配音

今日AI热点新闻:

1.谷歌推出新AI技术:为无声视频自动配音
2.Meta发布AI音频水印工具,可区分AIGC音频和真人音频
3.上海人工智能实验室发布首个AI高考评测结果:最高303分,数学全军覆没
4.美国AI圈震动:OpenAI前首席科学家苏茨克维宣布创业
5.腾讯扩招AI大模型人才,新增岗位超过50%
6.前百度高管创业AI搜索公司MainFunc估值18亿,首款产品Genspark已推出
7.特斯拉FSD开发遇阻,马斯克称AI测试效率是关键

 

 

谷歌推出新AI技术:为无声视频自动配音

近日,谷歌旗下的DeepMind团队公布了一项名为“video-to-audio”的新技术,这项技术能够利用人工智能为无声视频生成背景音乐。尽管这款AI模型目前仍有一定的局限性,开发者需要通过提示词提前“告知”模型视频可能对应的声音内容,因此暂时无法直接根据视频画面添加具体音效。然而,这一创新技术展示了AI在多媒体内容创作领域的巨大潜力和发展前景。

 

Meta发布AI音频水印工具,可区分AIGC音频和真人音频

Meta近日推出了一款名为AudioSeal的全新系统,能够在人工智能生成的音频片段中嵌入隐藏信号“水印”,帮助检测网络上的AI生成内容。AudioSeal可以在长达一小时的播客中识别出哪些音频片段可能是由人工智能生成的,成为首个实现这一功能的工具。这一创新技术为内容真实性鉴别提供了有力支持,标志着Meta在音频识别领域迈出了重要一步。

 

上海人工智能实验室发布首个AI高考评测结果:最高303分,数学全军覆没

6月19日,上海人工智能实验室公布了首次AI高考全卷评测结果。此次评测采用全国新课标I卷,选取了6个开源模型(Mixtral 8x22B、Yi-1.5-34B、GLM-4-9B、InternLM2-20B-WQX、Qwen2-57B、Qwen2-72B)及GPT-4o,进行“语数外”三科的能力测试。为了确保评测的“闭卷”性,所有参与评测的开源模型均在高考之前发布,评卷由具有高考阅卷经验的教师进行人工评判,以保证评测结果接近真实的高考评分标准。

在此次评测中,InternLM2-20B-WQX在数学科目中取得最高分,超越了包括GPT-4o在内的所有模型。语文、数学和外语三科的总分为420分,结果显示,阿里巴巴的通义千问2-72B模型以303分排名第一,OpenAI的GPT-4o以296分位居第二,上海人工智能实验室的书生・浦语2.0以第三名的成绩上榜,三者得分率均超过70%。法国初创公司Mistral的模型得分最低,仅为185分。

然而,数学科目成为所有大模型的短板,平均得分率仅为36%,参与测试的所有模型在数学科目上无一及格。这一结果显示,尽管AI在许多领域表现出色,但在复杂的数学问题上仍存在显著不足。

 

美国AI圈震动:OpenAI前首席科学家苏茨克维宣布创业

据财联社报道,当地时间周三,OpenAI前联合创始人兼首席科学家伊尔亚·苏茨克维(Ilya Sutskever)宣布创办一家名为“安全超级智能”(Safe Superintelligence,简称SSI)的新公司。苏茨克维是去年OpenAI董事会的关键人物之一,他曾在投票将公司CEO奥尔特曼赶出公司后,又反悔将其请回。此次单飞创业,苏茨克维的目标是“一步到位”地创造一个安全的超级智能。

 

腾讯扩招AI大模型人才,新增岗位超过50%

6月19日晚,腾讯在其官方社交平台上发布了招聘信息,宣布“AI大模型”专项扩招计划,扩招人数将超过50%。根据官微介绍,腾讯去年启动了“青云计划”,面向全球招募顶尖技术人才,提供全面定制化的培养和极具竞争力的薪酬待遇。入选者将有机会参与腾讯多个核心业务岗位的工作,深入研究包括AI、大模型、安全、游戏引擎等前沿技术课题。

 

前百度高管创业AI搜索公司MainFunc估值18亿,首款产品Genspark已推出

6月19日消息,前小度CEO景鲲和前小度CTO朱凯华联合创立了AI创新产品公司MainFunc,并推出了首款AI Agent搜索产品Genspark。Genspark是一款AI Agent引擎,旨在利用AI提供更优质的搜索体验。目前,Genspark已经Beta上线,并迅速登上Product Hunt社区的今日新榜第四。

同时,MainFunc宣布完成6000万美元(约合4.35亿元人民币)的种子轮融资,由新加坡的Lanchi Ventures(蓝驰创投)领投。此轮融资后,公司的估值达到2.6亿美元,约合18.87亿人民币。

 

特斯拉FSD开发遇阻,马斯克称AI测试效率是关键

在特斯拉2024年度股东大会上,CEO伊隆·马斯克谈到了完全自动驾驶(FSD)系统开发面临的重大难题。两年前,业内人士曾预测这一“跷跷板问题”会在无人驾驶出租车上出现。随着FSD系统的不断进步,判断哪个AI模型表现更好变得愈发困难,因为行驶数千英里后才会出现一次需要人工干预的情况,快速评估新模型的性能成为难题。

马斯克表示,一个模型解决了A问题,却可能引发B问题,使得评估AI模型的性能变得复杂。为了解决这一问题,特斯拉正在采取多种方法,包括对比模型的判断和用户的驾驶行为,以加速发现不同模型的优劣势。

广告也精彩
版权声明:admin 发表于 2024-06-20 2:23:47。
转载请注明:谷歌推出新AI技术:为无声视频自动配音 | 今日AI热点新闻 |
广告也精彩

暂无评论

暂无评论...