今日AI热点新闻:
1.马斯克旗下xAI发布Grok-2测试版,展现显著技术进步
2.OpenAI推出更精确的代码生成评估基准:SWE-bench Verified
3.昆仑万维推出全球首个AI流媒体音乐平台Melodio
马斯克旗下xAI发布Grok-2测试版,展现显著技术进步
8月13日,马斯克领导的人工智能公司xAI正式推出了Grok-2的测试版本,包括两个型号:Grok-2和Grok-2 mini。这两个大模型已经通过X社交平台发布给Grok用户,并展示了显著的技术进步。与之前的Grok-1.5相比,Grok-2在聊天、编码和推理能力方面有了明显提升。而Grok-2 mini则是Grok-2的紧凑型版本,虽小但功能强大。
据悉,Grok-2测试版已在LMSYS排行榜上以“sus-column-r”为代号进行测试,表现优于Claude 3.5 Sonnet和GPT-4-Turbo。虽然目前Grok-2和Grok-2 mini仍处于测试阶段,但xAI计划在本月晚些时候通过企业API对外提供这两款产品。
OpenAI推出更精确的代码生成评估基准:SWE-bench Verified
OpenAI近日发布了名为SWE-bench Verified的全新代码生成评估基准。这一基准是对现有SWE-bench的改进版本,旨在更准确地评估AI模型在解决现实软件问题中的表现。在公司官网的公告中,OpenAI表示:“随着我们越来越接近AGI(通用人工智能),我们需要在更加具有挑战性的任务中对系统进行评估。”这一更新标志着OpenAI在推动AI技术可靠性和实用性方面迈出了重要一步。
昆仑万维推出全球首个AI流媒体音乐平台Melodio
8月14日,昆仑万维正式发布了全球首个AI流媒体音乐平台Melodio,并同步推出了AI音乐商用创作平台Mureka。两款产品均搭载了昆仑万维自主研发的DiT(Diffusion Transformer)架构音乐大模型Skymusic 2.0。这是业内首个能够持续稳定生成特定风格歌曲的AI音乐大模型。
Skymusic 2.0相比上一代产品,支持超过500字的歌词输入,能够生成长达6分钟的双声道立体声歌曲,在伴奏质量和配器丰富度方面实现了显著提升。这一创新使Skymusic 2.0成为AIGC(人工智能生成内容)音乐大模型领域的最新SOTA(State-of-the-art,业内最领先)。