OpenAI资助曝光引争议,数学基准测试公正性遭质疑 | 今日AI热点新闻

广告也精彩
OpenAI资助曝光引争议,数学基准测试公正性遭质疑 | 今日AI热点新闻

OpenAI资助曝光引争议,数学基准测试公正性遭质疑

今日AI热点新闻:

1.OpenAI资助曝光引争议,数学基准测试公正性遭质疑
2.中国AIGC月活破亿,“豆包”占据半壁江山
3.Perplexity AI寻求与TikTok美国合并,引发关注

 

OpenAI资助曝光引争议,数学基准测试公正性遭质疑

1月19日,科技媒体TechCrunch报道称,研究机构Epoch AI因未及时披露OpenAI的资助而引发争议,其推出的数学基准测试FrontierMath的客观性受到质疑。

Epoch AI是一个由Open Philanthropy主要资助的非营利组织,该机构推出的FrontierMath基准测试整合了高难度的专家级数学问题,用于评估AI模型的数学能力。在这一测试中,OpenAI的o3模型表现出压倒性优势,准确率高达25%,而其他模型的得分则仅约2%。

争议的焦点在于透明性问题。Epoch AI的一名承包商“Meemi”在LessWrong论坛发帖指出,许多FrontierMath的贡献者在基准测试公布前并不知晓OpenAI的参与。他表示:“沟通完全不透明。Epoch AI应该披露OpenAI的资助信息,确保承包商在选择参与时能清楚其工作成果可能被用作能力提升的用途。”

此外,有用户担忧OpenAI对基准测试中问题和解决方案的访问权进一步削弱了FrontierMath的公正性。事实上,Epoch AI在去年12月20日o3模型发布前,并未公开披露OpenAI可以访问这些数据。这种隐瞒行为可能对FrontierMath作为客观评测工具的声誉造成长期影响。

 

中国AIGC月活破亿,“豆包”占据半壁江山

根据研究机构QuestMobile的数据,截至2024年11月底,中国AIGC(生成式人工智能内容)应用的月活跃用户数量突破1亿,比2024年6月实现翻倍。其中,“豆包”以超一半的月活跃用户份额领跑市场,其余第一梯队应用包括“Kimi智能助手”和“文小言”,但与“豆包”的差距持续扩大。

AIGC市场的迅速增长显示出中国用户对生成式人工智能内容的旺盛需求,也为该行业未来的发展提供了巨大的潜力。(财联社)

 

Perplexity AI寻求与TikTok美国合并,引发关注

据CNBC报道,美国人工智能公司Perplexity AI于周六向TikTok母公司字节跳动提交了一份要约,提议与TikTok美国分公司合并。知情人士透露,这项提议旨在通过全新的公司架构,让字节跳动的大部分现有投资者保留股权,同时为Perplexity AI引入更多视频内容资源。

如果达成合作,这将是一次跨领域的战略整合,结合Perplexity AI在生成式AI领域的技术优势与TikTok在短视频内容生态中的主导地位。业内人士认为,此举可能进一步提升两家公司在视频和AI结合领域的竞争力,同时应对不断变化的市场环境。

目前,字节跳动和Perplexity AI尚未对这份要约的细节作出公开回应,但消息已经引发行业广泛关注,相关合并进展将成为未来市场的重要观察点。

 

广告也精彩
版权声明:admin 发表于 2025-01-20 3:33:56。
转载请注明:OpenAI资助曝光引争议,数学基准测试公正性遭质疑 | 今日AI热点新闻 |
广告也精彩

暂无评论

暂无评论...