研究机构警告：2028 年互联网高质量文本数据将被耗尽 | 今日AI热点新闻

热门AI资讯 4个月前 admin

37 0 0

2028 年互联网高质量文本数据将被耗尽

今日AI热点新闻:

1.研究机构警告：2028 年互联网高质量文本数据将被耗尽
2.OpenAI 推出 GPT-4o Long Output：单次生成可达 64K tokens
3.谷歌推出 Chrome 浏览器 AI 新功能
4.谷歌发布 Gemma 2 系列新增 20 亿参数模型
5.Sam Altman：OpenAI 与美国人工智能安全研究所展开合作
6.微软将 OpenAI 列为人工智能及搜索领域竞争对手
7.日立开发出识别AI创作文章的新技术

研究机构警告：2028 年互联网高质量文本数据将被耗尽

《经济学人》近期刊登了一篇题为《AI 公司很快将耗尽大部分互联网数据》的文章，指出随着互联网高质量数据的逐渐枯竭，人工智能领域正面临着“数据墙”困境。研究机构 Epoch AI 的最新预测表明，到 2028 年，互联网上所有的高质量文本数据将被完全使用。与此同时，机器学习数据集可能在 2026 年前耗尽所有“高质量语言数据”。研究人员警告，未来几代机器学习模型若依赖人工智能生成的数据集进行训练，可能会导致“模型崩溃”的风险。

OpenAI 推出 GPT-4o Long Output：单次生成可达 64K tokens

OpenAI 正在进行 GPT-4o Long Output 版本的测试，这一新版本显著提升了文本生成能力，每次请求最多可生成 64K tokens。目前，该功能处于 Alpha 测试阶段，仅对部分选定测试者开放。尽管长输出功能提供了强大的生成能力，但由于其高昂的推理成本，定价也相应上调。此外，OpenAI 还推出了成本较低的 GPT-4o mini 模型，旨在让更多用户和企业能够接触到先进的人工智能技术。

谷歌推出 Chrome 浏览器 AI 新功能

本周四，谷歌宣布为 Chrome 浏览器新增三项 AI 功能，包括谷歌 Lens、标签页对比购物助手以及自然语言集成搜索历史。这些功能均由 Gemini 技术支持，现已在 Chrome 的桌面版上推出。这些创新旨在优化用户的浏览体验，使其更加智能和便捷。

谷歌发布 Gemma 2 系列新增 20 亿参数模型

在 7 月 31 日，谷歌宣布推出 Gemma 2 系列的新成员——Gemma 2B，这是一款拥有 20 亿参数的小型模型。在 LMSYS Chatbot Arena 的大模型竞赛中，Gemma 2B 的表现优于 GPT-3.5-Turbo。此外，谷歌还推出了与 Gemma 2B 相关的安全内容分类器模型 ShieldGemma 和模型可解释性工具 Gemma Scope。Gemma 2 系列是谷歌的开源模型系列，今年 6 月，谷歌已发布 Gemma 2 27B 和 9B 模型。

Sam Altman：OpenAI 与美国人工智能安全研究所展开合作

8 月 1 日消息，OpenAI 创始人 Sam Altman 宣布，OpenAI 正在与美国人工智能安全研究所展开合作，以提升人工智能领域的安全性。此外，OpenAI 将致力于将至少 20% 的计算资源投入到公司的安全工作中，以确保技术的安全和可靠性。

微软将 OpenAI 列为人工智能及搜索领域竞争对手

8 月 1 日消息，微软在提交给美国证券交易委员会（SEC）的 10-K 文件中，将 OpenAI 列入人工智能和搜索领域的竞争对手名单。除了 OpenAI，该名单还包括亚马逊、谷歌和 Meta 等公司。文件中，微软将 ChatGPT 的创造者 OpenAI 定义为人工智能产品以及搜索和新闻广告领域的竞争对手。上周，OpenAI 发布了名为 SearchGPT 的搜索引擎原型。尽管如此，OpenAI 发言人表示，微软与 OpenAI 的合作关系保持不变，双方在建立合作伙伴关系时已达成可能存在竞争的共识。

日立开发出识别AI创作文章的新技术

8 月 1 日消息，日立制作所宣布开发出一项新技术，能够判断文章是否由生成式人工智能（AI）创作。这项技术通过分析文章中的词语使用模式来进行判断。未来，这项技术不仅有助于防止生成式AI制造的错误信息传播，还可以协助企业和政府机关在撰写重要文件时规避著作权侵权等风险。

版权声明：admin 发表于 2024-08-02 2:18:47。
转载请注明：研究机构警告：2028 年互联网高质量文本数据将被耗尽 | 今日AI热点新闻 |

暂无评论

暂无评论...