2023年9月7日,腾讯在全球数字生态大会上正式发布了腾讯混元大模型,并宣布其已通过腾讯云对外开放。腾讯混元大模型是腾讯全链路自主研发的通用大型语言模型,具备卓越的中文创作能力、复杂语境下的逻辑推理能力以及可靠的任务执行能力。
此前,腾讯创始人马化腾曾表示不急于推出大模型的半成品版本。然而,首次亮相的混元大模型显然不可能达到通常所谓的“完美版本”。因此,腾讯集团副总裁蒋杰将当前发布的混元大模型定义为一个“可用”和“可实践”的版本。
蒋杰表示:“我们一直在不断提升我们的能力,从大型语言模型到文生图,再到今天这个充满科技感的混元生成的视频。今天的发布只是一个开始,还不足以引发大家高度期望。我希望每个月我们都能带来新的惊喜。”
在今年6月和7月,腾讯相继发布了面向B端客户的腾讯云MaaS解决方案和AI原生向量数据库Tencent Cloud VectorDB。随着自主研发通用大模型的发布,腾讯已经构建了一个完整的大模型产品服务体系,包括通用大模型、云服务平台以及向量数据库。大模型时代的来临将彻底改变所有软件服务的面貌。腾讯的社交、游戏、娱乐、金融等产品广泛覆盖C端和B端用户,公司正积极推动这些产品的大模型升级。截至目前,超过50个腾讯业务和产品,包括腾讯云、腾讯广告、腾讯游戏、腾讯金融科技、腾讯会议、腾讯文档、微信搜一搜、QQ浏览器等,已经接入腾讯混元大模型测试,并取得初步成果。混元大模型还将作为腾讯云MaaS服务的核心,客户可以通过API直接调用混元,也可以将其作为基础模型,为不同产业场景构建专门的应用程序。
在大会上,腾讯集团高级执行副总裁兼云与智慧产业事业群CEO汤道生表示,腾讯将全面 embrace 大模型时代,而腾讯集团副总裁蒋杰进一步强调:“我们研发大模型的目标不在于在评测中取得高分,而是将这项技术应用到实际场景中,为用户创造实际价值。”
一、混元大模型是什么
在2023年腾讯全球数字生态大会上,腾讯正式推出了混元大模型。此前,尽管腾讯在今年6月发布了行业大模型及相关工具链TI平台,但通用大模型一直处于公司内部应用测试的阶段。然而,在这次盛大的腾讯全球数字生态大会上,腾讯自家的通用大模型——混元大模型,终于揭开了神秘的面纱。
- 混元是谁?
- 混元的核心技术架构是什么?
- 混元模型参数量多大?
- 混元训练数据截止什么时候?(今年 7 月,每个月不断迭代)
- 混元大模型,你有什么特点、优点?
根据混元大模型自述,该模型具有超过一千亿参数规模,并经过了超过两万亿个标记的预训练语料,是由腾讯自主研发的通用大型模型。就其性能而言,腾讯方面宣称混元大模型在中文处理方面超越了GPT-3.5,尽管英文处理方面目前略逊于GPT-3.5。此外,腾讯还自主研发了名为"Angel"的机器学习框架,使训练速度比业界主流框架提高了一倍,推理速度则提高了1.3倍。
在活动现场,腾讯集团副总裁蒋杰解释了腾讯在投资大型模型方面的期望,他强调了对更成熟和更可靠的大型模型的需求。然而,他也指出了一些技术上的局限性,如搜索增强和知识图谱等技术,虽然有助于解决大型模型的"幻觉"问题,但也存在限制。蒋杰在采访中进一步澄清,尽管腾讯会使用这些技术,但它们在整体技术策略中的比例相对较低。据悉,腾讯在预训练阶段采用了"探真"算法来修正事实,以减少混元大模型出现幻觉的可能性。
他补充说,打造更成熟和更可靠的大型模型是一个需要抠细节的过程。腾讯表示,为了解决大型模型容易"胡言乱语"的问题,他们优化了预训练算法和策略,使混元大模型的幻觉相对于主流开源大型模型降低了30%至50%;通过强化学习方法,使模型学会了识别陷阱问题;通过位置编码的优化,提高了处理超长文本的效果和性能;提出了思维链的新策略,使大型模型能够像人一样在实际应用场景中进行推理和决策。
关于混元大模型的研发时间,蒋杰表示,腾讯从2020年开始一直在跟进和投入这一技术能力,最初是400 GB的稀疏大型模型,用于支持广告业务,而不是现在所看到的密集大型模型。该模型当时使GMV提高了约13%,之后腾讯逐渐增加了对大型模型的投入和积累。根据中国信通院的《大规模预训练模型技术和应用的评估方法》,混元大模型在模型开发和模型能力两个关键领域中综合评价得分最高,共测评了66个能力项。在主流的评测集MMLU、CEval和AGI-eval上,混元大模型在中文理科、高考题和数学等子项上都表现出色。
二、腾讯大模型:决定性之战仍在产品领域
腾讯自研通用大模型首次亮相并未领先于其他主要科技巨头,而从今天的信息披露来看,难以明显辨别出其在技术方面是否存在重大差异或突破性创新。正如腾讯高管所言,混元大模型仍然处于起步阶段,对其寄予太多不切实际的期望还为时过早。然而,这并不代表腾讯在这场竞争中仅仅是个旁观者。尽管在大模型的基础能力和积累方面腾讯并无显著优势,但在将大模型应用于实际场景方面,腾讯依靠强大的产品线和庞大的用户基础拥有明显的竞争优势。
发布会前夕,微信向部分受邀用户开放了名为「腾讯混元助手」的小程序,这是一款多模态对话机器人产品,基于腾讯混元大模型,能够回答各类问题,执行多种任务,包括获取知识、解决数学问题、翻译、提供旅游攻略、提供职场建议等,甚至还可以进行AI绘画。
大型模型本身只是一项技术,要实现真正的落地应用,需要解决产品开发、用户需求、运营等一系列具体问题,这也是为什么大模型制造商需要与第三方合作的原因。然而,随着构建大型模型的门槛逐渐降低,越来越多的公司愿意开发自己的大型模型,这使得云服务提供商的角色逐渐演变成为提供开发平台和计算能力的供应商,而不再仅仅是拥有自研通用大模型的公司。然而,腾讯是中国最大的软件服务提供商,拥有微信和QQ两个拥有十亿用户的产品,游戏业务占据了中国市场四分之一甚至更多的市场份额,同时还拥有中国最大的支付工具、前三大视频平台、前三大短视频平台,以及中国最大的音乐和网络文学应用。此外,在办公领域,腾讯拥有腾讯会议、腾讯文档、企业微信等领先的市场份额。
混元大模型对腾讯而言就像是一个生在金矿上的宝贝,而其他公司不过是在找钉子的人,而腾讯最不缺少的就是钉子。腾讯宣布已经将50多款产品接入混元大模型,其中包括拥有4亿用户的腾讯会议,覆盖6亿用户的腾讯广告,以及拥有数亿用户的腾讯文档等。在发布会上,蒋杰展示了腾讯会议、腾讯文档、腾讯广告等多个业务接入腾讯混元大模型后的实际应用情况。
例如,腾讯会议基于混元大模型开发了AI小助手,用户只需用自然语言进行简单指令,就能完成会议信息提取、内容分析等复杂任务,会议结束后还能生成智能摘要。根据实测数据,混元大模型在指令理解、会议中问答、会议摘要、会议待办事项等多个方面都获得了高用户接受率。
在文档处理方面,腾讯混元大模型支持多种文本创作场景,已经在腾讯文档的智能助手功能中投入使用。此外,混元还能够一键生成标准格式文本,精通数百种Excel公式,支持自然语言生成函数,并根据表格内容生成图表。目前这些功能仍处于内测阶段,预计在成熟后将向用户开放。
在广告业务领域,腾讯混元大模型支持智能化的广告素材创作,可以根据行业和地域特点进行自适应,满足个性化需求,实现文字、图片和视频的自然融合。基于混元大模型的能力,广告智能导购能够帮助商家提升在企业微信等场景中的服务质量和效率。
蒋杰在接受采访时表示,腾讯大模型的应用是与腾讯业务深度结合的,目前已与会议、文档等多个业务进行整合,未来还将与微信、QQ、腾讯视频、腾讯音乐等更多产品进行整合。大型模型的发展不能仅仅依赖资金投入,它必须落地到具体场景中产生价值。随着模型应用场景的增加,用户数量的增加,商业价值和数据也将逐渐增加,通用大模型