ChatGPT的出现,绝不仅限于被视为一个搜索引擎或简单的问答机器人。其实质在于成为一项生产力工具,在未来的十年内,预计将为生产力带来重大的改塑和效率革命。大型语言模型有望成为数字化领域的基本配置,其发展轨迹类似于个人计算机,沿袭了个人电脑的演进路径。类似于1946年计算机初现时的局面,初始并未引发信息革命,仅有少数领域如气象和登月计划等少数部门使用。当时存在一种广泛观点,认为全球仅需4-5台计算机足矣。然而,随着个人电脑的问世,其走入寻常百姓家,涵盖各行各业,最终引导了一场翻天覆地的信息革命。
大模型发展呈现垂直化趋势
大型语言模型凭借其普惠、广泛和通用的特性,预计将进一步普及,为各行各业提供支持与赋能。因此,有观点认为:无论是家庭、政府还是企业,都可能拥有一个甚至多个大型语言模型。然而,在大型语言模型在企业级市场落地的过程中,中国与美国在To B市场上的发展存在显著差异。在中国,这一发展不太可能导致垄断,大型模型的数量绝不会仅限于3-5个。
在未来,大型语言模型将成为无所不在的存在,而其发展机遇可能更多地集中在企业级市场。当前,数字化已成为中国的核心战略之一,产业数字化将成为未来巨大的去中心化增量市场。因此,对于在中国发展大型语言模型而言,抓住这一战略机遇,成为产业发展的推动者,以及提升政府和企业生产力和效率,被视为至关重要。
然而,在大型语言模型进入企业级市场的过程中,仍将面临一些重大挑战。这些挑战可以总结为以下四个方面:
- 专业领域知识匮乏:虽然大量的互联网语料可以供大型语言模型使用,但在某些专业领域、行业知识和企业内部知识方面,这些模型的知识仍然相对匮乏,甚至无法及时更新。
- 知识幻觉问题:大型语言模型有时可能会输出一些看似合理但实际上不准确的信息。这部分是由于数据和知识以矩阵向量的形式编码在深度神经网络的参数和权重中,因此需要更精准的提示来引导输出,以确保内容的真实性和可信度。
- 安全问题:企业可能不愿意将其核心竞争力交付给公共的大型语言模型,也不愿意将其机密技术训练到公共模型中。
- 成本问题:大型语言模型的训练成本相当高昂,尤其是在硬件供应紧张的情况下。虽然模型的使用可能降低了人力投入,但并未降低整体成本。
面对这些问题,未来的发展趋势将朝向垂直化方向,即构建小而专业的垂直领域大型语言模型。单一的、通用的大型模型难以解决所有任务分解、人机交互和知识问答的问题。相反,我们需要依赖企业级的数据语料和高质量数据,来训练小规模、专业化的垂直领域模型。预计大型语言模型将成为所有数字化系统的标配和关键组成部分。
快速将企业级GPT落地的策略与方法
在与100多家企业客户和合作伙伴的访谈中,普遍认识到大型语言模型并不具备万能性。因此,问题转变为如何更好地将这些模型应用到企业场景中。这需要使通用模型变得专业化,真正适应政府和企业需求。在这方面,需找到小而精的应用切入点,以发挥其潜力。
目前,大型模型的能力主要体现在文本生成、内容创作和知识问答等方面。因此,可以从这些能力入手,通过针对特定领域进行微调,以更快速地满足To B市场的准确性要求。因此,初期可将大型模型作为辅助工具,例如用作写作助手或导航。基于这一思路,可以从四个维度出发,即对上、对下、对内、对外,找到适合这些模型快速发挥作用的应用场景:
- 对内场景:适用于办公写作和总结等任务。
- 对外场景: 大量数字人已经在客户服务中应用,帮助提供即时回答。
- 对上场景:用于信息和情报总结与分析。
- 对下场景: 可应用于企业知识和技能培训。
在实践中,需要注意一个重要点:未来大部分业务场景将与企业知识库密切相关。传统的大数据应用主要关注结构化数据,但80%的非结构化知识和数据往往被忽略。这些数据将成为大型模型训练的宝贵语料。因此,关键在于从企业数据基座中提取有价值的知识和高质量的标注数据,构建企业的私域知识库,通过检索增强,实现To B业务场景中内容的可信性、实时性,以及内容的安全性和分权性。
数据具备不同的权限:公开互联网数据、半公开行业数据或企业内部数据。对于企业的机密和有权限数据,应构建企业知识库或向量数据库,实现权限管理和大型模型的检索增强,以提供更准确的知识和赋能。
另一方面,尽管大家已经接触过ChatGPT等语言模型,但引导模型生成准确内容的过程仍相当复杂。因此,传统界面不会被淘汰,它们将在办公写作、图像创意、营销等场景中发挥作用。在未来发展中,这些传统界面将与语言UI共同存在,以提供更直观和实际的应用。
综上所述,将360的企业级GPT落地需要考虑数据和知识作为底座,将企业积累的非结构化内容整合为知识库。通过多元的数据连接和知识追踪,构建企业级知识库,实现向量索引、摘要索引和多模态索引,赋能垂直企业级大型模型。
大型模型在实际应用中的三种最佳实践和流程
最佳落地场景:
- 高效办公写作:在办公写作领域,大型模型可以被嵌入到不同类别的模板中,包括15类大模板和近80类细分的公文模板。这一方法可用于高效地完成公文写作,有效地解决公文写作过程中的耗时和质量低的问题。
- 智能政务服务:结合大型模型和政务领域的知识库,通过多轮对话使大型模型能够类似于人一样进行语义理解。通过逐步的追问和补问,模型能够获取相关信息并最终形成问答。这种方式能够客观且准确地回答民众在办事过程中的各类问题。
- 文化旅游数字助手: 通过构建文化旅游数字助手,实现更为个性化的旅游体验。该助手不仅能够提供基于旅游目的地的行程规划,更重要的是能够为游客提供本地人般的指导,包括景点、美食、趣闻等。这种模型可以逐步与OTA、当地酒店、餐饮等业务进行整合,形成一个全面的数字伴侣。
最佳实践流程:
- 业务分析与场景选择: 首要任务是进行深入的业务分析,找到现有业务中的痛点和机会。选定合适的场景,这将为后续的模型应用提供明确的方向。
- 数据采集与清洗准备:在选定场景后,开始收集并清洗与之相关的数据,确保数据质量和完整性。这些数据可以用于训练模型和增强知识库。
- 训练企业专有大模型:利用清洗后的数据,开始训练适用于企业场景的大型模型。这个过程需要调整模型的参数以适应特定业务需求。
- 开发企业场景化应用: 利用经过训练的大型模型,开发定制的场景化应用,如智能助手、数字员工等。这些应用可以通过API与现有业务系统进行集成。
在企业级大型模型的落地过程中,需要强调业务和技术专家之间的紧密协作。业务专家能够提供深入的领域知识,而技术专家则负责模型的开发和集成,以确保模型能够真正地满足业务需求。通过以上流程,可以最大程度地发挥大型模型在企业实践中的价值。