火热大模型中的八项冷静思考

热门资讯 1年前 (2023) admin
93 0
广告也精彩

微软小冰团队前身为小冰公司,是微软旗下最大的独立人工智能产品研发团队。该公司在人工智能领域涵盖了广泛的技术领域,包括自然语言处理、计算机语音、计算机视觉以及人工智能内容生成。其旗下的人工智能框架,被誉为全球承载交互量最大的之一。

小冰公司于2020年7月开始独立运营,其首席执行官为微软互联网工程院副院长李笛。在2021年7月,小冰公司成功完成了A轮融资,其估值超过10亿美元。随后,在2022年11月,该公司再次宣布完成了10亿元的融资,使其估值进一步攀升至20亿美元。

火热大模型中的八项冷静思考

AI生成图片

不仅如此,小冰公司以其创新力量成功培育了一系列AI虚拟人,如少女小冰、Rinna、夏语冰、小堂妹、冬奥裁判观君等。这些虚拟人均基于小冰框架孵化而生。

以下内容摘自小冰公司的首席执行官李笛的分享,希望能够为大家带来一些启示和思考。

 

一、AI技术尚处于初级阶段,存在着各种大忽悠

首先,有一件事需要特别提及,这件事将直接影响我们对待大型AI模型的态度。坦率地说,就我个人观点而言,尽管人工智能已经取得了相当的发展,但与此同时,它仍然处于类似于孟德尔刚刚揭示遗传规律时的初级阶段。换句话说,当前的AI大型模型仍然处于发展的萌芽阶段。在这一阶段,我们不仅可以想象,还可以看到与大型模型相关的各种概念迅速涌现出来。其中既包括了真正具有创新意义的新方向,也有一些不过是空洞的宣传。

回顾很多年前,计算机技术刚开始普及时,我们曾经见证了“电脑算命”等奇特现象的出现,而这些现象的售价甚至不菲。类似的情形在当前的大型AI模型领域也同样存在。许多人相信,大型模型的新能力将持续不断地涌现,因此那些能够在大型模型时代抢占先机的人将在未来不断领跑。然而,现实往往并非如此简单。科技发展更像是波浪式前进,大型AI模型也将在未来面临一系列挑战和瓶颈。科技界整体将会寻求新的方法和途径,下一个创新浪潮也将涌现,以解决我们当前所面临的种种难题。

其次,我想与大家分享的是,到目前为止,关于大型AI模型时代的技术,科学家们仍然只是停留在观察现象的层面,对于背后的原理了解还不够深入。我们目前正处于人工智能的草创时代,更确切地说,是一个动荡不安的时期。依我个人判断,从现在开始到明年第二季度,大型AI模型等技术还将经历巨大的波动和变化。

 

二、只有处于次要地位的公司才有意愿进行“颠覆性创新”

回顾我在微软的经历,我不仅是小冰团队的负责人,还担任了微软搜索引擎必应在亚洲地区的负责人。从我的角度来看,为什么并非谷歌率先推出大型AI模型呢?难道谷歌没有这个能力吗?实际上,原因在于谷歌在搜索引擎领域处于领先地位。微软的搜索引擎必应在全球范围内的竞争对手中,与谷歌相比,只有约十分之一的份额。要想在这个市场上引入大型AI模型,谷歌必须付出十倍的投入来抵御这种冲击。

此外,谷歌在搜索引擎领域取得了巨大的收入,如果引入新的技术范式,将会直接导致毛利迅速下降,甚至可能摧毁已经构建成功的商业模式。因此,谷歌并没有积极探索在自身占据优势地位的领域尝试新的技术模式的意愿。然而,对于微软而言,大型AI模型成为了一个极具潜力的挑战者,一种新的武器。就在几个月前,百度宣布推出了文心一言,许多人猜测它可能会将这一技术应用于搜索引擎领域。但我认为这种可能性不大,更有可能的做法是将大型AI模型用于百度在竞争中占据次要地位的领域。果然,最后文心一言与百度云深度融合。对于大公司来说,如果你已经在某个市场中占据领先地位,将大型AI模型视为一种战略性的储备武器是明智之举。而对于挑战者而言,这是一种有力的武器,能够在短时间内获得更大的市场份额。

火热大模型中的八项冷静思考

AI生成图片

 

三、大型模型独霸市场,还是混合模型共存?

对于大型AI模型的前景,因人而异,每个人都会带着自己的主观期望来看待。在尽量客观的基础上,我认为中国的AI公司或大型模型公司面临的主要挑战不在于技术,而在于商业模式。几个月前,行业内普遍认为大型模型将垄断市场。换句话说,未来可能会出现一种唯一的大型模型,它能够取代现有的其他技术范式。这也是许多公司急于布局大型模型的原因。然而,我们当时的判断是不同的。大型模型并不是越大越好,它不会完全垄断市场,未来将会是混合模型的局面。

让我给大家举一个简单的例子:如果一个模型的参数规模限制在130亿以内,那么仅需一张A100显卡即可驱动这个模型;如果参数规模控制在70亿左右,使用一张V100显卡即可;如果控制在40亿参数规模以下,甚至可以用成本更低廉的T4显卡去驱动。在这些情况下,产生的成本差异可能高达数倍之多。因此,像我们小冰以及其他许多同行一样,实际上都在致力于开发参数规模更小的模型。

这一策略的背后是,不同规模的模型都有适用的场景,而大型模型并非在所有情况下都是最佳选择。在未来的发展中,我们将会看到各种规模的模型共同存在,各自发挥其优势,构成一个多元化的混合模型生态。

 

四、模型越大越容易同质化

在许多技术创新中,常伴随着一种从众心态,这种趋势往往会迅速席卷整个领域。当前许多大型AI模型,包括拥有650亿以上参数、甚至超过千亿参数的模型,存在一个共同问题。首先,它们都需要大量的数据支持。大部分同行所使用的或准备的训练数据都相似,差异不大。其次,它们的训练方法也呈现出相似性。大家普遍追求赶超GPT,因此训练方法也趋于相似。可以想象一下,就像一个班级的学生,他们使用相同的训练数据,遵循相同的训练方法,受同一位老师指导。这样一来,规模越大的模型就越容易同质化。相比之下,中型和小型模型由于训练数据有限,可以更精细地筛选数据,采用不同的训练方法,因而能够产生更高的差异性,从而形成竞争壁垒。

此外,目前大型模型的涌现是否已经接近尾声呢?一些观点认为,要再次涌现新的能力,可能需要将参数规模增加三个数量级。还有其他观点认为,需要引入新的技术范式的变革,比如杨立昆提出的“世界模型”。毫无疑问的是,涌现并未如我们预想的那样持续激动人心,这引发了一些问题。这是否意味着,对于大型模型而言,基于当前技术在不同场景中进行深入应用成为至关重要的事情?这个问题变得越发突出。

 

 

五、大型模型公司是否能维持自身可持续发展?

关于大型模型公司是否能够维持自身可持续发展,我们不讨论是否能盈利。让我先与大家分享一个例子——“这个女孩叫小美”。这个声音可能许多年轻人在B站、抖音等平台上听过,它实际上是微软云服务中包含的一种声音。许多视频创作者在他们的视频中使用了这个声音。有些人制作的短视频非常成功,赚取了丰厚的利润,而有些人由于各种原因,却一分钱也没有赚到。微软作为声音技术服务提供商,是否能从中获得不同层面的回报?答案是否定的。类比到人工智能领域。人工智能创造了巨大的价值,但人工智能公司是否能从这巨大的价值中获得应有的报酬?答案可能同样是否定的。

人工智能服务提供商,无论用户使用其生成的内容是否赚钱或者赚钱较少,都只能按照使用次数或时长来收取相同的费用。而且可能会面临大量同行以免费的方式竞争,最终导致所有人都难以获利。再举一个例子:一个媒体朋友咨询我关于人工智能撰稿,希望AI能够写出符合媒体风格且高质量的文章。我好奇地问:“你愿意为这项服务支付多少费用?”对方回答:“不是有定价吗?1000个Token,每个0.2美分。一个月200篇文章。”我说:“除去成本,我一个月能从你那里挣到多少钱?还不到100美元。”相比之下,如果由人类来撰写,一篇文章的价格起码要1500元,200篇文章则要35万。人们似乎不愿意按照人工智能所创造的价值来支付费用。

回顾过去,一些人工智能公司,例如从事人脸识别的公司,解决了许多实际问题,但其服务却难以获得足够的收益,不得不转向软硬结合的方式。因此,可以说,制约大型模型和人工智能发展的不仅仅是技术,更是经济学规律。

 

六、人工智能公司的真正竞争优势

这一波人工智能的新技术带来了一个显著的特点,即大幅降低了从业者进入人工智能领域的门槛。以前专注于自然语言处理的团队在全国范围内可能寥寥无几。然而,随着大型模型的出现,人们逐渐认识到任何人都可以参与大型模型的开发,甚至许多传统领域的企业也开始尝试培养自己的大型模型团队。各个行业纷纷涉足,使得技术本身逐渐不再成为独特的竞争优势。那么,到底什么才是人工智能公司真正的竞争护城河呢?

让我为大家介绍一个例子:Inflection AI。近期,Inflection AI 宣布在一轮融资中筹集了13亿美元,融资总额达到15.25亿美元,由微软、里德·霍夫曼、比尔·盖茨、埃里克·施密特和新投资者英伟达(Nvidia)牵头。据路透社报道,该公司的最新估值约为40亿美元。Inflection AI 的首席执行官 Suleyman 表示:“我们虽然不了解所有答案,但我们正在致力于开发一种能真正对你有益的个人智能,它就在你的身边。我们的使命是将你与人工智能紧密联系起来,使其理解你的意图、组织你的生活,并在你需要时为你提供服务。”

与之相比,ChatGPT 更关注于向用户展示后端,更像是一个搜索引擎。而 Inflection AI 则在另一方面探寻,认为真正的竞争优势在于对用户的理解。使用 Inflection AI,你会注意到一个明显的特点:无论何时,他会积极提问,竭力理解你的需求。他会捕捉一切机会来更好地理解你,甚至在一天之内可能会问你200个问题。说实话,在技术产品方面,只要具备相关从业经验,以及相似的资金和算力储备,没有谁会比其他公司领先几个月的时间。然而,用户数据的深度理解却能够构筑起持久的竞争优势,这种优势能够持续很长时间。

总之,对于人工智能公司来说,真正的护城河并非只有技术,更在于对用户需求的深刻理解和服务。这种优势能够让公司在竞争激烈的市场中脱颖而出,保持持续的增长。

 

七、AI的商业模式探索:不仅止于技术销售

在人工智能时代的前景下,以及大规模模型出现之前,许多公司通过技术研发,获得了难以迎头赶上的知识图谱能力。然而,现在这种独特性已经不再存在。现如今,即使采用模仿性的大型模型,达到与竞争对手相当的质量,商业模式变得至关重要。即便率先推出创新性的大型模型,也难以避免被后来者追赶。为什么?因为短期内很难看到大型模型带来新的能力突破,从而你不能通过创新迅速拉开与跟随者的距离。你只能原地等待,直到后来者赶超。

我们可以明显看到,许多大型模型的商业模式基于API。但这种模式会不会受到开源技术的颠覆?随着市场的饱和,大型模型的价值可能会逐渐下降。大型模型本身将变得越来越普及,不再如以往昂贵。而在这一背景下,我们需要考虑更深刻的商业模式问题。

火热大模型中的八项冷静思考

AI生成图片

在小冰探索商业化的过程中,坚持了两个原则:首先,拒绝收取与AI无关的费用。例如,一个智能防盗门,虽然内含人脸识别功能,但实际上价格中的大部分成本并不与AI直接相关。其次,不仅仅依赖技术销售盈利。与此不同,OpenAI将研究室的成果直接作为API出售给客户。我们追求的是创造实际产生价值的那部分。小冰积极探索新的商业模式,着眼于共享终端的利益,而不仅仅是提供工具。与奈飞、网易云音乐的合作,就是在寻求共同创新的回报。这种商业模式的探索是一种共赢的思维,而非仅仅提供一种工具的思维。

小冰还在持续探索中,也可能会在尝试中遇到挑战。到目前为止,无论是面向消费者(ToC)还是企业(ToB)的人工智能,尚未出现成熟或成功的端到端商业模式。因此,大家仍然有机会在这个领域获得成功。

广告也精彩
版权声明:admin 发表于 2023-08-21 5:59:56。
转载请注明:火热大模型中的八项冷静思考 |
广告也精彩

暂无评论

暂无评论...