财新传媒 财新传媒

阅读:0
听报道

题记

把ChatGPT与工业文明时代最高技术结晶进行比较,从而理解其特点;除了大力出奇迹,ChatGPT摸索出一套全新的技术方法值得借鉴;另外,ChatGPT里面的算法功能都在快速演进中,通过了解其具体特点细节可以更好判断其局限,趋势和问题;大模型能做的很多,不能做的也不少,看看还有什么问题值得思考;我们该如何从增长飞轮,投资,布局,竞争等角度来看后面的发展;最后谈谈企业智能转型。

目录

光刻机 VS. ChatGPT

两个关键方法突破

庖丁解牛,见微知著

屋子里的大象

力量布局

时间线预测

企业智能转型

写在最后

注:整个文章“ChatGPT-AGI”或者“ChatGPT”指ChatGPT这类大模型的发展过程,后面可能会出现包括AI大模型、GPT,ChatGPT,AI,智能体等说法,事实上都是指代同一技术趋势。

01.

光刻机 VS. ChatGPT

在布莱恩阿瑟(熊彼特奖,复杂科学奠基人)所著的《技术的本质》一书中,对技术进行了四个层次的定义。

技术是对现象的编程
技术基本结构是一个主集和一套次集的递归
新技术是对“现有技术”和“现象利用”指数级的组合
竞争优势不仅来自资源,更是来自知识转化到技术的能力
我们来对比一下:

光刻机

要运行光刻机,首先需要得到极紫外光,必需先制造一种直径是三千万分之一米的小锡球,让小锡球以每小时200英里的速度在真空中移动,然后用激光对小锡球进行两次打击。第一次打击提高小锡球的温度,第二次打击让小锡球爆炸,把它变成温度达50万度的等离子体。这个温度已经比太阳表面的温度还要高很多。整个喷射锡的过程每秒钟要重复5万次,才能得到可以用来光刻的极紫外光。只是这一部分的激光器自己就有40多万个零部件,而且这个激光器本身是一家德国公司投入巨资研发,它其中一个镜片是另一家德国公司几十年的技术积累所得。

按照前面对“技术”的定义,光刻机是对“超高温下激光的特性”这一现象进行编程,在这个过程中少数人或者组织,集结非常密集的知识,通过长达几十年的研究,制造出来设备,继续进行价值传递,从而服务更多人。可以看出,这个技术的迭代应该不会太快。

ChatGPT-AGI

细看ChatGPT的训练数据会发现,里面包含了:书籍、期刊、Wiki百科、网络爬虫数据、编程代码,最新的4.0还加入了图片等各类数据。其数据规模随着每一代不断迭代,虽然现在模型吸收知识的能力,以及理解知识的能力还有限,但可以非常确定地说,理论上模型是可以吸收人类所有的认知信息的。

因此,ChatGPT是对“人类普遍认知”这一现象的一次编程。我不知道还有哪几个技术能够掌控这么大的能量。而且,ChatGPT迭代周期不同于以往的工业时代技术,中间会存在很多环节。ChatGPT的迭代可以做到端到端,一次训练造福全社会,而且成本有限,速度也是叹为观止。

另外,“人类普遍认知”这一现象经过编程,形成的能力明显超过人类认知的总和,更不用说个体认知。

最后,这是一个强递归系统(产业链、周期、使用者),每个技术贡献者也都是技术用户,随着技术进一步深化,每个用户生活方式的改变,都将提供更多数据,使其更加强大。

接下来我们再琢磨下,为什么它可以实现?

02.

两个关键方法突破

AI发展这么多年,这次大模型的核心突破,我认为是以下两点:

一、从“训练模式”逐渐走向“学习模式

我们先回顾一下ChatGPT的训练过程

第一步:预训练

通过深度学习的transformer算法以及一些改进模型,使得智能体建立了对输入数据的一个大致理解。

第二步:初始问答能力训练

准备一个问题库,通过人工回答这些问题;将此作为标注数据,训练出一个非常非常基础的初始问答版。

第三步:训练评分机制

让这个“初始问答版”回答问题,由于是概率模型,需要回答出几个答案,并根据概率排列·;然后让人工给其打分,标注哪些答案更满意,通过这个手段训练出一个评分机制。

第四部:训练最终版本

彻底摒弃人工,用评分机制作为输入,利用强化学习方法,训练出一个成熟的问答版本。

在以上过程中,训练逻辑跟之前的机器学习最大不同有两点:

一是,Transformer为基础的DL(Deep Learning)实现了非常好的预训练过程,让智能体在训练之前对数据有了不错的理解,这极大地提升了训练的效率。这是算力消耗最大的部分,可以占用90%,也是AI秉承的升维逻辑的又一次胜利。AI就是在不断的把信息放到一个更高的维度寻找规律。最重要的是,他不需要额外的人工标准,只要拿来数据就可以直接用,非常像人类理解的学习过程。

二是,RL(Reinforcement Learning)强化学习的落地,通过很少的人工,营造了一个不错的强化学习环境,类似Alpha Go智能体可以自己将评分机制作为输赢奖励,自行训练一个好的回答策略。Alpha Go在国际象棋取得巨大成功,但国际象棋仍是一个非常封闭的场景(episode)问题,输赢在一个很短循环里完成,奖励非常清晰。但在训练智能体回答问题上,不能完全照搬,能看得出科学家们是一步步迭代找到了办法。

Transformer代表的DL对数据有了很好理解,RL把训练过程又大幅自动化。这两个加起来,让机器学习更像是一个学习过程了,而不是传统的Data-fitting模式的机器学习,“DL+RL”极大地提升了训练效率。

二、智能体开始理解人类意图并与之互动

刚才是站在训练效率的角度看问题,现在我们再换个角度,在ChatGPT的整个训练过程中,工程师不是在教智能体做一件事,而是教它怎么做事。即,先让它对客观事物有些理解,然后通过一问一答,实际上是让它理解人在问什么问题,也在训练它应该怎么回答问题。这是一个非常大的飞跃。以前的机器学习模式,更多的是给定一个目标,让机器非常明确地去分类,或者预测。

让机器理解什么?你希望要什么?将两者连接起来(alignment)以及让机器做什么?可以肯定,这四个在一定性价比下的循环,是未来人工智能的重点,这个“机器理解什么”的内容可以有最大集,也可以有很多子集,比如图像、小说,再比如一个表格或者编程代码,这就是我们说的AIGC。你的意图可以多种多样,让机器去做什么,也可以有很多变换。在小集合里对特定内容子集,要求智能体学习什么内容,智能体扮演什么角色,以及你希望什么输出,这三者可以随意更换,甚至穿插。本质上我们已经完成了“序列sequence”这个内容的四循环。在机器看来这些形式都是一样的。对于一个经过所有序列数据训练的智能体来说,人类输入一张纸条,上面写着他希望构建一个网站,智能体可以几乎瞬间把这个纸条上的想法通过代码实现。这就是智能体理解了人类意图,并在图片信息和代码信息之间做了一个转化。这个例子就是ChatGPT4.0发布会上的演示。

03.

庖丁解牛,见微知著

在移动互联时代,手机技术的每一次提升,比如:触摸屏,LBS,摄像头等都带动了很大的产业发展。这次技术变革也不例外,我们可以通过查找每个技术细节里,还有哪些提升的空间,以帮助我们更好地预测未来将带来哪些新体验,满足哪些细分市场以及带动哪些行业发展。

我们重点看几个关键点:transformer,Fine tuning,Instruction,RLHF和Prompt。在上图里主要的提升分为openAI一定会去做的事情(正常提升),openAI会交给生态去做的(交由生态完成)以及很大不确定性的科研方向。我们展开说说(后面字体颜色就表达相关意思):

Transformer:

泛指在预训练过程中用到的主要算法。

下一步的重点可能会是:

局部特征工程和加强Reasoning:聚焦在更专业的领域,确保可以掌握更具体的知识,就像一个优异考分的高中生,进入大学开始深造专业知识。局部加强有可能减弱整体性,局部如何定义边界都还是问题。Reasoning在4.0已经有了显著加强,但可以肯定这条路还有巨大空间。

多向有环动态序列:这个名字不一定准确,属于想象,是说我们还有很多信息组织方式不是简单的序列(sequence),形式更复杂。如何可以有效学习,这是对transformer算法的一次重构,势必是一个重点。

多智能体:看最新文章,ChatGPT4.0已经在开展类似工作,这也是第四范式一直研究的方向——如何让智能体自己去遍历寻找全新的优化方案,对超参进行调优。当然这只是多智能体模式的一个应用可能。

Fine Tuning:

是指真正的训练过程,由于Transformer强大的预训练,现在把训练都叫“微调”了,真是很感慨。

相应数据收集能力穿戴设备,如传感器等:如果我们已经可以最大限度地吸收学习人类认知了,那么,我们能否去吸收理解人类自身,比如人的脑电波;能否去学习宏观微观物理现象;能否去学习理解组织运作?这些都需要特定的数据收集,科研和商业模式支撑。

数学和视频:智能体能具有如此惊艳的逻辑能力,很大程度是参数数量提升以及把文本和代码一起训练的结果,如果我们能把数学逻辑序列化拿过来直接训练,其逻辑是否更强;如果未来我们能让智能体可以更高水平地观看视频,是否学习的知识就更加宽泛?

Instruction:

是教给智能体应该如何更好地理解和回答的过程,本质上是指示智能体具体要做什么。

API:Toolformer可以实现你的问题,智能体结合自己知识,在网上浏览信息再加以计算。比如,最新美元和人民币汇率是多少?那么这类API未来将大范围开枝散叶。除了在虚拟世界,很快物理的API也会落地。

RLHF:

是强化学习人工反馈,就是前面提到的,当人工完成打分,并训练出打分评价机制后,进行的强化学习过程。这个过程是让智能体更好地理解人类意图。

基于场景:ChatGPT4.0已经可以非常清晰地定义对于这个问题,希望智能体以什么角色来回答。除了角色,还会有性格。比如,游戏陪玩,可以训练激进或者保守的不同策略。

更完善的人格:与人的交流是一个由浅入深的过程,完善的人格势必是未来方向,下面会展开讨论这个部分。

组织决策(trade-off):除了对个人的能力和效率提升,其实提升组织能力才是释放生产力的核心。大模型在这个领域大有可为。如何让智能体更好地理解一个组织,特别是理解组织中哪些需要平衡的决策逻辑,至关重要。

Prompt:

就是我们每次在问题框里跟智能体的互动。这次的技术革新很重要的一点,就是Prompt的体验。智能体可以根据Prompt的一系列问题,或者重点提示,显著提升回答质量,这个类似人类的沟通,随着问话者的引导,人类会把勾起的尘封记忆唤醒,或者更好的组织语言,机器也是。

自动化:现在是人机互动,但未来世界是流动性的、在线化的,我们能否让机器与机器对话,大模型与每个组织内的小模型对话?我们能否训练Prompt,让其可以自动实现?这是现在Prompt Engineering很关注的问题之一。

解耦性:因为prompt是一次few-shot,新阶段的技术还不能实现很好的解耦,也就是说数据都在大模型侧,再加上每次迭代不会对大模型进行参数改变,这对传统大型企业应用会是挑战,未来的趋势一定是在这个点上有很好的解耦能力。

04.

屋子里的大象

ChatGPT背后的算法是一个渐进性突破,未来还会持续改进,甚至出现更加大幅度的跨越,这些可能的跨域会是什么?在学术界经常把这比做房间里的大象。

在托马斯库恩的《科学革命的结构》一书中,把科学进步形容为两个方向,一个方向是往下的逐渐结构化、体系化的还原论过程;另一个是非线性的、非理性的,很多突破具有偶发性。但是,考虑到我们已经在一个非常明确的框架下,对未来的发展还是会有一个清晰度路线。

为了更好的思考以上问题,我们先有个尺度。

向右走:更了解人类意图

从技术和商业的现状出发,去思考智能体还能更多地满足我们什么需求?比如,它是一个行业专家,它可以更懂你,更懂你的组织;可以不但在虚拟空间服务你,甚至在物理空间服务你。

向左走:更理解这个世界

另一个方向是,智能体有更强的认知能力,除了AGI,是否可以超越人类的认知,甚至超越人类科学的认知边界。当然科学本质上就是人类认识的边界。

按照这个尺度,我们畅想下,AI在现有算法上还有哪些不足或者提升的空间?我称之为房间里还有哪几只大象。

大象1:人性的模拟

以下是问ChatGPT排名前20的哲学家都是谁,其给出的答案剪辑。

如果把现在的ChatGPT比做一个高中生,它有机会读万卷书,行万里路,即,随着投喂的数据越来越多,以及它更理解人类意图并给出回答,它会逐渐更有“社会经验”。但有一点,它还不是人,它没有人的一个最致命也最鲜活的东西:欲望。通过规则、通过强化(碰壁)它可以部分懂得民主,热爱自由,崇尚真理,甚至有爱,但是,现在的技术还很难更进一步模拟复杂的人性。正如上图排名19位的维特根斯坦所一直倡导的,人类认知的边界就是语言,目前为止,transformer算法可以稍微扩展到图像、代码等其他序列(sequence),但对人类“人性”背后的复杂性仍缺乏有效手段。RLHF可以实现很好的模拟,但更深层次的“欲望”还需要很多探索。

大象2:AI理解组织

ChatGPT现在可以调用一些企业数据,但还不能真正读懂一个组织。但我们大胆设想一下,如果ChatGPT能做到的话,会发生什么?它将彻底颠覆组织形态。我们都有个常识,如果一个金字塔组织,每个人的直接下属最合适的是5-7人,这是由我们的沟通效率决定的,大型组织虽然有很强的效率,但也带了巨大的复杂性和成本。但滴滴打车这类的网络化组织,为什么可以将这么多的司机组织起来?未来每个行业是否都有这样的机会?如果智能体可以理解一个组织的战略、目标,以及当下主要的挑战、约束,又可以非常顺畅地与人沟通,这将是非常理想的中层人选。极端的假设就是少数人控制智能体,智能体可以有效地组织一个非常庞大的团队。

以上是天马行空,如果要落地,现在的技术还需要很大的进步才行。比如,transformer算法当下只可以解决的是一维序列问题这很难理解一个组织的全部信息。另外,算法无法处理实时数据,这就不能理解瞬息万变的外部环境。除了大模型侧以外,企业也需要在不断做“基于让渡决策权”的数字化建设,为技术成熟做好准备。

大象3-认知的超越

目前为止,我们讨论的ChatGPT的训练数据都来自人类认知这个大的集合,但人类认知是受到空间、时间、因果和观测能力限制的。AI是一个非常纯粹的相关性算法,随着它能学习的知识越来越多,它会建立更不可思议的直觉,这些直觉是人类无法比拟的。再加上如果我们有意识地为其提供,比如:脑电波数据,更全面的物理观测数据等,每个细分领域的科研数据,其很可能认识到一个人类无法认识的世界。

在AI for Science领域,现阶段AI还是人类的一个增强工具,比如,非常有针对性地帮人类在海量样本数据里,找到最合适的那个。再往后,科学领域可能将经历AI领域发生过的事情,AI在跨领域的组合洞见来解决难题。未来,AI的认知超越人类,将引领我们继续新的探寻。

05.

力量布局

根据横轴作为智能体可能计划的方向,纵轴是每个功能组合,我们就绘制出一幅ChatGPT这样的大模型发展的蓝图,在这个蓝图上我们可以比较清晰的看出科研,竞争,投资等力量的布局

大厂军备竞赛

作为流量入口特别是搜索、短视频等信息交互方式发生的大幅体验提升,都可能把已经确定的战局重新再打一遍。这场军备竞赛不会短期分出胜负,会是很强的囚徒效应,但对整个生态都是好事。

AIGC投资热潮

AIGC是非常受投资人追捧的赛道,很重要一点是效果惊人,SaaS化程度高;主要挑战是如何进一步增加客户粘性,如何产生差异化价值。

战略布局

在进入行业知识后,无论B2C还是B2B2C都有非常大的想象空间,特别是有庞大长尾客群需要提升赋能效率的细分行业。

科技探索和精英组织

短时间内,openAI这样的精英组织可能还会出现,其类似研发组织又有很强的vision驱动,资金、算力和人才密度极高,不以短期商业回报为目标。这类组织在美国可能还是大型科技公司或者企业家精英支持,在国内很可能是国家背景的研究院。

传统企业跟进

传统企业,特别是应对长尾toC或者需要用AI赋能转型的传统企业,已经快速跟进,这对toB市场是很大的利好。当然这一轮转型的科技投入非常大。在美国,由于坐拥全球市场毛利,更有资本快速行动,国内速度反而会慢一些。

06.

时间线预测

我把未来分成三个阶段,分别是:AI工具增强时代、AI引领的效率提升时代、AI引领的科技发展时代。第一个时代需要2-3年可以跨越到第二个时代,标志事件是狭义的AGI诞生。之所以说是狭义,可能未来很长时间都不会有完美的AGI,一定是已经符合大部分标准,但仍有一些缺陷。第一个时代好理解,第二个时代相比第一个时代的个人赋能,AI开始大范围地赋能人类组织。而跨越到AI引领的科技发展时代的里程碑是:科学探索以AI为主,人类为辅成为主流,AI开始物理性的为人类服务。

07.

企业智能转型

哪些组织可以最早实现智能化转型呢?

这转型是指前文提到的从金字塔组织模式转型到网络化模式。组织由于AI驱动的效率提升,扩张边界远远大于传统组织。

这里有几个关键点:

一是以“决策机制转化”为非常重要的北极星指标,这是一条隐形的,很长的lead time线。如果数据是基础,那么,决策机制以及背后的人才队伍能力和角色转化,也需要花大量时间和非常明确的意志去引领和痛苦迭代。如果坐等大模型成熟,很可能为时已晚。因为这次对细分市场的效率提升,是非常明显带有垄断性的,其效率提升是明显的降维打击。

二是科技、工程和业务模式三位一体的进化,今天技术进步的特别,就是那些能够跟上整体创新速度的企业可以获胜,这里的跟上不是简单的买进来,需要在能力上全方位匹配。

三是将传统业务与创新模式完全隔离。两种业务是完全不同的基因,一个为了现在,一个为了明天,很可能非常不兼容。

四是从第一天起,在数据上的积累就要考虑未来智能化特点,传统数据和智能化数据是完全两个概念。当然第四点从属第一和第二。

从时间上,我预测,在进入第二个AI发展阶段中,将会出现大量以AI驱动的企业,可能是智能家电或者快销品,可能是生产性服务组织(比如:律师、教师、工程师等)。这些企业很多都是从传统业务中脱胎换骨,即使初创企业也要经历从传统业务站稳脚跟再进行转型的过程。

由于以下几点原因

1.     从资源上看:转型后的网络型组织模式由于效率惊人,会有很强的竞争力和垄断属性。但消耗资源巨大,需要传统业务支撑。

2.     从时间上看:几个关键转型的准备提前期很长,如果是创业早期这需要更长的耐心。

一批传统企业的智能化转型之路已经开启了。

 

写在最后

个人,相比了解它的不足,不如认识到它的强大,先变成Prompt Engineer,一起进化。

组织,留给是否转型的时间其实并不多,可能很快要做决定。

相比算力,Transformer和Prompt技术的进一步成熟发展是关键。

Science/engineering/product; 是一回事儿,一体三面,现阶段还无法完全拆开。

和资源、技术相比,创新能力和接纳创新的能力才是关键(国家,企业,产品,个人)。

大的迭代,除了看大厂PK和商业化,就是看精英组织和国家的助力程度。

懂得爱,会欣赏艺术,发现生活中的非存在;用这来对抗我们越发严重的单向度的人生。

 

话题:



0

推荐

智能化学习与思考

智能化学习与思考

5篇文章 214天前更新

裴沵思,第四范式总裁,前sap全球副总裁

文章
  • 个人分类
全部文章 5篇
  • 文章归档
2023年 5篇