财新传媒 财新传媒

阅读:0
听报道

这是一系列文章的第一篇,目的是给商业化人才,企业管理者做一些决策算法的普及;

一.商业化人才和企业管理者为什么要懂一些决策算法?

  (一)在未来算法驱动的企业将大面积涌现:

随着技术的飞速发展,特别是大模型领域效率、应用、竞争三个飞轮的快速迭代,它不仅会提高个人效率,其终极目标是提高组织效率,甚至重塑组织形态。金字塔结构的组织形态会慢慢弱化,算法驱动的网络化组织形态会逐渐兴起。

  (二)算法不是一成不变的

算法是一个从初级到高级,从固化到优化,从量变到质变的过程,而且以现在的技术水平看,优化空间仍旧非常大,也就是说,算法驱动的企业其实是算法优化驱动的企业。

  (三)企业转型中,核心业务人才需要向算法人才过渡

实践表明,一个企业的核心团队是什么样的心智能力,其核心竞争力依然。在从人类决策到机器决策的这种转换过程中,对核心团队的能力挑战是非常大的;数字化,初步智能化,批量智能化,智能化迭代,每个阶段人才结构、业务科技组合模式、资源和权利分配都将发生很大变化。组织进步需要跟上算法迭代。

  (四)算法及其相关逻辑,是一种高维度信息

最近,越是深入学习,在这个层面的感受就越深。首先,算法是逻辑非常严谨的形式语言,而且它集合了多种数学思想,再加上基本的函数、对数、循环等,是语言很难完美表达的。再次,一个算法不仅可以描绘静态,还可以描述动态演变过程,表达事件的时序、因果、寻优等,这些是语言表达很弱的地方。最后,它与计算机语言几乎无缝连接。这些算法之美,算法的高维属性,还是很值得研究和学习的。你如果想驾驭一家算法驱动的企业,首先你要学会驾驭算法。

二.那么作为一个外行到底应该懂多少?本文试图给出一个框架

  (一)着重介绍从现实世界到算法世界中间部分

   这是一个从客观到主观的过程,是一个把现实环境的确定性和不确定性抽象成模型的过程,是进入算法大门的第一步,也是非常重要的一步,你需要知道这个映射关系,映射逻辑以及迭代逻辑。

  (二)决策算法理论的主要脉络

什么是算法,什么是决策,从客观现实环境的主观环境下,单一决策如何做出,如果是由一系列决策做成的策略该如何改进

  (三)主要算法的演进

   在序列决策里,着重介绍了三种不同的算法,可以通过这三种算法的演变折射出普遍规律,即算法在解决问题中如何不断进化,迭代。

  (四)最重要的一些数学思想和数学发现

   概率分布,贝叶斯网络,极大似然估计,贝尔曼方程吗,随机近似估计,深度学习这些数学思想和发现是支撑算法的钢筋水泥,实际上算法就是这些的排列组合。

三.决策算法主要理论来源

我们先预热一下,决策算法是一个典型的复杂系统过程,涉及众多学科,这是为什么决策领域算法会给人感觉抓不到要点。比如,经济学的效用理论带来了智能体量化目标的方法论。心理学里的奖惩机制,为建立连续决策策略提供了计算依据。神经科学里对人类神经网络的研究,是现在深度学习的主要灵感。最近应用广泛的DQN,就是强化学习和深度学习相结合的产物。计算机科学领域的联结主义,给整个算法提供了坚实的逻辑基础。工程领域的现实世界控制理论,是智能体和环境之间反馈模型的来源。在数学上对于定量“不确定性”、概率、贝尔曼方程等。管理学/运筹 线性规划 动态理论 排队理论等。

这些在不同领域发展起来的方法逐渐汇聚,进行新的排列组合,伴随着AI算力的提升以及数据大量被使用,慢慢形成了越来越成熟的决策算法理论。

四.什么是决策

决策是艺术,是战略,是平衡,是智慧,这些既是决策的特点,亦是我们人类做决策的弱点。我们其实是有限理性,不能完全消化和判断所有影响因素,这会对决策带来偏差或忙点;我们会出现情绪偏差,会过渡使用直觉,从而做出非理性决策;我们会对一些决策中的重要参数本能的出现锚定效应,即潜意识里固定在一个数量,并不是随着环境变化更更新。我们在损失和收益的计算上往往会偏向损失。

那么,在数字世界里,显然解决以上问题是算法的强项。为了说清楚算法如何看待决策,我们先把算法如何抽象决策问题说清楚。首先需要建立一个简单模型,两个核心元素,一个是智能体(agent),一个是环境(environment),智能体通过观察环境(observation),并根据一个统一的目标(utility objective)给出行动(action)。环境由于这个行动发生变化,并且给智能体一个奖励(reward)。智能体根据这个奖励以及环境的变化进而决定后续动作。这大概是我们抽象出的一个标准的决策过程(如图1)。

但是,挑战在于,决策过程中存在相当大的不确定性(见图2):

一是状态(State)不确定性,即我们可能不知道环境具体处在什么状态。我们不确定我们观察到的现象就是环境本身,而且大概率不是,智能体对于环境的理解是一个长期的摸索过程。

二是模式(Model)不确定性,环境发生状态转移的模式是什么?当智能体给出一个动作之后,环境会发生变化,但变化遵循什么规律,这个智能体并不清楚。

三是输出(Outcome)的不确定性,智能体发出一个行动,环境从而发生变化,这个变化是否完全由这个行动的影响产生?这个其实也存在不确定性,也可能是环境其他因素的变化导致。

进一步理解这种不确定性,我们拿快销鞋类公司的具体一个品类球鞋的销售预测举例子:

状态不确定性:即使我们做了大量市场调研,但对于市场也只是有一些粗浅的估计,不可能完全把握市场的脉动。

模式不确定性:每年市场是有一定变化规律的,比如季节,人群喜好等,但市场变化速度非常快,各种元素相互作用的结果有时候是未知的,我们不能完全照搬过去的规律。也就是说不断即时的状态我们不确定,它的变化规律也很难完全了解。

输出的不确定性:我们做了市场活动的预算,留足促销费用和渠道费用,但这些资源和费用是否能按照预期达到效果我们不得而知。

对于决策算法,这些不确定性如何表达,如何评估,如何计算是我们走入决策算法的关键点。

五.算法的特点

首先,算法是要解决一个问题;其次,在一定解决逻辑下,每个步骤都会有各种方案,这个方案就是算法。

这个算法受两个因素的影响,一个是算法背后的解决逻辑,实际上对一些数学思想或数学发明的组合。同时,算法也会遇到各种难题,延伸到更多场景,有各种妥协,算法也会演进,这些背后需要数学思想、数学发明来支持(如图3)。

因为算法的名称没有统一规范,非常庞杂,经常就事论事的谈,很容易被搞晕;

这里面其实有几个层次;对于初步接触算法,都是冲着解决问题去的,所以大体上会了解这个算法具体能干什么;再深入研究会发现,解决同一个问题其实有很多算法,背后是一条算法不断升级的技术逻辑。

理解这个技术逻辑对熟悉算法的迭代发展非常有必要,我自己的心得和思考是以下几个层次:

首先,数据肯定首当其冲,随着更多数据被制造被处理,可以给算法更大发挥空间。

其次,整个算法提升之路都是一个“升维”的过程,“升维”是一直的动力:升维就意味着提高了空间复杂度,通过提升空间复杂度可以更好的提高表达力,减少特征相关性,发现隐藏特征,构建更复杂模型。

比如,我们描绘两个变量的关系,有以下这个算法迭代过程,从线性回归 → 多项式回归 → 决策树 → 神经网络,这是一个典型的“升维”过程。从线性回归来描绘两个变量的关系,但极其复杂的神经网络映射模式,空间维度大幅提升。

另外,在算法进化中,样本量,空间复杂度和算力是一个博弈关系

1)样本量与空间复杂度:样本量的增加可以在一定程度上缓解高维空间中样本稀疏的问题,有利于空间维度的提高。但空间维度的提高也要求有更大的样本量作为支持,否则容易导致过拟合。二者之间形成互动循环,需要相互匹配。

2)样本量与计算能力:更大的样本量提高了计算量,但也为算法提供了更丰富的信息,有利于学习更复杂的函数映射。计算能力的提高可以处理更大规模的样本,但也催生了更加复杂的算法模型与 loss 函数。二者之间相互促进但也带来新的挑战。

3)空间复杂度与计算能力:高维空间代价高昂的计算,要求更强大的计算资源作为支持。而计算能力的提高也使复杂的高维空间学习成为可能,二者互为依存。但空间维度的过快提高也可能超出现有计算能力,形成一定的博弈。

还有就是,表达能力和泛化能力制衡又共同大福提升

表达能力是指:算法能否更精准的描绘标量之间的关系

泛化能力是指:算法训练后的函数在新的数据上是否表现良好,是否过拟合。

逻辑上这两者是存在此消彼长的关系的,过于精细的表达能力会伤害模型的泛化能力。但现在新的技术出现比如深度学习的神经网络和正则化的一系列工具,pretrain和微调的机制,这些技术使得大幅提升表达能力的同时,成功有效的阻止了过拟合。让这对老冤家都有了能力上的大幅提升。比如:从朴素贝叶斯 → 条件随机场 → 编码器-解码器就是一个很好的例子,从只能反应简单的相关性和因果关系,但可以对于任意序列信息进行翻译,这个过程中高效的避免过拟合的工具功不可没。

最后,就是并行能力:从顺序计算到并行计算,大幅提高了计算效率

这里的并行计算能力不是指硬件或者计算层面,而是算法逻辑层面。与之相对应的是顺序计算。

比如:DNN → CNN → RNN → LSTM → Transformer,最早的DNN就是要一个字节一个字节的计算,而Transformer实现了把文章里面所有字节相关性的同步计算。

再比如,我们会讲的序列决策,最早的贝尔曼最优方程需要遍历所有状态空间才能优化一次策略,但后来的actor-critic每一步计算都在计算并优化。

以上总结也可能还有缺失,顺着这个逻辑来看算法,会有不一样的视角,也会更加深对算法的理解。

因此,我自己的思考,算法特别是决策算法,是为了解决特定问题的各种数学方法和数学发现的组合。算法之间有两种关系,一个是解决逻辑的个别步骤,一个是步骤下的各种性能迭代。

举一个简单例子,要解决一个问题,即把大象放进冰箱。解决逻辑是:打开门,放进去,关上门。那么,算法就有:打开门,放进去,关上门这三类。但具体看打开门,有用手代开,自动开门,把门打碎,这三个就是具体算法了。

 

话题:



0

推荐

智能化学习与思考

智能化学习与思考

5篇文章 214天前更新

裴沵思,第四范式总裁,前sap全球副总裁

文章
  • 个人分类
全部文章 5篇
  • 文章归档
2023年 5篇