Fork me on GitHub

1. 引言

最近萌叔拆解了几个AI应用,其中包含coze和dify创建的工作流,也包含TradingAgents
我发现它们中都包含

  • 1)多个智能体的协作
  • 2)一套预定义的工作流

多个智能体的角色划分和工作流与人类团队的组织架构和工作流程高度相似

这种现象类似于人类社会的社会化分工。

这种现象是偶然的,还是有其必然性?它对AI应用的未来发展又有着怎样的深远影响?

2. TradingAgents中的组织架构和工作流程

下面我们以TradingAgents为例,来看看在TradingAgents中,多个智能体是如何进行协作的。

2.1 组织架构

上图展示了TradingAgents的组织架构,其中每个角色都有明确的职责,并通过协作完成复杂的交易任务。

2.2 工作流程

可以明显想到组织架构工作流程是必须配合使用的,单独存在并没有什么意义。
我们来看看整个工作流程

  • 1)分析师市场分析师社交媒体分析师新闻分析师基本面分析师)进行信息收集
  • 2)收集的信息交给研究员团队(看涨研究员看跌研究员) 进行研究
  • 3)研究经理针对研究员的辩论结果进行总结,得出研究报告
  • 4)交易员针对研究报告,制定交易计划
  • 5)交易计划提交给风险管理团队(激进分析师保守分析师中性分析师)进行风险评估
  • 6)风险裁判针对风险分析师的辩论结果做出最终决策。

整个工作流中出现了13种不同的角色,角色使用langchain进行定义,
工作流使用langgraph定义。

注意:langgraph 是有向图,但是其中可能是有环的。

通过上述对TradingAgents的分析,我们可以看到多智能体协作的复杂性和有效性。
那么,这种现象背后的原因是什么呢?

3. 推测的原因

萌叔推测可能有2个原因,导致AI应用中不自觉的出现了社会化分工,以及多智能体的协作。

3.1 克服 认知过载

目前主流的大型语言模型都是基于深度神经网络构建的,类似于隐马尔科夫链,模型是依据输入token,从统计学的角度来“预测”输出。
模型输出结果的准确性输入token的数量大致符合下面的图

这里输入token的数量 其实反应的是某种限定性。

1) 第1阶段

随着输入token数量的增加,准确率越来越高

2) 第2阶段

准确率达到模型的最佳效果

3) 第3阶段

随着输入token数量的增加,准确率反而开始下降

举个示例

想想一个场景,你打算让AI画一幅画。(图片由豆包生成)

a) 少量限定词

请帮我画一个动物。


由于没有足够的限定,随机性太强,AI画出来的可能是狗、兔子、鹦鹉...

b) 进一步,你修改提示词

请帮画一只狗,狗是一只棕色的泰迪。它正在撕咬一个黄色的拖鞋。


显然这一次,结果是明确的了。

c) 进一步,增加输入

请帮画一只狗,狗是一只棕色的泰迪。它正在撕咬一个黄色的拖鞋。拖鞋上有米奇和米妮在跳舞。


上面的图,图2和图4已经出现了逻辑错误。原因是AI错误的理解我的意图。

上面的例子可能不算特别的恰当,但是过多的输入确实引入更多的不确定性,整体的准确率是下降的。

另外更多的输入,还可能导致选择性的遗忘
就好比,你向家中幼小的孩子交代要去超市购买一系列的商品,那么当他兴致勃勃的回到家中时,
你会发现总有那么几样商品会被遗漏。并且我的实践表明,越是智商高的模型,遗忘的概率越低,
比如ChatGPT 4的表现就要优于ChatGPT 3.5

3.2 对抗 复杂性放大效应

复杂任务是多个独立步骤串联完成时,整体成功率会随步骤数呈指数衰减。


然而经过充分设计的工作流程,就像插头的防呆设计,可以提高最终的成功率。

我们来看看下面的场景

3.2.1 带测试的工作流程

假定task1task2的成功率p都是0.8,那么整个任务的成功率是

我们给这个流程增加一个测试环节

如果测试通过,就结束执行;如果测试失败,则重新执行一遍。

n 成功率
1 0.64
2 0.87
3 0.95
4 0.98
5 0.99

小结

在不提高单个模块成功率的情况下,合理设置的工作流可以提高最终的成功率,当然由于返工的问题,整体的耗时可能会增加。

3.2.2 三个臭皮匠,顶个诸葛亮

我们小时候可能都听过“三个臭皮匠,顶个诸葛亮”这个俗语,然而这个俗语是可以被数学证明的。

1) 基本概率模型:互补提升胜率

最直接的数学模型是计算团队中至少一人能解决问题的概率

小结

计算结果显示,团队成功概率约88.3%,已经高于诸葛亮单独成功的80% 。其原理在于,个体的弱点在团队协作中被互补,整体抗风险能力增强

2)集体决策模型:多数票的正确性

另一种模型考虑团队通过投票(少数服从多数)做出决策。

  • 诸葛亮的设定:假设其决策正确率为75%
  • 臭皮匠的设定:假设每位臭皮匠独立决策的正确率均为70%
  • 团队概率计算:此时,“团队决策正确”需要至少两人投票正确。情况包括:
    • 三人都正确:概率为 0.7×0.7×0.7=0.343
    • 两人正确,一人错误:这种情况有3种组合(AB对C错,AC对B错,BC对A错),
      每种概率为 0.7×0.7×(1−0.7)=0.147,所以总概率为 3×0.147=0.441。
      团队多数票正确的总概率为:0.343+0.441=0.784(即78.4%)

小结

这个结果也超过了诸葛亮75%的正确率。此模型体现了 群体的智慧 ,即聚合多个不完全独立的判断,可以提高整体决策的可靠性。医疗领域的多学科会诊(MDT)就是此原理的成功应用。

4.总结

综上所述,AI应用中多智能体协作的出现并非偶然,而是为了克服认知过载和复杂性放大效应的必然选择。这种现象不仅提高了任务的成功率,也为未来AI应用的发展提供了新的思路和方向。


微信公众号