Rik Oostenbroek 的抽象色场作品
图片来源: Rik Oostenbroek - @RikOostenbroek

AI 协调工具可以帮助组织更有效地对齐、审议和协作。但它们也会改变人类合作所依赖的信任信号和团队动态。

因此,领导者面对的挑战,不只是把 AI 部署到所有能节省时间的地方,也不是坚持每一个 AI 流程都必须有人在环路中。真正的问题,是有意识地设计人类、AI 系统和混合团队各自在何处最能创造价值。

Google DeepMind 的 Organising Intelligence 在第 9 个观点 “AI-driven Coordination” 中很好地提出了这个问题。它认为,围绕 AI 协作的研究正在汇聚到三个问题上:AI 是否具备成为良好协作者所需的社会认知能力;AI 是帮助还是伤害人类协调;以及人类-AI 混合团队是否优于纯人类团队。

本文的核心观点是:AI 的组织价值不仅在于自动化,更在于重新设计合作本身。

从自动化到协调

大多数关于 AI 的高管讨论,仍然从生产率开始:哪些任务可以自动化,可以节省多少时间,哪些工作流可以加速。这个框架有用,但并不完整。组织失败并不只是因为任务太慢。它们失败,是因为团队彼此误解,激励不一致,知识困在孤岛里,分歧在被有效呈现之前就已经僵化。

这正是为什么 AI 更深层的组织承诺,可能不是自动化,而是协调。Sangeet Paul Choudary 在《哈佛商业评论》中提出,AI 的巨大回报可能来自降低协调成本,而不仅仅是替代工作 (Choudary, 2026)。在这种视角下,AI 成为团队之间的翻译层、分歧中的调解者,以及让隐含假设显性化的机制。

近期研究支持这种更宽的协调视角。在民主审议中,研究显示 AI 系统可以帮助人们找到参与者共同认可的共识表述 (Tessler et al., 2024)。另一些研究表明,AI 来源可以提高人们对相反观点的开放性 (Lu, Tormala, & Duhachek, 2025)。放在组织语境中,这指向一种强大的可能性:AI 或许能帮助群体从立场对抗,转向对假设、证据和取舍的结构化比较。

AI 还可以丰富组织理解自身社会系统的方式。Amir Goldberg 和 Sameer Srivastava 认为,AI 可以通过识别语言、意义和互动中的模式,加深我们对组织文化的理解,而这些模式在大规模情境下通常很难观察 (Goldberg & Srivastava, 2024)。这很重要,因为协调很少只是正式流程。它受到文化塑造:人们说什么,避免说什么,哪些群体容易跨边界翻译,以及共享语言在哪里断裂。

社会认知问题

如果 AI 要支持协调,它就不能只是检索信息。它必须参与工作的社会结构。这要求它在某种程度上能够推理信念、意图、情绪和视角。

因此,关于大语言模型心智理论能力的研究与此相关。Street 及其同事发现,LLM 在高阶心智理论任务上可以达到成年人类水平,这类任务需要递归地推理别人知道什么、相信什么或会推断什么 (Street et al., 2024)。关于共情沟通的相关研究也表明,在特定条件下,大语言模型或许可以可靠地判断共情沟通 (Kumar et al., 2026)。

但这不应被解读为 AI 在人类意义上“理解”组织。社会意义总是嵌入文化语境之中的。关于跨文化面部表情的研究显示,情绪信号的解释有多复杂、多依赖情境 (Brooks et al., 2024)。对领导者而言,含义是:AI 协调工具应被视为强大但局部的社会工具。它们适合用来呈现视角、总结分歧和支持共情,但不应被当作人类意义的最终解释者。

隐藏的信任问题

AI 协调的乐观论据很强。但合作不仅是信息问题。它也是信任问题。

当人们协作时,他们依赖可见的努力、判断和意图信号。我们判断是否信任一位同事,往往不只看答案质量,也看他们如何得到这个答案:他们是否真正和问题搏斗过?是否考虑了取舍?是否理解后果?是否暴露了自己的假设?

Wojtowicz 和 DeDeo 将这称为 “mental proof”:一种可观察的思考证据,使他人能够推断技能、用心和正直等原本不可见的特质 (Wojtowicz & DeDeo, 2024)。AI 可能会削弱这种证明,因为它让思考变得更容易、更快速,也更不可见。一个由 AI 辅助生成的精致答案或许很有用,但它也可能遮蔽了呈现这个答案的人是否真正行使了判断。

这正是 AI 协调的核心悖论。AI 可以在任务层面让协作更容易,却在社会层面让合作更困难。它可以减少产出过程中的摩擦,却移除那种帮助人们相互信任的可见挣扎。

这并不意味着组织应该避免 AI,恰恰相反。它意味着领导者需要有意识地设计信任信号。AI 支持下的工作可能需要新的溯源形式:可见的假设、审计轨迹、异议记录、置信水平、来源轨迹,以及人类判断与 AI 生成综合之间的明确区分。重点不是为了放慢组织速度而放慢。重点是保留协作所依赖的社会证据。

混合团队并不会自动更好

“人在环路”这个说法,常常被当作一种普遍安全原则。它听起来令人安心:AI 可以行动,但人类仍会参与其中。然而,证据表明,人类参与并不总是自动带来增益。

一项关于人类-AI 组合的系统综述和元分析发现,混合团队经常优于纯人类团队,但并非总是如此。在某些情况下,尤其是当 AI 系统在某项任务上已经优于人类时,加入人类反而会相对于 AI 单独执行降低表现 (Vaccaro, Almaatouq, & Malone, 2024)。这使那种“每个重要流程都应该有人类检查点”的简单治理答案变得复杂。

正确的问题不是:“是否应该有人在环路中?”更好的问题是:“人类在这里到底要做什么?”

有时,人类应该决策。有时,人类应该审计。有时,人类应该设定目标、价值和约束。有时,人类应该监控异常。有时,AI 应该生成选项、批判假设,或在专家群体之间进行翻译。而在某些低风险、边界清晰的场景中,AI 可能最适合在没有持续人类打断的情况下执行。

这也是 AI 团队研究变得重要的地方。Schmutz 及其同事认为,AI teaming 要求我们在数字时代重新思考协作本身,包括角色、相互依赖、信任和团队设计 (Schmutz et al., 2024)。AI 不是一个简单放进现有团队的工具。它会改变团队本身。

任务张量:一种更丰富的设计语言

我与 Anil Doshi 关于 “Human–AI Task Tensor” 的工作,提供了一种有用方式,让我们跳出粗糙的“人在环路”思维。这个框架从八个维度组织人类-AI 工作:任务定义、AI 集成、交互方式、审计要求、输出定义、决策权、AI 结构和人类角色。

这很重要,因为不同工作需要不同的人类-AI 配置。高容量、定义清晰、容易审计的任务,可能适合高度自动化。战略性、模糊、政治敏感的任务,可能需要 AI 支持,但决策权仍由人类掌握。创造性或审议性过程,可能受益于 AI 生成替代方案,但仍需要人类保留问责、解释语境和协商意义。

我们提出了人类-AI 二元关系中 20 个决策权层级。例如,它区分了人类在环路中给予批准、人类在环路之上拥有否决权、人类在接近环路的位置进行观察,以及更高自主性的配置。

这个区别至关重要。人在环路之上 并不等同于 人在环路中。在人在环路中的流程里,人类是主动决策周期的一部分。人在环路之上的流程中,AI 可以拥有更高自主性,而人类负责监督、干预或在必要时否决。这为领导者提供了更丰富的设计词汇,用来根据任务风险、可审计性、表现和问责要求匹配监督方式。

领导者应该设计什么

实践层面的教训是:AI 协调需要被设计,而不是临时拼凑。

第一,领导者应该映射任务,而不是只映射岗位。一个角色中可能包含需要不同人类-AI 配置的任务。有些任务适合自动化;有些需要增强;有些需要审议、争辩和人类问责。

第二,领导者应该定义 AI 的协调角色。AI 是职能之间的翻译者,分歧群体之间的调解者,假设的批判者,决策的记录者,选项的推荐者,还是自主执行者?每一种角色都会产生不同的风险和信任要求。

第三,领导者应该保留 mental proof。当 AI 帮助生成输出时,团队仍应能够看到推理过程:假设、考虑过的替代方案、使用的来源、作出的判断,以及不确定点。在高信任团队中,AI 可能加速协作。在低信任团队中,若 AI 辅助不可见,人们可能更加怀疑,除非过程被设计得足够清晰可读。

第四,领导者应该把混合团队当作真正的团队来设计。这意味着设计角色、交接、激励、升级路径和问责规范。问题不是 AI 是否在场。问题是这个人类-AI 系统是否协调良好。

最后,领导者应该抵制自动化与人类控制之间的虚假二分。任务张量指向一种更细致的架构:人类可以定义目标,AI 可以生成选项;人类可以审议,AI 可以模拟后果;人类可以决策,AI 可以监控执行。在其他场景中,AI 可以在边界内决策,而人类在环路之上进行监督。

结论

下一代 AI 赋能组织,不会是那些自动化最多决策的组织。它们会是最善于设计人类、AI 系统和混合团队之间认知劳动分工的组织。

AI 协调工具可以帮助组织审议、对齐、翻译和协作。但它们也会重塑一种社会证据,人们正是通过这种证据判断他人是否有能力、是否真诚、是否值得信任。天真地使用 AI,可能会让工作更快,却削弱合作。深思熟虑地使用 AI,它可以成为一种新的协调架构:既提升集体判断,也保留让协作成为可能的人类信号。

目标并不是默认更快地工作。目标是设计得更好的合作。

参考文献