当前位置:首页-文章-AI观点-正文

从工作流到智能体:乃不知有汉,无论魏晋。

关注启职鹿公众号
智能体技术正在从实验室走向主流,从Manus到Claude,从工作流到自主系统,我们正见证AI从被动响应工具向主动执行伙伴的转变。正如计算机从大型机到个人电脑的演变彻底改变了我们的工作和生活方式,智能体的普及也可能带来类似规模的变革。那些能够理解并把握这一趋势的人,将在新时代中占据先机。

为什么现在谈智能体

周一早晨,你打开电脑,发现一份完整的周报已经准备好了——包含上周的数据分析、本周的会议安排,甚至还有一段简短的视频总结。

这不是你的助理完成的,而是你的AI智能体。它不仅理解了你的需求,还独立执行了一系列复杂任务,从数据收集到内容创作,最终交付了成果。

这不再是科幻,而是我们正在进入的智能体时代。

过去两年,我们见证了大语言模型(LLM)的爆炸性发展。从ChatGPT到DeepSeek,这些模型已经改变了我们与信息交互的方式。

但现在,我们正站在下一个转折点:从被动回应的AI助手到主动执行的AI智能体(Agent)的转变。

本篇文章将探讨这一转变背后的技术趋势、商业逻辑和未来可能性,帮助你理解为什么智能体可能成为AI发展的下一个主战场,以及现在到了什么阶段。

一、从助手到智能体:定义的演变

什么是真正的智能体?

Anthropic(Claude的开发公司)对智能体的定义非常清晰:

"智能体是能够动态指导自己的过程和工具使用,控制完成任务方式的系统。"

这与传统AI助手有本质区别。助手提供信息和建议,而智能体则能够执行。更重要的是,智能体能够自主规划、调用工具、验证结果,形成一个完整的执行闭环。

两种架构路线

目前,智能体开发主要有两种架构路线:

  1. 工作流(Workflow)架构- 通过预定义的代码路径编排LLM和工具,类似于复杂的自动化脚本。
  2. 真正的智能体架构- LLM动态指导自己的过程和工具使用,保持对任务完成方式的控制。

这种区别不仅是技术实现上的差异,更反映了对AI能力的不同理解。

工作流架构将AI视为可编排的组件,而智能体架构则赋予AI更多自主性。

二、技术基础:智能体的构建模块

基础构建块:增强型LLM

智能体的基础是增强型LLM,它具备以下核心能力:

  • 检索增强:能够访问和处理外部知识
  • 工具使用:能够调用和使用各种工具
  • 记忆机制:能够记住上下文和历史交互

这些能力通过各种协议实现,如Model Context Protocol(MCP),它允许模型与外部工具和资源无缝集成。

工作流模式

Anthropic总结了几种常见的工作流模式:

  1. 提示链(Prompt Chaining):将任务分解为连续步骤
  2. 路由(Routing):根据输入类型将任务分发到专门处理器
  3. 并行化(Parallelization):同时处理多个子任务
  4. 编排者-工作者(Orchestrator-Workers):中央LLM分解任务并委派给专门工作者
  5. 评估者-优化者(Evaluator-Optimizer):一个LLM生成响应,另一个提供评估和反馈

这些模式可以组合使用,形成复杂的工作流系统。

从工作流到智能体:乃不知有汉,无论魏晋。 - 第1张

自主智能体架构

真正的自主智能体超越了工作流,它能够:

  1. 理解复杂输入并制定计划
  2. 使用工具获取"地面真相"
  3. 根据环境反馈调整计划
  4. 在关键点请求人类反馈
  5. 在完成任务或达到停止条件时终止

这种架构使智能体能够处理开放性问题,而不仅限于预定义路径。

从工作流到智能体:乃不知有汉,无论魏晋。 - 第2张

三、从理论到实践:Manus的横空出世

从工作流到智能体:乃不知有汉,无论魏晋。 - 第3张

Manus:智能体的里程碑

2025年3月5日,中国团队Monica.im发布了Manus,被称为全球首款通用型AI智能体。其名称源自拉丁语"Mens et Manus"(手脑并用),强调将大模型的逻辑推理能力转化为实际生产力。直接从"建议生成"到"成果交付"。

技术架构与创新

Manus采用多智能体架构(Multiple Agent Architecture),包括三个核心模块:

  1. 规划代理:负责任务分解和策略制定
  2. 执行代理:调用工具链完成具体任务
  3. 验证代理:检查结果准确性并提供反馈

这种架构使Manus能够处理高度复杂的任务,在GAIA基准测试中,其任务复杂度完成率达78%,超越了OpenAI的同类产品。

应用场景与实际效果

Manus展示了跨领域的应用能力:

  • 人力资源:自动筛选简历,生成候选人排名报告
  • 金融投资:分析股票相关性,生成可视化投资报告
  • 房地产:房源搜索、社区安全与学区分析
  • 教育:创建教学动画、PPT及课程笔记
  • 多媒体内容创建:自主生成视频演示材料

特别值得注意的是其视频生成能力,Manus能够根据用户指令自动收集素材、编写脚本,并生成带音效的高分辨率视频,这标志着智能体从文本生成向多模态内容创作的扩展。

四、更广阔的视角:模型即产品的趋势

从API到专用模型的转变

与Manus的发展相呼应,AI行业正经历一个从"应用层为王"到"模型即产品"的范式转变。这一趋势由三个关键因素驱动:

  1. 通用模型扩展遇到瓶颈:计算成本呈几何级增长,而能力提升却是线性的
  2. 定向训练效果超出预期:专门训练的模型在特定任务上表现优异
  3. 推理成本大幅下降:使得部署专用模型变得经济可行

这意味着未来的AI产品可能不再是通用模型的简单包装,而是为特定任务专门训练的模型。

价值链的重构

这一趋势正在重构AI行业的价值链:

  • 模型提供商正向应用层扩展,试图获取更多价值
  • 应用开发者面临"训练或被训练"的选择
  • 投资重点需要从纯应用层转向模型训练能力

正如一位业内人士预测:"所有封闭AI模型提供商将在未来2-3年内停止销售API。"这意味着仅依赖API调用的应用可能面临生存挑战。

五、构建智能体的实用指南

何时使用智能体

智能体强大但并非万能。Anthropic建议:

  1. 从简单解决方案开始:单一LLM调用加上检索和示例通常已足够
  2. 仅在必要时增加复杂性:智能体通常会增加延迟和成本
  3. 选择合适的架构
    • 对于定义明确的任务,使用工作流
    • 对于需要灵活性和模型驱动决策的场景,使用智能体

实施最佳实践

构建有效智能体的三个核心原则:

  1. 保持简单:避免不必要的复杂性
  2. 确保透明:明确展示智能体的规划步骤
  3. 精心设计工具接口:通过全面的文档和测试确保工具可用性

这些原则帮助开发者避免常见陷阱,如过度工程化和难以调试的复杂系统。

工具集成:MCP的实践

Model Context Protocol(MCP)提供了一种标准化方式来扩展模型能力。

例如,Claude桌面应用程序通过MCP支持文件系统访问。

这使Claude能够读取、写入和搜索文件,大大扩展了其实用性。开发者可以构建自己的MCP服务器,为模型添加新能力,如天气查询、数据库访问等。

六、未来展望:智能体的演进路径

技术发展趋势

智能体技术可能沿着以下方向发展:

  1. 能力内化:更多能力将被直接训练进模型,减少外部依赖
  2. 多模态融合:视觉、语音和文本能力的无缝整合
  3. 自主性增强:更长的规划范围和更复杂的决策能力
  4. 个性化适应:根据用户偏好和历史交互调整行为

这些趋势将使智能体变得更加强大、灵活和个性化。

商业模式演变

随着技术发展,商业模式也将演变:

  1. 从API到产品:专用智能体将作为完整产品销售
  2. 垂直整合:模型提供商将向应用层扩展
  3. 新型中间件:专注于训练和优化的中间层将出现
  4. 开源与闭源的动态平衡:开源模型将推动创新,闭源模型将追求差异化

这种演变将重塑AI产业的竞争格局和价值分配。

社会影响

智能体的普及将带来深远的社会影响:

  1. 工作转型:从执行任务到监督智能体
  2. 技能重新定义:与智能体协作将成为核心技能
  3. 隐私与安全挑战:自主系统带来新的风险维度
  4. 数字鸿沟:智能体使用能力可能成为新的不平等来源

这些影响需要社会各界共同关注和应对。

结语:智能体时代的机遇与挑战

智能体技术正在从实验室走向主流,从Manus到Claude,从工作流到自主系统,我们正见证AI从被动响应工具向主动执行伙伴的转变。

对于开发者,这意味着需要掌握新的技能和思维模式;

对于企业,这意味着重新思考AI战略和投资重点;

对于个人用户,这意味着学习与这些新型数字伙伴协作的方式。

正如计算机从大型机到个人电脑的演变彻底改变了我们的工作和生活方式,智能体的普及也可能带来类似规模的变革。那些能够理解并把握这一趋势的人,将在新时代中占据先机。

智能体时代已经黎明,而这仅仅是开始。

本文"从工作流到智能体:乃不知有汉,无论魏晋。"内容源自"洞见yimo",由鹿小编发布。
所表达观点仅代表原作者,与启职鹿官方立场无关。 如需转载,请务必与原作者取得联系。若您发现该文章对您的权益有所侵犯,请立即通知我们,我们将迅速进行修正或删除处理。
同时,启职鹿诚邀您加入我们的平台,共享您的见解与思考,携手促进职场技能的提升。