BemoDB 2.0

Back

最近实习接手了一个 Agent 项目,不过我之前从来没接触过实际的 Agent 应用开发(完全小白),所以萌生了学一些相关知识的念头,打算写一点文章记录和沉淀下来。


在制造某个工具前,我们必须先说清楚这个工具能解决的问题是什么。我认为目前 Agent 解决的是「在允许非幂等操作的某些场景下,能接受有一定偏差的、可预测的返回结果」的复杂问题,例如最常见的编码任务,我们只需要任务的完成,不需要太关注编码的具体实现;又例如日报,我们允许 Agent 返回一个它决策和加工出来的日报,只要这个结果达到人所给出的某个预期或者标准即可。

仔细想想,这实际上就是老板-员工的模式,老板说你今天得给我一个完整的 xxx 方案,员工就去自主规划-调用工具(可能是 agent)-完成任务-返回结果。这个方案就是一个可以有一定偏差的、但是(可能)处于预期范围内的结果。

Agent 并未拥有一个业界内的统一定义,不过大部分机构认为 Agent 是一个「能够独立行动、使用工具、规划并执行复杂任务的系统」。


以各类 LLM 作为基底,目前市面上有这么几种常见的系统:

  • augmented LLM

    通常是单次模型调用,但是并非裸 LLM 调用,而是有一定的封装,例如我们使用的 ChatGPT 网页、DeepSeek 网页、豆包,它们的工作流程都是「用户发起一次问题,LLM 回答一次问题」,它们带有记忆、工具、检索上的增强,以及一些输入检测等等。

  • workflow

    常见的如 Dify、Coze、n8n,都属于这类范畴,我们使用代码去预定义路径,从而确定任务更稳定、更可控。例如日报,我们可以拆分为这么几步:收集信息-加工信息-返回信息,每个步骤又能写出一些更小的精确步骤,这种时候,采用 workflow 就很不错。

  • agent

    workflow 是通过代码编排 LLM 和工具的系统,而 agent 则是由 LLM 动态引导工具使用和自身流程。面对 1. 步骤数不确定 2. 可能需要动态选择工具 3. 中途根据观察结果改变计划这种开放式任务,agent 则更灵活。例如最常见的编码任务,我们想要一个 todolist,在这里做编排是成本大于收益的(除了复杂架构任务)。

如果结合 Anthropic 的 Building Effective Agents 来看,上面这三类还可以再拆得更细一点。Anthropic 的一个核心观点是:不要一上来就做“全自动 Agent”,而是先从最简单、最便宜、最可控的方案开始,只有当单次调用不够用时,才逐步增加复杂度。

再把“模式”讲白一点#

简单来说,Anthropic 那篇文章其实是在提醒大家:很多问题并不需要一上来就上一个“全自动 Agent”。很多时候,一个带检索或工具的大模型、一个固定的 workflow,甚至只是把任务拆成几步串起来,就已经够用了。只有当任务本身足够开放、步骤不确定、需要中途根据反馈不断调整路线时,Agent 的价值才真正开始体现出来。

如果再结合 Lilian Weng 的 LLM Powered Autonomous Agents 来看,Agent 的核心无非也就是几件事:先理解目标、再做规划、过程中调用外部工具、必要时保留记忆,并根据执行结果不断调整下一步。换句话说,Agent 并不是某个突然冒出来的新物种,而是把“大模型 + 工具 + 记忆 + 反馈循环”更系统地拼在一起。


然后我们回到目前国内就业市场里的职位 JD,拿两个例子,看看 agent 开发到底要干嘛:

某节:

  1. 本科及以上学历,计算机及相关专业;
  2. 熟悉至少一门编程语言,包括但不仅限于 Java/Objective-C/C/C++/Python/Go/JS 等;
  3. 熟悉 AI Agent 相关技术,了解工具开发、Agent 流程设计、评估系统、上下文工程等体系;了解主流 AI 模型及其应用场景,有从 0-1 搭建 AI Agent 应用经验者优先,能够独立完成 Agent 应用的设计、开发和部署工作;
  4. 熟悉一般性架构设计思想,包括不限于服务化、异步、高可用、可扩展等;良好的服务可靠性意识,包括不限于监控、容灾等;
  5. 良好的业务理解抽象和问题解决能力,优秀的团队协作能力;
  6. 研发效能相关方向研发经验者优先。

某鹅:

  1. 负责 AI Agent 工作流的设计与研发,落地生图、生视频等业务场景的端到端自动化流程;
  2. 基于 LLM(GPT/Claude/DeepSeek/混元等)构建 Agent 的任务规划、工具调用、记忆管理、多轮决策能力;
  3. 使用 Go/Python 构建高并发 Agent 服务框架与调度系统(任务编排、工作流引擎、队列消费、稳定性治理);
  4. 对接算法,完成生图/生视频模型的能力对接、Prompt 工程与效果调优;
  5. 设计并实现 Agent 编排框架(Workflow/DAG/多 Agent 协作),支持复杂创作链路(脚本→分镜→生图→生视频→剪辑合成);
  6. 持续优化 Function Calling、Tool Use、RAG 检索、上下文管理等核心模块,提升 Agent 稳定性与生成质量;
  7. 配合产品/算法团队完成效果评估、badcase 分析与迭代。

这些 JD 看起来很唬人,但如果翻译成人话,其实就是:你不只是要“会调模型”,你还得会把模型放进一个真实系统里,让它能拿到信息、调用工具、在失败时重试、在关键节点让人接管,并且最终对业务结果负责。

之前在L站和一个佬友讨论了一下,他回复「在业务场景下,其实可以理解为原来必须用规则进行内容清洗、利用规则去硬套模版生成的活交给llm了,这样对于开发者而言,只用维护简单的数据获取,在业务场景下可以仔细研磨output以达到给用户返回的内容最优,这个才是agent最大的优势」

Agent 的未来#

我觉得 Agent 的未来大概不会是“一个万能数字员工立刻接管所有工作”,而更像是一种逐步嵌进真实业务流程的能力。它会先在那些目标明确、反馈清晰、结果相对容易验证的场景里落地,比如编码、检索分析、客服、报表处理,然后再慢慢往更复杂的链路里渗透。

真正决定 Agent 能不能跑起来的,可能也不会只是模型本身有多强,而是工具接口设计得好不好、记忆系统稳不稳定、权限边界清不清楚、失败之后有没有兜底。换句话说,未来的重点不只是“让模型更聪明”,而是“让模型在现实系统里更可靠地做事”。

所以如果让我现在用一句话总结:Agent 的未来不是单纯追求更强的自主性,而是在可控前提下,把模型的行动能力真正接到现实系统里。

总结一下,就是将 Agent 落地到业务某一环中,并做好 Agent 的定制化和工程化,确保该 Agent 能稳定完成业务目标。

agentGo*001 | 方法论和原因
https://astro-pure.js.org/blog/2026/agentgo/001
Author Bolaxious
Published at May 15, 2026