让 AI 像人一样思考与行动

前言

“让 AI 像人一样思考、执行。”

这是我在调试代码，试图优化我的 Agent 时，Gemini 3 Pro 在对话中偶然提到的一句话。

那一刻，我盯着屏幕，心里突然动了一下。这种感觉很难描述，既不是那种“改变世界”的宏大叙事，也不是解决了一个 Bug 的短暂快感。而是一种久违的、确信自己“走在正确的路上”的踏实感。

作为一个在行业里摸爬滚打多年的工程师，我做过 UEBA，搞过数据安全。说实话，过去很多时候，我对自己工作的价值是存疑的。很多项目，核心驱动力不是技术创新，而是销售关系；我们要做的不是解决实际问题，而是堆砌出一张张好看的大屏，去适配各种私有协议，去应对无休止的日志格式对接。那时候，我觉得自己不像是个工程师，更像是个装修工。

直到我开始接触数字人和 Agent 开发，我才慢慢的有一些价值感。当我看着 Agent 按照我的规划，一步步拆解任务，去感知环境，去执行操作，我能清晰地感觉到：这段代码是有生命力的，它真的在代替人去解决问题。

哪怕现在它还很笨拙，经常犯错，经常需要我去修修补补，但这股劲儿是对的。

一、什么是“像人一样”？

抛开那些高大上的学术定义，在我这个工程实践者的眼里，这事儿其实就两块：

思考（脑子）： 不是说这 AI 有多聪明能做微积分，而是它得有“常识”。它得知道接到一个任务后，先干什么后干什么；遇到不懂的，知道去查或者是反问；干错了，知道停下来想一想，而不是一条道走到黑。这更像是一个认知架构，而不只是一个语言模型。
执行（手脚）： 这是 AI 和现实世界的触点。不管是调一个天气 API，还是去数据库里查数，或者是操控浏览器点个按钮，这就是落地。

只有脑子没有手脚，那是“纸上谈兵”；只有手脚没有脑子，那是“傻瓜脚本”。我们要做的，就是把这两者粘合起来，让它成为一个能干活的“数字员工”。

二、既然大模型这么强了，还要我们干什么？

这也是我经常问自己的问题。现在大模型迭代速度这么快，今天我费劲写的 Prompt，明天可能模型升级自带这能力了。那我们的壁垒在哪里？我们会不会被降维打击？

慢慢地我想通了：大模型解决的是“通用”问题，我们解决的是“落地”问题。

现实世界是脏乱差的。
公司里的数据库可能根本没有文档，字段名全是缩写；
内部的 API 经常更新，还没有明确的报错信息；
业务逻辑充满了各种“潜规则”和特例。

这些“脏活累活”，大模型是看不见的，也没法替你干。

一个通用的“自然语言转 SQL”模型，可能写不出适配你们公司那个因为历史原因分了 10 张表的查询语句。这就需要我们去搭桥。我们需要处理意图识别的偏差、设计重试机制、清洗杂乱的数据、处理权限和网络问题。

我们不是在和模型竞争智商，我们是在用工程能力，帮模型填补通往现实世界的“最后一公里”坑洞，建立起真实世界与模型的桥梁。

三、也是一种自我反思

现在的 Agent 开发，说实话，还在草莽阶段。

没有什么圣经般的最佳实践。我现在的很多做法，可能过两个月回头看就是错的。
比如，为了任务完成，我将提示词堆砌的很长，为了应付不同的场景，我在通用的代码里加上各种边界判断和修复。

我慢慢觉得，与其写一段几千字的“神级提示词”祈祷 AI 一次性把活儿干完美，不如把任务拆成十个小步骤，每一步都只让 AI 做最简单的选择。用死代码的逻辑去包裹 AI 的不确定性，用繁琐的流程去换取结果的稳定。在实践的过程中，我也突然想到，是否可以使用已执行过的任务，来给当前的任务做参考呢？这个是我后面要研究的一个方向，我觉得经验学习这个对人来说很重要，那么对于要不断执行任务的 Agent 来说，经验也很重要。

这篇博客，更像是我给自己立的一个 flag，也是一个开始。

在这个系列里，我不想扯什么高深的概念，因为很多我也还在摸索。我只想记录下一个真实的从业者，在面对具体问题时是怎么想的，坑是怎么踩的，路是怎么蹚出来的。

可能关于 Agent 的架构设计，关于记忆管理，关于未来可能涉及的具身智能，我现在的想法还不成熟，但我不怕把这些不成熟展示出来。

毕竟，在一条通往新世界的路上，只要在往前走，就不丢人。

希望遇到更多志同道合的朋友，一起 Build Agent，让 AI 像人一样思考行动，真正的为社会发挥价值。

共勉。

让 AI 像人一样思考与行动

前言

一、 什么是“像人一样”？

二、 既然大模型这么强了，还要我们干什么？

三、 也是一种自我反思

一、什么是“像人一样”？

二、既然大模型这么强了，还要我们干什么？

三、也是一种自我反思