让 AI 像人一样思考与行动
让 AI 像人一样思考与行动
前言
“让 AI 像人一样思考、执行。”
这是我在调试代码,试图优化我的 Agent 时,Gemini 3 Pro 在对话中偶然提到的一句话。
那一刻,我盯着屏幕,心里突然动了一下。这种感觉很难描述,既不是那种“改变世界”的宏大叙事,也不是解决了一个 Bug 的短暂快感。而是一种久违的、确信自己“走在正确的路上”的踏实感。
作为一个在行业里摸爬滚打多年的工程师,我做过 UEBA,搞过数据安全。说实话,过去很多时候,我对自己工作的价值是存疑的。很多项目,核心驱动力不是技术创新,而是销售关系;我们要做的不是解决实际问题,而是堆砌出一张张好看的大屏,去适配各种私有协议,去应对无休止的日志格式对接。那时候,我觉得自己不像是个工程师,更像是个装修工。
直到我开始接触数字人和 Agent 开发,我才慢慢的有一些价值感。当我看着 Agent 按照我的规划,一步步拆解任务,去感知环境,去执行操作,我能清晰地感觉到:这段代码是有生命力的,它真的在代替人去解决问题。
哪怕现在它还很笨拙,经常犯错,经常需要我去修修补补,但这股劲儿是对的。
一、 什么是“像人一样”?
抛开那些高大上的学术定义,在我这个工程实践者的眼里,这事儿其实就两块:
- 思考(脑子): 不是说这 AI 有多聪明能做微积分,而是它得有“常识”。它得知道接到一个任务后,先干什么后干什么;遇到不懂的,知道去查或者是反问;干错了,知道停下来想一想,而不是一条道走到黑。这更像是一个认知架构,而不只是一个语言模型。
- 执行(手脚): 这是 AI 和现实世界的触点。不管是调一个天气 API,还是去数据库里查数,或者是操控浏览器点个按钮,这就是落地。
只有脑子没有手脚,那是“纸上谈兵”;只有手脚没有脑子,那是“傻瓜脚本”。我们要做的,就是把这两者粘合起来,让它成为一个能干活的“数字员工”。
二、 既然大模型这么强了,还要我们干什么?
这也是我经常问自己的问题。现在大模型迭代速度这么快,今天我费劲写的 Prompt,明天可能模型升级自带这能力了。那我们的壁垒在哪里?我们会不会被降维打击?
慢慢地我想通了:大模型解决的是“通用”问题,我们解决的是“落地”问题。
现实世界是脏乱差的。
公司里的数据库可能根本没有文档,字段名全是缩写;
内部的 API 经常更新,还没有明确的报错信息;
业务逻辑充满了各种“潜规则”和特例。
这些“脏活累活”,大模型是看不见的,也没法替你干。
一个通用的“自然语言转 SQL”模型,可能写不出适配你们公司那个因为历史原因分了 10 张表的查询语句。这就需要我们去搭桥。我们需要处理意图识别的偏差、设计重试机制、清洗杂乱的数据、处理权限和网络问题。
我们不是在和模型竞争智商,我们是在用工程能力,帮模型填补通往现实世界的“最后一公里”坑洞,建立起真实世界与模型的桥梁。
三、 也是一种自我反思
现在的 Agent 开发,说实话,还在草莽阶段。
没有什么圣经般的最佳实践。我现在的很多做法,可能过两个月回头看就是错的。
比如,为了任务完成,我将提示词堆砌的很长,为了应付不同的场景,我在通用的代码里加上各种边界判断和修复。
我慢慢觉得,与其写一段几千字的“神级提示词”祈祷 AI 一次性把活儿干完美,不如把任务拆成十个小步骤,每一步都只让 AI 做最简单的选择。用死代码的逻辑去包裹 AI 的不确定性,用繁琐的流程去换取结果的稳定。在实践的过程中,我也突然想到,是否可以使用已执行过的任务,来给当前的任务做参考呢?这个是我后面要研究的一个方向,我觉得经验学习这个对人来说很重要,那么对于要不断执行任务的 Agent 来说,经验也很重要。
这篇博客,更像是我给自己立的一个 flag,也是一个开始。
在这个系列里,我不想扯什么高深的概念,因为很多我也还在摸索。我只想记录下一个真实的从业者,在面对具体问题时是怎么想的,坑是怎么踩的,路是怎么蹚出来的。
可能关于 Agent 的架构设计,关于记忆管理,关于未来可能涉及的具身智能,我现在的想法还不成熟,但我不怕把这些不成熟展示出来。
毕竟,在一条通往新世界的路上,只要在往前走,就不丢人。
希望遇到更多志同道合的朋友,一起 Build Agent,让 AI 像人一样思考行动,真正的为社会发挥价值。
共勉。
