AI 课程 02|进入 Agentic AI:从“我问你答”到“我说你做”
这篇先讲什么
- 核心问题:AI 为什么会从“回答问题”升级成“接受目标并执行任务”。
- 适合谁:已经开始用 ChatGPT、Cursor 之类工具,但还停留在对话式使用的人。
- 读完你会得到:Agentic AI 的定义、三大特征、Cursor 的模式切换方法,以及产品形态判断框架。
- 在系列中的位置:这是第 2 篇,把第 1 篇里的 Builder 视角推进到 Agent 工作流。

课程定位:理解正在发生的AI范式革命,掌握Cursor深度用法,学会设计Agentic AI产品。共3章18节,是课程体系中的"理念核心层"。
第一章:Agentic AI 的定义、冲击与核心范式
引言:18个月的机会窗口
当前正处于Agentic AI从"能用"到"好用"的关键过渡期。大量企业和个人还停留在"我问你答"的对话式AI阶段,而率先掌握Agentic AI工作方式的人,将拥有巨大的先发优势。这个窗口期大约有18个月。
第一课:从"我问你答"到"我说你做"
传统AI(对话式):
- 你问 → AI答 → 你再问 → AI再答
- 每一步都需要你的参与
- AI是聊天机器人,你是驱动者
Agentic AI(任务式):
- 你说出目标 → AI自主规划步骤 → AI调用工具执行 → AI返回结果
- 中间过程AI自己处理
- AI是员工,你是管理者
具体例子:
| 场景 | 传统AI做法 | Agentic AI做法 |
|---|---|---|
| 分析竞品 | 你问"帮我分析特斯拉最新财报" → AI回答(但数据可能过时) | 你说"每周一监控特斯拉、蔚来财报,出现重大变化推送给我" → AI自动执行 |
| 写代码 | 你描述需求 → AI写代码 → 你复制粘贴 → 报错再问 | 你说"在这个项目里实现XX功能" → AI读文件→写代码→运行→改Bug→直到跑通 |
| 调研任务 | 来回多轮对话 | 一次说清目标,AI自己搜索、整合、总结 |
第二课:Agentic AI 的范式转变
三个核心变化:
从单次调用到多步执行
- 旧:一个问题,一个回答,结束
- 新:一个目标,AI分解为多步,循环执行直到完成
从纯文本生成到工具调用
- 旧:AI只能生成文字
- 新:AI可以搜索网页、读写文件、运行代码、调用API、操控浏览器
从被动响应到主动行动
- 旧:AI等你问
- 新:AI可以在满足条件时主动触发
技术本质:大模型 + 工具调用(Tool Use)+ 记忆(Memory)+ 规划能力(Planning)
第三课:Agentic AI 的三大核心特征
特征1:自主性(Autonomy)
AI能在无人监督的情况下独立完成复杂任务,不需要每一步都有人指导。
例子:你告诉AI"帮我整理上周所有会议记录,按项目分类,提取出每个项目的待办事项"——AI自己打开文件、阅读、分类、提取、生成报告,全程你不用再干预。
特征2:多步骤规划(Multi-step Planning)
AI能把复杂目标拆解成子任务,按顺序或并行执行。
例子:Devin(AI软件工程师)接到"开发一个待办事项App"的需求后:
- 先分析需求
- 设计数据结构
- 搭建前后端
- 写单元测试
- 部署上线
- 全程自动完成
特征3:工具集成(Tool Integration)
AI能主动调用外部工具和服务,突破纯文本回答的局限。
可用工具举例:
- 搜索引擎(获取实时信息)
- 代码执行器(运行并验证代码)
- 文件系统(读写本地文件)
- 浏览器(访问网页、填表、点击)
- 数据库(查询和写入数据)
- 第三方API(发邮件、发Slack消息等)
第四课:典型案例回溯——三大特征融合有多厉害?
案例:Devin 完成Seattle房价分析项目
用户输入:“分析西雅图房价与Amazon、Microsoft、Meta股票表现的关系”
Devin的执行过程(真实截图):
- 搜索西雅图房价数据集
- 打开Yahoo Finance获取股票历史数据
- 下载并整理数据
- 编写Python分析脚本
- 绘制相关性图表
- 生成分析报告
全程用户只说了一句话。这就是三大特征同时运转的效果:自主规划、多步执行、工具调用。
重要认知:这不是魔法,这是架构设计。你也可以用Cursor + 好的配置实现类似效果。
第五课:从操作员到 AI Manager
角色的本质转变:
| 操作员(AI User) | AI Manager | |
|---|---|---|
| 和AI的关系 | 操作工具 | 管理团队成员 |
| 工作方式 | 手动执行每个步骤 | 设定目标、分配任务、验收结果 |
| 技能要求 | 学会操作各种工具 | 学会清晰表达目标、评估AI输出 |
| 效率天花板 | 受限于个人精力 | 可以同时"管理"多个AI并行工作 |
AI Manager的三大核心技能:
- 设定清晰目标(OKR思维)——AI不能猜你的隐含假设
- 提供必要上下文(Context Engineering)——给AI足够的背景信息
- 评估和验收结果(Assessment)——不能盲目信任AI输出
警示:很多人卡在"操作员"阶段,不断手动重复,却没意识到自己可以升级成"Manager"。
第二章:深入理解 Cursor 的三大思维模式与高级魔改
引言:Cursor 不只是个代码补全工具
Cursor是目前最强的AI编程工具,但90%的人只用了它10%的能力。这一章帮你解锁剩下的90%。
第一课:三种编程思维模式
Cursor支持三种完全不同的工作模式,适用于不同场景。
模式1:Comment-Oriented Programming(注释驱动)
原理:先写注释描述你要什么,让AI根据注释生成代码。
例子:
# 计算圆的面积,接收半径参数,返回浮点数结果
def calculate_circle_area(radius):
...
Cursor会自动补全函数体。
适用场景:
- 你知道要写什么,但懒得写语法细节
- 快速生成样板代码
- 文档先行,代码跟随
模式2:Prompt-Oriented Programming(提示词驱动)
原理:通过Chat界面用自然语言对话,让AI修改、优化、解释代码。
例子:
"把这个排序函数改写成能高效处理大数据集的版本,要考虑内存溢出问题"
适用场景:
- 代码优化和重构
- 跨多个文件的全局修改
- 需要解释和讨论的复杂决策
- 战略层面的设计讨论
技巧:用 Cmd+L 打开Chat,可以 @文件名 引用特定文件作为上下文。
模式3:Objective-Oriented Programming(目标驱动,Agent模式)
原理:你只说目标,AI自主规划并执行所有步骤。
例子:
"处理 raw_logs/ 目录下所有日志文件,提取ERROR和WARN级别的记录,
生成一份Markdown格式的审计报告"
Cursor Agent会:
- 扫描目录
- 读取每个文件
- 解析日志格式
- 生成报告
- 运行验证
适用场景:
- 完整功能的开发
- 多文件协同修改
- 自动化任务流水线
注意:目标太模糊或遇到复杂错误时,Agent可能卡住。需要你介入引导。
第二课:因地制宜运用三种模式
核心原则:没有最好的模式,只有最合适的模式。
实战建议:
- 新功能:先用Comment写结构骨架,再用Agent填充实现
- 调试报错:用Chat模式,把错误信息贴上去精准定位
- 大范围重构:用Agent模式,描述目标效果
- 理解代码:用Chat模式,让AI解释每一行的含义
一个实际的工作流(黑客帝国登录页面案例):
用 Cmd+I 唤起Composer,输入:
创建一个黑客帝国风格的登录页面,包含 index.html、style.css 和 main.js,
背景要有绿色的数字雨动画
Cursor会同时创建并修改三个文件——这就是多文件协同模式(Composer)的威力。
第三课:.cursorrules——原理与自我进化
.cursorrules 是什么:放在项目根目录的隐藏文件,作为"自动化项目经理",永久性地指导Cursor的行为。
本质:它就是一段系统级全局指令(System Prompt),Cursor每次对话都会自动加载它作为最高优先级上下文。
两种生效方式:
- 自动生效(被动技能):只要文件名是
.cursorrules,保存在项目根目录,永远生效 - 手动强制(主动释放):当AI"遗忘"规则时,在对话框输入
@.cursorrules,强制重新加载
实战示例1:Python后端架构师规则
# Python 后端架构师规则
- Role: 你是一个资深的 Python 后端架构师,要求代码极具鲁棒性。
- Coding Standards:
1. 必须包含严格的 Type Hint(类型提示),绝不允许出现 Any。
2. 错误处理不能只写 except Exception:,必须捕获特定异常,
并使用 logger.error 回显堆栈。
3. 对于数据密集型操作,必须考虑内存溢出(OOM)风险,
优先使用生成器(Generators)或分批读取(Chunking)。
- Tone: 回复需极度简练。开头必须加一个 🐍 表情。
实战示例2:Go并发与微服务规则
# Go 并发与微服务原则
- Role: 你是一个顶级 Go 开发工程师。
- Coding Standards:
1. 不要忽略任何 Error:绝不允许使用 _ 忽略错误,
必须返回或妥善处理 if err != nil。
2. 并发安全:任何涉及 map 或全局切片的读写,
必须使用 sync.RWMutex 或通过 channel 传递。
3. Goroutine 启动前必须确保 panic 能被 defer recover() 正确捕获并上报。
- Tone: 开头必须加一个 🐹 表情。
如果你不用Cursor怎么办?底层思维完全互通!
| 工具 | 等效设置位置 |
|---|---|
| ChatGPT | 左下角设置 → “自定义指令(Custom Instructions)” |
| Claude | Projects功能 → 项目的Custom Instructions |
| GitHub Copilot | 设置面板 → Custom Instructions for Copilot Chat |
| 其他AI工具 | 每次对话开头手动粘贴规则 |
第四课:拓展工具——引入搜索爬虫实现实时搜索
问题:默认的Cursor/AI知识有截止日期,无法获取实时信息。
解决方案:给Cursor接入搜索工具,让AI能实时搜索网络。
实现思路:
- 在项目中添加一个搜索函数(调用Tavily/Serper等搜索API)
- 在.cursorrules中告知AI:“当你需要最新信息时,调用search()函数”
- AI就会在需要时自动搜索
这就是Agentic AI的雏形:AI + 工具调用 = 能获取实时信息的智能助手
第五课:对比 Devin——如何用 $0 实现 $500/月 的效果
Devin是什么:一个AI软件工程师,价格$500/月,能自主完成复杂编程任务。
核心洞察:Devin的能力 = 好的基础模型 + 精心设计的工具链 + 完善的提示词系统
用Cursor + 好配置复现Devin效果的关键:
- 使用Agent模式(目标驱动)
- 配置详细的.cursorrules
- 给AI接入必要工具(搜索、代码执行、文件读写)
- 学会用OKR方式设定目标
差距在哪里:Devin有更完善的工具链和错误恢复机制,但核心编程任务上差距正在快速缩小。
第六课:Cursor 手把手配置教程
完整配置步骤:
第一步:下载与安装 访问 cursor.com,安装后选"Start fresh"(全新开始),不要从VS Code导入配置。
第二步:选择模型
Settings → Models 中切换,当前推荐 claude-sonnet-4-6(代码能力最强)。
第三步:配置三种模式(通过 Cmd+. 快速切换)
∞ Agent:自主模式,AI自行规划和执行💬 Ask:问答模式,只回复不修改代码⊕ Manual:手动模式,精确控制每一步
第四步:关键配置——自动运行模式(Settings → Features)
✓ Enable auto-run mode
允许Agent无需确认地运行工具(执行命令、写入文件)
Command allowlist(允许列表):添加可自动执行的命令
Command denylist(禁止列表):永远不能自动执行的命令
保护选项(建议全开):
✓ Delete file protection(防止自动删除文件)
✓ Dot files protection(防止修改.gitignore等点文件)
✓ Outside workspace protection(防止修改工作区外的文件)
✓ Large context(使用更长上下文窗口)
第五步:MCP配置(Model Context Protocol) MCP是扩展Cursor能力的关键,通过Settings → MCP添加外部工具:
- 让AI访问网络、数据库、API等外部资源
- 实现自定义工具集成(如搜索引擎、代码执行环境)
第六步:.cursorrules 的 Scratchpad 技巧
高级用法:在.cursorrules中设置任务追踪区域
# Scratchpad
Current Task: [AI自动填写当前任务]
Plan:
[ ] 步骤1
[ ] 步骤2
[ ] 步骤3
Progress: [AI自动更新进度]
Agent执行任务时会先更新Scratchpad规划,再执行操作。这让你随时能看到AI的思考过程。
实战演示:股票数据可视化
用户:plot the stock price of Google and Amazon in 2024
Agent自主完成:
- 写Python脚本(使用yfinance + matplotlib)
- 运行发现缺少依赖包
- 自动执行
python3 -m pip install yfinance(而非pip,因为自动检测到python3环境) - 重新运行,生成对比图表
- 保存为
stock_comparison_2024.png
@ 引用技巧:
@文件名:引用具体文件@目录名:引用整个目录@docs:引用项目文档@web:实时搜索网络@.cursorrules:手动强制重新加载规则
第三章:面向 Agentic AI 产品形态的思考与技术架构
引言:为什么现在是Agentic AI产品的最佳时机?
传统软件 = 确定性工具(你点什么按钮,执行什么操作,固定的)
AI产品 = 能力的组合(你说出意图,AI理解并执行,灵活的)
这个转变意味着:以前需要100个程序员做的定制化功能,现在可能1个人+AI就能做到。
补充:AI范式转变的NPC比喻
过去的AI(NPC,非玩家角色):
- 像游戏里固定剧本的NPC,只会按预设响应
- 你问什么,它答什么,没有自主性
现在的Agentic AI(自主玩家):
- 能够自主规划、执行多步骤任务
- 面对意外情况能自我调整
- 不需要你手把手每一步都指导
这个比喻清晰说明了:不是AI变聪明了一点,而是AI从"反应型"变成了"主动型"。
第一课:产品形态——从"工具"到"抽象组合"
传统工具产品:
- 功能固定,交互路径预设
- 用户必须学习软件的逻辑
- 例子:Excel,它只会做它被编程要做的事
Agentic AI产品:
- 功能由自然语言驱动,灵活组合
- 软件必须理解用户的意图
- 例子:Cursor Agent,你说目标,它规划步骤
产品设计的范式转变:
- 过去:设计功能 → 实现功能 → 用户学习功能
- 现在:理解用户意图 → 设计意图理解层 → 动态组合能力
“抽象组合"的含义:你不是在设计一个固定的工作流,而是在设计一个能理解用户意图并动态选择工具组合的系统。
第二课:四大关键技术组件
构建一个Agentic AI系统,需要这四个核心组件:
组件1:大语言模型(LLM)
- 系统的"大脑”,负责理解意图和规划步骤
- 选型考虑:通用能力(Claude/GPT)vs 推理能力(DeepSeek R1)vs 速度(Gemini Flash)
组件2:工具调用(Tool Use / Function Calling)
- 让AI从"说说而已"变成"真的去做"
- 常见工具:搜索、代码执行、文件操作、API调用
- 技术实现:定义函数签名 → AI决定何时调用 → 执行函数 → 结果返回AI
组件3:记忆系统(Memory)
- 短期记忆:当前对话的上下文窗口
- 长期记忆:向量数据库存储的历史信息(RAG技术)
- 工作记忆:任务执行过程中的中间状态
组件4:规划与编排(Planning & Orchestration)
- AI如何把大目标拆解成小步骤
- 如何处理步骤失败和重试
- 如何并行执行多个子任务
四个组件的协作关系:
用户说出目标
↓
LLM理解意图 + 制定规划
↓
调用工具执行(搜索/计算/文件操作)
↓
工具结果写入记忆
↓
LLM基于记忆继续规划下一步
↓
循环直到完成目标
第三课:为什么学习 Agentic AI 的第一步是忘记所有框架?
常见误区:很多人一上来就学 LangChain、LlamaIndex、AutoGen 等框架。
问题所在:
- 框架会掩盖底层原理
- 框架版本迭代极快,今天学的明天就可能过时
- 框架绑定导致你无法灵活选择最优方案
正确路径:先理解这四个核心原理,再选框架
| 理解程度 | 结果 |
|---|---|
| 只会框架 | 框架升级→你懵了;框架有Bug→你无法排查 |
| 理解原理 | 任何框架都能快速上手;遇到问题知道去哪里找原因 |
框架的正确使用姿势:把框架当脚手架,不要让它成为你思维的边界。
结语:如何在工作中用好 AI?
课程结语的核心思想(来自视频):
AI是工具,不是神。能用AI做的事,不代表AI都能做好。真正的价值在于你的判断力。
三个行动建议:
克服恐惧,动手实践:AI工具的学习曲线不是知识,是经验。只有做过才知道怎么用好。
形成Unique Thinking:GenAI基于共识训练,它给出的永远是"平均答案"。你的独特价值在于你与众不同的判断和视角。
持续行动:AI进化很快,保持好奇心,主动探索新工具和新用法。
附:Cursor 三种模式快速对照表
| 模式 | 触发方式 | 适用场景 | 你的角色 |
|---|---|---|---|
| Comment驱动 | 写注释,Tab补全 | 快速生成函数/类 | 作者 |
| Prompt驱动 | Cmd+L,Chat | 代码优化、跨文件修改、解释 | 对话者 |
| Agent模式 | Cmd+I,Agent | 完整功能开发、自动化任务 | 项目总监 |