AI 课程 02｜进入 Agentic AI：从“我问你答”到“我说你做”

这篇先讲什么

核心问题：AI 为什么会从“回答问题”升级成“接受目标并执行任务”。
适合谁：已经开始用 ChatGPT、Cursor 之类工具，但还停留在对话式使用的人。
读完你会得到：Agentic AI 的定义、三大特征、Cursor 的模式切换方法，以及产品形态判断框架。
在系列中的位置：这是第 2 篇，把第 1 篇里的 Builder 视角推进到 Agent 工作流。

AI 课程 02 Agentic 框架图

课程定位：理解正在发生的AI范式革命，掌握Cursor深度用法，学会设计Agentic AI产品。共3章18节，是课程体系中的"理念核心层"。

第一章：Agentic AI 的定义、冲击与核心范式

引言：18个月的机会窗口

当前正处于Agentic AI从"能用"到"好用"的关键过渡期。大量企业和个人还停留在"我问你答"的对话式AI阶段，而率先掌握Agentic AI工作方式的人，将拥有巨大的先发优势。这个窗口期大约有18个月。

第一课：从"我问你答"到"我说你做"

传统AI（对话式）：

你问 → AI答 → 你再问 → AI再答
每一步都需要你的参与
AI是聊天机器人，你是驱动者

Agentic AI（任务式）：

你说出目标 → AI自主规划步骤 → AI调用工具执行 → AI返回结果
中间过程AI自己处理
AI是员工，你是管理者

具体例子：

场景	传统AI做法	Agentic AI做法
分析竞品	你问"帮我分析特斯拉最新财报" → AI回答（但数据可能过时）	你说"每周一监控特斯拉、蔚来财报，出现重大变化推送给我" → AI自动执行
写代码	你描述需求 → AI写代码 → 你复制粘贴 → 报错再问	你说"在这个项目里实现XX功能" → AI读文件→写代码→运行→改Bug→直到跑通
调研任务	来回多轮对话	一次说清目标，AI自己搜索、整合、总结

第二课：Agentic AI 的范式转变

三个核心变化：

从单次调用到多步执行
- 旧：一个问题，一个回答，结束
- 新：一个目标，AI分解为多步，循环执行直到完成
从纯文本生成到工具调用
- 旧：AI只能生成文字
- 新：AI可以搜索网页、读写文件、运行代码、调用API、操控浏览器
从被动响应到主动行动
- 旧：AI等你问
- 新：AI可以在满足条件时主动触发

技术本质：大模型 + 工具调用（Tool Use）+ 记忆（Memory）+ 规划能力（Planning）

第三课：Agentic AI 的三大核心特征

特征1：自主性（Autonomy）

AI能在无人监督的情况下独立完成复杂任务，不需要每一步都有人指导。

例子：你告诉AI"帮我整理上周所有会议记录，按项目分类，提取出每个项目的待办事项"——AI自己打开文件、阅读、分类、提取、生成报告，全程你不用再干预。

特征2：多步骤规划（Multi-step Planning）

AI能把复杂目标拆解成子任务，按顺序或并行执行。

例子：Devin（AI软件工程师）接到"开发一个待办事项App"的需求后：

先分析需求
设计数据结构
搭建前后端
写单元测试
部署上线
全程自动完成

特征3：工具集成（Tool Integration）

AI能主动调用外部工具和服务，突破纯文本回答的局限。

可用工具举例：

搜索引擎（获取实时信息）
代码执行器（运行并验证代码）
文件系统（读写本地文件）
浏览器（访问网页、填表、点击）
数据库（查询和写入数据）
第三方API（发邮件、发Slack消息等）

第四课：典型案例回溯——三大特征融合有多厉害？

案例：Devin 完成Seattle房价分析项目

用户输入：“分析西雅图房价与Amazon、Microsoft、Meta股票表现的关系”

Devin的执行过程（真实截图）：

搜索西雅图房价数据集
打开Yahoo Finance获取股票历史数据
下载并整理数据
编写Python分析脚本
绘制相关性图表
生成分析报告

全程用户只说了一句话。这就是三大特征同时运转的效果：自主规划、多步执行、工具调用。

重要认知：这不是魔法，这是架构设计。你也可以用Cursor + 好的配置实现类似效果。

第五课：从操作员到 AI Manager

角色的本质转变：

	操作员（AI User）	AI Manager
和AI的关系	操作工具	管理团队成员
工作方式	手动执行每个步骤	设定目标、分配任务、验收结果
技能要求	学会操作各种工具	学会清晰表达目标、评估AI输出
效率天花板	受限于个人精力	可以同时"管理"多个AI并行工作

AI Manager的三大核心技能：

设定清晰目标（OKR思维）——AI不能猜你的隐含假设
提供必要上下文（Context Engineering）——给AI足够的背景信息
评估和验收结果（Assessment）——不能盲目信任AI输出

警示：很多人卡在"操作员"阶段，不断手动重复，却没意识到自己可以升级成"Manager"。

第二章：深入理解 Cursor 的三大思维模式与高级魔改

引言：Cursor 不只是个代码补全工具

Cursor是目前最强的AI编程工具，但90%的人只用了它10%的能力。这一章帮你解锁剩下的90%。

第一课：三种编程思维模式

Cursor支持三种完全不同的工作模式，适用于不同场景。

模式1：Comment-Oriented Programming（注释驱动）

原理：先写注释描述你要什么，让AI根据注释生成代码。

例子：

# 计算圆的面积，接收半径参数，返回浮点数结果
def calculate_circle_area(radius):
    ...

Cursor会自动补全函数体。

适用场景：

你知道要写什么，但懒得写语法细节
快速生成样板代码
文档先行，代码跟随

模式2：Prompt-Oriented Programming（提示词驱动）

原理：通过Chat界面用自然语言对话，让AI修改、优化、解释代码。

例子：

"把这个排序函数改写成能高效处理大数据集的版本，要考虑内存溢出问题"

适用场景：

代码优化和重构
跨多个文件的全局修改
需要解释和讨论的复杂决策
战略层面的设计讨论

技巧：用 Cmd+L 打开Chat，可以 @文件名 引用特定文件作为上下文。

模式3：Objective-Oriented Programming（目标驱动，Agent模式）

原理：你只说目标，AI自主规划并执行所有步骤。

例子：

"处理 raw_logs/ 目录下所有日志文件，提取ERROR和WARN级别的记录，
生成一份Markdown格式的审计报告"

Cursor Agent会：

扫描目录
读取每个文件
解析日志格式
生成报告
运行验证

适用场景：

完整功能的开发
多文件协同修改
自动化任务流水线

注意：目标太模糊或遇到复杂错误时，Agent可能卡住。需要你介入引导。

第二课：因地制宜运用三种模式

核心原则：没有最好的模式，只有最合适的模式。

实战建议：

新功能：先用Comment写结构骨架，再用Agent填充实现
调试报错：用Chat模式，把错误信息贴上去精准定位
大范围重构：用Agent模式，描述目标效果
理解代码：用Chat模式，让AI解释每一行的含义

一个实际的工作流（黑客帝国登录页面案例）：

用 Cmd+I 唤起Composer，输入：

创建一个黑客帝国风格的登录页面，包含 index.html、style.css 和 main.js，
背景要有绿色的数字雨动画

Cursor会同时创建并修改三个文件——这就是多文件协同模式（Composer）的威力。

第三课：.cursorrules——原理与自我进化

.cursorrules 是什么：放在项目根目录的隐藏文件，作为"自动化项目经理"，永久性地指导Cursor的行为。

本质：它就是一段系统级全局指令（System Prompt），Cursor每次对话都会自动加载它作为最高优先级上下文。

两种生效方式：

自动生效（被动技能）：只要文件名是 .cursorrules，保存在项目根目录，永远生效
手动强制（主动释放）：当AI"遗忘"规则时，在对话框输入 @.cursorrules，强制重新加载

实战示例1：Python后端架构师规则

# Python 后端架构师规则

- Role: 你是一个资深的 Python 后端架构师，要求代码极具鲁棒性。
- Coding Standards:
  1. 必须包含严格的 Type Hint（类型提示），绝不允许出现 Any。
  2. 错误处理不能只写 except Exception:，必须捕获特定异常，
     并使用 logger.error 回显堆栈。
  3. 对于数据密集型操作，必须考虑内存溢出（OOM）风险，
     优先使用生成器（Generators）或分批读取（Chunking）。
- Tone: 回复需极度简练。开头必须加一个 🐍 表情。

实战示例2：Go并发与微服务规则

# Go 并发与微服务原则

- Role: 你是一个顶级 Go 开发工程师。
- Coding Standards:
  1. 不要忽略任何 Error：绝不允许使用 _ 忽略错误，
     必须返回或妥善处理 if err != nil。
  2. 并发安全：任何涉及 map 或全局切片的读写，
     必须使用 sync.RWMutex 或通过 channel 传递。
  3. Goroutine 启动前必须确保 panic 能被 defer recover() 正确捕获并上报。
- Tone: 开头必须加一个 🐹 表情。

如果你不用Cursor怎么办？底层思维完全互通！

工具	等效设置位置
ChatGPT	左下角设置 → “自定义指令（Custom Instructions）”
Claude	Projects功能 → 项目的Custom Instructions
GitHub Copilot	设置面板 → Custom Instructions for Copilot Chat
其他AI工具	每次对话开头手动粘贴规则

第四课：拓展工具——引入搜索爬虫实现实时搜索

问题：默认的Cursor/AI知识有截止日期，无法获取实时信息。

解决方案：给Cursor接入搜索工具，让AI能实时搜索网络。

实现思路：

在项目中添加一个搜索函数（调用Tavily/Serper等搜索API）
在.cursorrules中告知AI：“当你需要最新信息时，调用search()函数”
AI就会在需要时自动搜索

这就是Agentic AI的雏形：AI + 工具调用 = 能获取实时信息的智能助手

第五课：对比 Devin——如何用 $0 实现 $500/月的效果

Devin是什么：一个AI软件工程师，价格$500/月，能自主完成复杂编程任务。

核心洞察：Devin的能力 = 好的基础模型 + 精心设计的工具链 + 完善的提示词系统

用Cursor + 好配置复现Devin效果的关键：

使用Agent模式（目标驱动）
配置详细的.cursorrules
给AI接入必要工具（搜索、代码执行、文件读写）
学会用OKR方式设定目标

差距在哪里：Devin有更完善的工具链和错误恢复机制，但核心编程任务上差距正在快速缩小。

第六课：Cursor 手把手配置教程

完整配置步骤：

第一步：下载与安装 访问 cursor.com，安装后选"Start fresh"（全新开始），不要从VS Code导入配置。

第二步：选择模型 Settings → Models 中切换，当前推荐 claude-sonnet-4-6（代码能力最强）。

第三步：配置三种模式（通过 Cmd+. 快速切换）

∞ Agent：自主模式，AI自行规划和执行
💬 Ask：问答模式，只回复不修改代码
⊕ Manual：手动模式，精确控制每一步

第四步：关键配置——自动运行模式（Settings → Features）

✓ Enable auto-run mode
  允许Agent无需确认地运行工具（执行命令、写入文件）

Command allowlist（允许列表）：添加可自动执行的命令
Command denylist（禁止列表）：永远不能自动执行的命令

保护选项（建议全开）：
✓ Delete file protection（防止自动删除文件）
✓ Dot files protection（防止修改.gitignore等点文件）
✓ Outside workspace protection（防止修改工作区外的文件）
✓ Large context（使用更长上下文窗口）

第五步：MCP配置（Model Context Protocol） MCP是扩展Cursor能力的关键，通过Settings → MCP添加外部工具：

让AI访问网络、数据库、API等外部资源
实现自定义工具集成（如搜索引擎、代码执行环境）

第六步：.cursorrules 的 Scratchpad 技巧

高级用法：在.cursorrules中设置任务追踪区域

# Scratchpad

Current Task: [AI自动填写当前任务]

Plan:
[ ] 步骤1
[ ] 步骤2
[ ] 步骤3

Progress: [AI自动更新进度]

Agent执行任务时会先更新Scratchpad规划，再执行操作。这让你随时能看到AI的思考过程。

实战演示：股票数据可视化

用户：plot the stock price of Google and Amazon in 2024

Agent自主完成：

写Python脚本（使用yfinance + matplotlib）
运行发现缺少依赖包
自动执行 python3 -m pip install yfinance（而非pip，因为自动检测到python3环境）
重新运行，生成对比图表
保存为 stock_comparison_2024.png

@ 引用技巧：

@文件名：引用具体文件
@目录名：引用整个目录
@docs：引用项目文档
@web：实时搜索网络
@.cursorrules：手动强制重新加载规则

第三章：面向 Agentic AI 产品形态的思考与技术架构

引言：为什么现在是Agentic AI产品的最佳时机？

传统软件 = 确定性工具（你点什么按钮，执行什么操作，固定的）

AI产品 = 能力的组合（你说出意图，AI理解并执行，灵活的）

这个转变意味着：以前需要100个程序员做的定制化功能，现在可能1个人+AI就能做到。

补充：AI范式转变的NPC比喻

过去的AI（NPC，非玩家角色）：

像游戏里固定剧本的NPC，只会按预设响应
你问什么，它答什么，没有自主性

现在的Agentic AI（自主玩家）：

能够自主规划、执行多步骤任务
面对意外情况能自我调整
不需要你手把手每一步都指导

这个比喻清晰说明了：不是AI变聪明了一点，而是AI从"反应型"变成了"主动型"。

第一课：产品形态——从"工具"到"抽象组合"

传统工具产品：

功能固定，交互路径预设
用户必须学习软件的逻辑
例子：Excel，它只会做它被编程要做的事

Agentic AI产品：

功能由自然语言驱动，灵活组合
软件必须理解用户的意图
例子：Cursor Agent，你说目标，它规划步骤

产品设计的范式转变：

过去：设计功能 → 实现功能 → 用户学习功能
现在：理解用户意图 → 设计意图理解层 → 动态组合能力

“抽象组合"的含义：你不是在设计一个固定的工作流，而是在设计一个能理解用户意图并动态选择工具组合的系统。

第二课：四大关键技术组件

构建一个Agentic AI系统，需要这四个核心组件：

组件1：大语言模型（LLM）

系统的"大脑”，负责理解意图和规划步骤
选型考虑：通用能力（Claude/GPT）vs 推理能力（DeepSeek R1）vs 速度（Gemini Flash）

组件2：工具调用（Tool Use / Function Calling）

让AI从"说说而已"变成"真的去做"
常见工具：搜索、代码执行、文件操作、API调用
技术实现：定义函数签名 → AI决定何时调用 → 执行函数 → 结果返回AI

组件3：记忆系统（Memory）

短期记忆：当前对话的上下文窗口
长期记忆：向量数据库存储的历史信息（RAG技术）
工作记忆：任务执行过程中的中间状态

组件4：规划与编排（Planning & Orchestration）

AI如何把大目标拆解成小步骤
如何处理步骤失败和重试
如何并行执行多个子任务

四个组件的协作关系：

用户说出目标
    ↓
LLM理解意图 + 制定规划
    ↓
调用工具执行（搜索/计算/文件操作）
    ↓
工具结果写入记忆
    ↓
LLM基于记忆继续规划下一步
    ↓
循环直到完成目标

第三课：为什么学习 Agentic AI 的第一步是忘记所有框架？

常见误区：很多人一上来就学 LangChain、LlamaIndex、AutoGen 等框架。

问题所在：

框架会掩盖底层原理
框架版本迭代极快，今天学的明天就可能过时
框架绑定导致你无法灵活选择最优方案

正确路径：先理解这四个核心原理，再选框架

理解程度	结果
只会框架	框架升级→你懵了；框架有Bug→你无法排查
理解原理	任何框架都能快速上手；遇到问题知道去哪里找原因

框架的正确使用姿势：把框架当脚手架，不要让它成为你思维的边界。

结语：如何在工作中用好 AI？

课程结语的核心思想（来自视频）：

AI是工具，不是神。能用AI做的事，不代表AI都能做好。真正的价值在于你的判断力。

三个行动建议：

克服恐惧，动手实践：AI工具的学习曲线不是知识，是经验。只有做过才知道怎么用好。
形成Unique Thinking：GenAI基于共识训练，它给出的永远是"平均答案"。你的独特价值在于你与众不同的判断和视角。
持续行动：AI进化很快，保持好奇心，主动探索新工具和新用法。

附：Cursor 三种模式快速对照表

模式	触发方式	适用场景	你的角色
Comment驱动	写注释，Tab补全	快速生成函数/类	作者
Prompt驱动	Cmd+L，Chat	代码优化、跨文件修改、解释	对话者
Agent模式	Cmd+I，Agent	完整功能开发、自动化任务	项目总监

这篇先讲什么

第一章：Agentic AI 的定义、冲击与核心范式

引言：18个月的机会窗口

第一课：从"我问你答"到"我说你做"

第二课：Agentic AI 的范式转变

第三课：Agentic AI 的三大核心特征

特征1：自主性（Autonomy）

特征2：多步骤规划（Multi-step Planning）

特征3：工具集成（Tool Integration）

第四课：典型案例回溯——三大特征融合有多厉害？

第五课：从操作员到 AI Manager

第二章：深入理解 Cursor 的三大思维模式与高级魔改

引言：Cursor 不只是个代码补全工具

第一课：三种编程思维模式

模式1：Comment-Oriented Programming（注释驱动）

模式2：Prompt-Oriented Programming（提示词驱动）

模式3：Objective-Oriented Programming（目标驱动，Agent模式）

第二课：因地制宜运用三种模式

第三课：.cursorrules——原理与自我进化

第四课：拓展工具——引入搜索爬虫实现实时搜索

第五课：对比 Devin——如何用 $0 实现 $500/月 的效果

第六课：Cursor 手把手配置教程

第三章：面向 Agentic AI 产品形态的思考与技术架构

引言：为什么现在是Agentic AI产品的最佳时机？

补充：AI范式转变的NPC比喻

第一课：产品形态——从"工具"到"抽象组合"

第二课：四大关键技术组件

组件1：大语言模型（LLM）

组件2：工具调用（Tool Use / Function Calling）

组件3：记忆系统（Memory）

组件4：规划与编排（Planning & Orchestration）

第三课：为什么学习 Agentic AI 的第一步是忘记所有框架？

结语：如何在工作中用好 AI？

附：Cursor 三种模式快速对照表

第五课：对比 Devin——如何用 $0 实现 $500/月的效果