🤖 Agent Interview 100

AI Agent 知识库 — 100 个精选问题，以问题驱动学习，系统掌握 Agent 技术栈，同时搞定面试

✨ 项目亮点

🎯 问题驱动学习 — 每个问题就是一个学习入口，告诉你"该学什么"以及"为什么要学"，避免漫无目的地啃文档
📚 100 个精选问题 — 覆盖 AI Agent 技术栈的方方面面，从基础概念到生产实践，既是学习路线图，也是面试题库
🏗️ 11 大主题模块 — 系统化组织知识体系，循序渐进，形成完整的 Agent 知识图谱
🎯 三级难度分布 — 基础 (30%) · 中级 (50%) · 高级 (20%)，适配不同阶段的学习者
📝 统一四段式结构 — 每篇文章均包含：简短回答 → 详细解析 → 常见误区/面试追问 → 参考资料
💻 丰富的代码示例 — Python 实现、伪代码、架构图，理论与实践结合
🔬 前沿研究引用 — 引用最新论文与行业实践，紧跟技术前沿（含 Proactive Agent、RAG 评估指标等 2025 最新内容）

📖 目录结构

一、🏛️ Agent 架构 (`01-agent-architecture/`) — 9 题

Agent 系统的核心设计理念，从基本概念到生产级架构设计。

#	文章
001	什么是 LLM Agent？与传统 LLM 应用有何区别？
002	解释 Agent 的核心组件：感知、推理、行动、记忆
003	Agent 架构模式详解：ReAct、Plan-and-Execute、LATS、Proactive
005	如何设计一个分层 Agent 架构（Orchestrator / Worker 模式）？
006	Agent Loop 设计：循环控制、终止条件与错误恢复
007	Workflow vs Agent：什么时候用确定性工作流，什么时候用自主 Agent？
009	如何实现 Agent 的自我反思（Self-Reflection）和自我纠正？
010	生产级 Agent 系统设计（含智能客服实战案例）
108	面试追问链：从「什么是 Agent」到系统设计的 10 层递进追问

二、🔍 RAG (`02-rag/`) — 10 题

检索增强生成的全链路知识，从文档处理到评估优化（含 Context Relevancy、MRR、MAP 等评估指标）。

#	文章
011	什么是 RAG？它解决了 LLM 的哪些核心局限？
012	RAG Pipeline 的核心组件：Indexing、Retrieval、Generation
013	文档分块（Chunking）策略有哪些？各有什么优缺点？
014	向量数据库选型：Pinecone vs Weaviate vs Chroma vs Milvus
015	Embedding 模型选择与微调策略
016	混合检索：如何结合语义检索和关键词检索？
017	Re-ranking 的原理与实现：Cross-Encoder vs Bi-Encoder
018	什么是 Agentic RAG？它与传统 RAG 有何不同？
019	高级 RAG 变体：Corrective RAG、Self-RAG、Adaptive RAG
020	RAG 评估指标体系：原理、计算与实战

三、🔧 工具使用 (`03-tool-use/`) — 10 题

LLM 与外部工具的交互，从 Function Calling 到安全管控。

#	文章
021	什么是 Function Calling？它是如何工作的？
022	如何为 LLM 定义和描述工具（Tool Schema）？
023	Tool Use 的常见模式：API 调用、数据库查询、代码执行
024	如何设计 Tool Gateway 和工具权限管理？
025	工具选择策略：LLM 如何决定使用哪个工具？
026	如何处理工具调用失败和超时？
027	MCP（Model Context Protocol）是什么？它如何标准化工具集成？
028	并行工具调用 vs 顺序工具调用的设计考量
029	如何实现动态工具发现和注册？
030	工具使用的安全性：防止注入攻击和越权操作

四、🤝 多 Agent (`04-multi-agent/`) — 10 题

多 Agent 协作系统的设计、编排、调试与场景故障处理。

#	文章
031	什么是多 Agent 系统？与单 Agent 相比有何优势？
032	多 Agent 通信模式：消息传递、共享状态、黑板模式
033	Agent 编排模式：Hub-Spoke、Pipeline、Hierarchical
034	如何设计 Agent 间的任务分配与协调？
035	多 Agent 系统中的冲突解决机制
036	比较主流多 Agent 框架：CrewAI、AutoGen、LangGraph
037	如何实现 Agent 间的 Handoff（任务交接）？
038	多 Agent 系统中的涌现行为与可控性
039	如何调试和监控多 Agent 系统？
101	🆕 A2A（Agent-to-Agent）协议是什么？它与 MCP 有何区别？

五、🧠 记忆与状态 (`05-memory-and-state/`) — 8 题

Agent 的记忆管理，从上下文窗口到知识图谱。

#	文章
040	Agent 记忆的类型：短期记忆、长期记忆、工作记忆
041	对话上下文窗口管理与压缩策略
043	如何实现 Agent 的持久化记忆（Persistent Memory）？
044	状态管理在 Agent 系统中的设计模式
045	如何实现跨会话的用户偏好学习？
046	向量记忆 vs 结构化记忆：何时使用哪种？
047	设计 Agent 的知识图谱记忆系统
048	记忆的遗忘与更新机制：如何处理过时信息？

六、🧩 规划与推理 (`06-planning-and-reasoning/`) — 9 题

LLM 的推理能力增强与任务规划策略。

#	文章
049	推理策略详解：Chain-of-Thought 与 Tree-of-Thought
050	任务分解（Task Decomposition）的基本方法
052	Plan-and-Solve 与动态重规划
053	LLM 作为规划器的局限性与缓解方案
055	Reasoning 模型（o1/o3/DeepSeek-R1）vs 标准模型：架构差异与适用场景
056	Monte Carlo Tree Search 在 Agent 规划中的应用
057	如何评估 Agent 的推理质量？
058	因果推理在 Agent 决策中的作用
103	Agentic-RL 是什么？如何用 GRPO 训练 Agent 的决策能力？

七、✍️ 提示工程 (`07-prompt-engineering/`) — 11 题

Prompt 设计、优化与管理的最佳实践。

#	文章
059	System Prompt 设计的核心原则
060	Few-Shot vs Zero-Shot Prompting：如何选择？
061	结构化输出（Structured Output）：如何让 LLM 返回 JSON/XML？
062	Agentic Prompting：如何编写让 LLM 自主执行任务的 Prompt？
063	Prompt Chaining：多步骤 Prompt 的设计与编排
064	如何防止 Prompt Injection 攻击？
065	DSPy 等编程化 Prompt 优化工具的原理与使用
066	Prompt 版本管理与 A/B 测试
067	Meta-Prompting：让 LLM 自动生成和优化 Prompt
068	跨模型 Prompt 迁移：如何编写模型无关的 Prompt？
102	🆕 什么是 Context Engineering？它与 Prompt Engineering 有何本质区别？

八、📊 评估 (`08-evaluation/`) — 8 题

Agent 系统的评估方法、基准测试与可观测性。

#	文章
069	评估方法论：从 LLM 评估到 Agent 评估
071	LLM-as-Judge：使用 LLM 评估 LLM 输出
072	Agent Benchmark：如何设计端到端的 Agent 测试？
073	回归测试：如何检测 Agent 性能退化？
074	Trace 和 Span：Agent 执行的可观测性
075	评估工具对比：Ragas、LangSmith、Braintrust
076	静态 Benchmark 的陷阱：为什么 95% 准确率在生产中会失效？
077	如何构建持续评估（Continuous Evaluation）流水线？

九、🛡️ 安全与对齐 (`09-safety-and-alignment/`) — 8 题

Agent 系统的安全风险防控与对齐策略。

#	文章
078	LLM Agent 的主要安全风险有哪些？
079	什么是 Guardrails？如何为 Agent 设置安全护栏？
080	Human-in-the-Loop：何时以及如何引入人工审核？
081	Agent 的权限最小化原则与沙箱执行
082	如何检测和缓解 Agent 的幻觉（Hallucination）？
083	内容过滤与毒性检测在 Agent 系统中的实现
084	Agent 对齐问题：如何确保 Agent 行为符合人类意图？
085	Red Teaming：如何对 Agent 系统进行对抗测试？

十、🚀 生产部署 (`10-production-and-deployment/`) — 12 题

从开发到生产的全链路工程实践。

#	文章
086	LLMOps 是什么？与传统 MLOps 有何区别？
087	Agent 系统的基本部署架构
088	LLM API 的成本优化策略
089	模型路由（Model Routing）：如何根据任务复杂度选择模型？
090	Agent 系统的延迟优化：Streaming、缓存、批处理
091	Prompt Drift 管理：如何避免 Prompt 退化？
092	Agent 系统的日志、监控与告警设计
093	如何实现 Agent 的灰度发布和 A/B 测试？
094	高并发场景下的 Agent 系统扩展策略
095	Agent 系统的灾难恢复与高可用设计
104	🆕 场景题：你的 Agent 在生产环境出了故障，如何系统性排查和修复？
107	🆕 代码 Review 题：找出这段 Agent 代码中的设计问题并修复

十一、🧰 框架选型 (`11-frameworks/`) — 5 题

主流 Agent 框架的对比分析与自研决策。

#	文章
096	主流 Agent 框架概览：LangChain、LlamaIndex、Haystack
097	LangGraph 的核心概念：节点、边、状态
098	框架 vs 自研：什么时候应该自己构建 Agent 框架？
099	OpenAI Assistants API vs Anthropic Claude Agent SDK 对比
100	如何设计可测试、可扩展的 Agent 框架抽象层？

📋 如何使用本项目

🧭 核心理念：以问题驱动学习

传统学习方式往往是"先读文档，再找场景"。本项目反过来——从一个具体问题出发，引导你去理解背后的原理、技术选型和工程实践。每个问题都是一个学习锚点，帮你建立"我需要学什么"的清晰路径。

💡 推荐学习方式

先想后看：先尝试用自己的话回答问题，再对照文章查漏补缺，找到知识盲区
顺藤摸瓜：每篇文章末尾的「延伸思考」和交叉引用会指向关联问题，沿着链路深入
动手实践：文章中的代码示例建议实际运行，配合下方「实践项目推荐」动手练习
横向关联：注意不同模块间的知识联系（如 RAG + 评估、安全 + 工具使用），构建知识网络
场景优先：场景题、系统设计题、代码 Review 题最接近真实工作，建议重点学习

🏷️ 模块概览

模块	题数	简介
🏛️ Agent 架构	9	Agent 定义、架构模式、循环设计与错误恢复、生产级系统设计（含实战案例）、面试追问链
🔍 RAG	10	检索增强生成全流程：文档分块、向量数据库、混合检索、Re-ranking、Agentic RAG、评估指标与量化计算
🔧 工具使用	10	Function Calling、Tool Schema、MCP 协议、工具安全与动态发现
🤝 多 Agent	10	多 Agent 通信与编排模式、任务协调、Handoff、涌现行为、A2A 协议
🧠 记忆与状态	8	短期/长期/工作记忆、上下文窗口管理与压缩、持久化记忆、知识图谱记忆
🧩 规划与推理	9	CoT/ToT 推理、任务分解、Plan-and-Solve 与动态重规划、MCTS、因果推理、Agentic-RL
✍️ 提示工程	11	System Prompt 设计、结构化输出、Prompt Injection 防御、DSPy、Context Engineering
📊 评估	8	评估方法论（LLM→Agent）、LLM-as-Judge、Benchmark 设计、可观测性
🛡️ 安全与对齐	8	安全风险、Guardrails、权限最小化、幻觉检测、Red Teaming
🚀 生产部署	12	LLMOps、成本优化、模型路由、延迟优化、场景故障排查、代码 Review
🧰 框架选型	5	LangChain/LlamaIndex/LangGraph 对比、框架 vs 自研决策、可扩展架构设计

🆕 特色题型

本项目在传统问答题的基础上，引入了 5 种实践导向题型，帮助你从不同角度深入理解 Agent 技术：

题型	代表题目	学习价值
🔥 场景故障排查	#104	通过真实故障场景，学习系统性排查思维和工程经验
📐 量化计算	#020	手算 Precision@K、MRR、NDCG 等指标，真正理解评估体系而非死记公式
🏗️ 系统设计	#010	从原则到实战案例，完整体验 Agent 系统设计全过程
🔍 代码 Review	#107	审查真实 Agent 代码中的问题，培养代码质量意识和最佳实践
🔗 递进追问链	#108	10 层递进追问，从基础概念一步步深入到系统设计，串联知识体系

🗺️ 推荐学习路径

不知道从哪里开始？根据你的角色或水平，选择一条路径，跟着问题编号走即可。

按角色推荐

🛠️ Agent 应用工程师（偏工程实现）

核心能力：能独立开发和部署 Agent 应用

Week 1: 基础概念
001 → 002 → 003 → 021 → 022 → 040 → 041

Week 2: 核心技能
006 → 027 → 028 → 062 → 063 → 044 → 059

Week 3: 生产实践
086 → 087 → 090 → 092 → 026 → 104（场景题）→ 107（代码 Review）

Week 4: 进阶提升
009 → 037 → 074 → 094 → 095 → 108（追问链）

🔍 RAG 工程师（偏检索增强）

核心能力：设计和优化 RAG 系统

Week 1: RAG 基础
011 → 012 → 013 → 014 → 015

Week 2: RAG 进阶
016 → 017 → 018 → 019 → 061

Week 3: RAG 评估与优化
020（含量化计算）→ 069 → 071 → 075

Week 4: 生产化
076 → 077 → 090 → 088 → 102（Context Engineering）

🏗️ AI 架构师（偏系统设计）

核心能力：设计大规模 Agent 系统架构

Week 1: 架构基础
001 → 003 → 005 → 007 → 010（含系统设计实战案例）

Week 2: 多 Agent 与编排
031 → 033 → 034 → 036 → 037 → 101（A2A 协议）

Week 3: 生产架构
087 → 089 → 093 → 094 → 095

Week 4: 前沿技术
055 → 103（Agentic-RL）→ 098 → 100 → 108（追问链）

🛡️ AI 安全工程师（偏安全对齐）

核心能力：保障 Agent 系统的安全性

Week 1-2: 安全基础
078 → 079 → 080 → 081 → 082 → 083 → 084 → 085

Week 3: 安全实践
030 → 064 → 024 → 104（场景题 - 含危险操作场景）

Week 4: 评估与监控
069 → 073 → 074 → 076 → 092 → 107（代码 Review - 含安全审查）

按水平推荐

入门阶段（1-2 周）：先通读所有「基础」难度题目，建立 Agent 技术全景认知
进阶阶段（2-3 周）：深入「中级」题目，掌握核心技术原理与工程实现
深入阶段（1-2 周）：攻克「高级」题目，构建系统设计与架构决策能力

🔨 实践项目推荐

配合学习，建议动手实践以下 mini-project：

项目	描述	涉及问题
tiny-agent-loop	从零实现一个最小 Agent 循环（50 行 Python），包含 Tool Calling、循环终止、错误处理	#001 #006 #021
tiny-rag	搭建简单 RAG 系统，支持文档分块、向量检索、Re-ranking	#011 #012 #013 #016 #017
tiny-multi-agent	实现两个 Agent 的协作对话（Router + Worker 模式），体验 Handoff	#031 #033 #037 #101
tiny-eval	用 Ragas 框架评估你的 RAG 系统，手算并验证评估指标	#020 #069 #075
tiny-mcp-server	实现一个 MCP Server，让 Agent 调用自定义工具	#027 #029 #024

💡 参考项目：wdndev/tiny-rag、datawhalechina/hello-agents

🌟 内容特色

每篇文章均采用 统一的四段式结构，确保学习效率最大化：

📌 简短回答        →  快速建立核心认知，知道"这个东西是什么"
📖 详细解析        →  深入原理、架构图、代码示例，理解"为什么这样设计"
⚠️ 常见误区/面试追问 →  避坑指南 + 高频追问，引导你"还应该学什么"
📚 参考资料        →  论文、博客、官方文档，提供"去哪里继续学"的指引

其他特色：

🔗 文章间交叉引用，形成知识网络，一个问题自然引出下一个
📊 难度标注（基础/中级/高级），便于制定个人学习计划
🆕 引用最新研究成果与行业实践（2024-2025）

👥 适用人群

📖 学习者 — 希望系统掌握 AI Agent 技术栈的开发者，本项目就是为你设计的
🏗️ 架构师 — 设计和构建 Agent 系统的技术负责人，可作为知识查阅手册
🔬 研究者 — 关注 Agent 技术前沿的研究人员，快速了解工程落地视角
🎯 求职者 — 准备 AI Agent / LLM 工程师面试，每个问题即是高频考点
👨‍💼 面试官 — 需要出题和评估候选人的技术面试官，可直接用作题库

📄 许可证

本项目采用 MIT 许可证开源。

_{⭐ 如果这个项目对你有帮助，欢迎 Star 支持！}

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
01-agent-architecture		01-agent-architecture
02-rag		02-rag
03-tool-use		03-tool-use
04-multi-agent		04-multi-agent
05-memory-and-state		05-memory-and-state
06-planning-and-reasoning		06-planning-and-reasoning
07-prompt-engineering		07-prompt-engineering
08-evaluation		08-evaluation
09-safety-and-alignment		09-safety-and-alignment
10-production-and-deployment		10-production-and-deployment
11-frameworks		11-frameworks
.gitignore		.gitignore
README.md		README.md

Folders and files

Latest commit

History

Repository files navigation

🤖 Agent Interview 100

✨ 项目亮点

📖 目录结构

一、🏛️ Agent 架构 (01-agent-architecture/) — 9 题

二、🔍 RAG (02-rag/) — 10 题

三、🔧 工具使用 (03-tool-use/) — 10 题

四、🤝 多 Agent (04-multi-agent/) — 10 题

五、🧠 记忆与状态 (05-memory-and-state/) — 8 题

六、🧩 规划与推理 (06-planning-and-reasoning/) — 9 题

七、✍️ 提示工程 (07-prompt-engineering/) — 11 题

八、📊 评估 (08-evaluation/) — 8 题

九、🛡️ 安全与对齐 (09-safety-and-alignment/) — 8 题

十、🚀 生产部署 (10-production-and-deployment/) — 12 题

十一、🧰 框架选型 (11-frameworks/) — 5 题

📋 如何使用本项目

🧭 核心理念：以问题驱动学习

💡 推荐学习方式

🏷️ 模块概览

🆕 特色题型

🗺️ 推荐学习路径

按角色推荐

🛠️ Agent 应用工程师（偏工程实现）

🔍 RAG 工程师（偏检索增强）

🏗️ AI 架构师（偏系统设计）

🛡️ AI 安全工程师（偏安全对齐）

按水平推荐

🔨 实践项目推荐

🌟 内容特色

👥 适用人群

📄 许可证

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

一、🏛️ Agent 架构 (`01-agent-architecture/`) — 9 题

二、🔍 RAG (`02-rag/`) — 10 题

三、🔧 工具使用 (`03-tool-use/`) — 10 题

四、🤝 多 Agent (`04-multi-agent/`) — 10 题

五、🧠 记忆与状态 (`05-memory-and-state/`) — 8 题

六、🧩 规划与推理 (`06-planning-and-reasoning/`) — 9 题

七、✍️ 提示工程 (`07-prompt-engineering/`) — 11 题

八、📊 评估 (`08-evaluation/`) — 8 题

九、🛡️ 安全与对齐 (`09-safety-and-alignment/`) — 8 题

十、🚀 生产部署 (`10-production-and-deployment/`) — 12 题

十一、🧰 框架选型 (`11-frameworks/`) — 5 题

Packages