资源分类: 人工智能	查看预览
最近更新: 2026-01-17	文件内容: 视频+中英文字幕+配套课件
视频分辨率: 1080P 高清	文件大小: 3.81GB
视频语言: 英语	视频字幕: 中英字幕

幻仿编程 Udemy 付费课程，独家中英字幕 + 配套资料！
限时1折特惠！课程永久访问权，随时随地学习！

2026 Deep Agent – 使用 Gemini 与 LangChain 的多代理 RAG

Langchain v1人工智能代理、多模态深度代理、多代理深度高级RAG、谷歌Gemini 3、Qdrant、Docker、Docling

讲师：KGP Talkie | Laxmi Kant

你将学到的内容

使用 Google Gemini、LangChain v1、MCP 以及现代代理设计模式，构建可投入生产的 AI 代理。
利用 Docling、Gemini、Qdrant 向量数据库和混合检索，设计并实现多模态 RAG 流水线。
通过 Docling、Docker 与结构化数据抽取技术，大规模处理 PDF、表格和图像。
在真实 AI 系统中实现混合检索、重排序、记忆、MCP 工具以及成本优化的上下文缓存。
为金融场景创建具备编排器、研究员和编辑员的自主多代理研究系统。

先决条件

需要具备基础的 Python 知识。熟悉 API、Docker 或 RAG 概念会更有帮助，但并非必须。

课程简介

本课程是一套完整、动手实践的指南，教你使用 Google Gemini、LangChain v1、MCP 与现代 RAG 技术，构建真实世界的 AI 代理和深度研究（DeepAgent）系统。

你将从 AI 代理的最基础概念出发，逐步迈向用于深度金融研究的高级自主多代理系统。课程采用循序渐进的设计，既适合初学者跟随学习，也能让有经验的开发者掌握先进的生产级模式。

本课程的重点不止于理论。你将通过 Python Notebook、真实 API、真实文档和真实数据流水线，一步步完成所有实现。

课程覆盖内容

首先，你会真正理解 AI 代理的本质。学习不同的代理模式、代理的推理方式、行动机制，以及如何为实际项目挑选合适的代理设计。

随后，你将正确搭建 Google Gemini AI Studio 与 LangSmith，包括创建 API Key、了解计费、速率限制以及追踪代理执行，以便像专业人士一样调试和监控代理。

接下来，你会参加一次完整的 Gemini 与 LangChain 训练营。内容包括：在 Python 中使用 Gemini 模型、消息内部机制、流式响应、处理多模态输入、以及使用工具、函数调用、推理模式、 grounding 与上下文缓存来降低成本、提升性能。

在夯实基础后，你将进入 LangChain 代理的学习。你会构建具备记忆、状态管理、摘要中间件、后备模型、PII 保护、规划器、流式响应以及使用 Pydantic 的结构化输出的代理。

课程随后通过金融案例引入 MCP。你将连接外部 MCP 服务器（如 Yahoo Finance），将其加载为 LangChain 工具，并构建一个具备结构化提示和规划器的完整股票研究代理。

深度 RAG 与多模态金融系统

本课程的大部分内容聚焦于金融领域的深度 RAG 系统。
你将了解为何多模态 RAG 难度大，PDF、表格、图像以及长文档会出现哪些问题，以及如何设计可靠的深度 RAG 流水线。
使用 Docling 从金融 PDF 中抽取数据，包括将 PDF 转为 Markdown、带上下文抽取表格、追踪页码、抽取图像，并在大规模下验证数据完整性。
随后，利用多模态 Gemini 模型为图像生成精准描述，并将这些描述存入 Markdown，使整个流程保持在单一文本管道中。
接着，将海量多模态数据写入 Qdrant 向量数据库。学习密集检索、稀疏检索、混合检索、元数据过滤、通过文件哈希去重，以及分块和检索模型的最佳实践。
在此基础上，构建使用混合检索和交叉编码器重排序的高级检索流水线，以提升答案质量。

构建真实的多代理深度研究系统

在课程的最后阶段，你将从零搭建完整的多代理深度研究系统。

你会设计能够像专家研究团队一样工作的自主代理，包括编排器、研究员和编辑员。这些代理能够规划任务、执行深度研究、综合结果并生成结构化输出。

学习代理状态如何共享、工具如何在运行时注入、文件如何被代理管理，以及针对编排器、研究员、编辑员角色的提示设计差异。

此外，还会探索 LangChain 内置的深度代理架构，使用子代理和文件后端构建完整的深度金融研究代理。

适合人群

本课程面向希望超越基础聊天机器人的开发者，构建严肃 AI 系统的人群。

适合以下角色：

从事 LLM 开发的 AI 工程师
构建 RAG 系统的后端开发者
处理文档与研究的数据科学家
对 AI 自动化感兴趣的金融与分析专业人士
任何想了解生产环境中真实多代理系统构建方式的人

建议具备基础 Python 知识，若有一定的代理或 RAG 经验更佳。

课程结束后，你将能够使用 Gemini 与 LangChain 设计、构建并调试高级 AI 代理、多模态 RAG 流水线以及自主多代理研究系统。

你不仅会理解概念，更会亲手搭建完整的端到端系统，可直接复用于真实项目、创业或企业环境。

适合人群：

AI 工程师、后端开发者以及数据科学家，想要使用 Gemini 构建代理、搭建多模态 RAG 系统，并通过 LangChain、Docling、Docker 与 Qdrant 实现深度研究工作流。

共 164 节课程 • 总时长 18 小时 25 分钟
第一章入门介绍
1. 课程介绍	6分51秒
2. 安装依赖文件	1分53秒
第二章代理模式与基础（适合初学者）
1. 欢迎来到课程你将了解智能体	2分27秒
2. 智能体基础入门必知要点	4分2秒
3. AI智能体核心组件与工作流程解析	5分23秒
4. ReAct智能体详解：推理与行动简化指南	4分51秒
5. AI智能体类型实战项目中的四大高效模式	5分17秒
6. 如何为您的用例选择合适的代理	4分15秒
第三章谷歌Gemini AI Studio与Langsmith配置
1. 谷歌Gemini AI Studio与LangSmith一站式概览	1分44秒
2. 如何领取300美元免费谷歌云积分（分步指南）	3分43秒
3. 在Google AI Studio中创建免费的Gemini API密钥	4分31秒
4. 谷歌AI工作室模型游乐场与功能导览	6分31秒
5. Gemini模型定价指南如何选择适合的模型	5分29秒
6. 理解速率限制：智能体与自动化的最佳模型	3分44秒
7. 生成并加载LangSmith API密钥用于代理追踪	4分39秒
8. 测试你的谷歌双子星与LangSmith配置（快速演示）	3分43秒
第四章谷歌双子座3与Langchain训练营
1. Gemini 3 完整教程：LangChain 入门实战营	2分3秒
2. 谷歌双子座3模型概览功能特性与应用场景	5分31秒
3. 免费网络搜索与天气API设置指南：Gemini与Ollama	6分38秒
4. LangChain消息类型与ChatGoogleGenerativeAI	7分3秒
5. Python中使用Google Gemini 3 AI模型入门	7分29秒
6. 理解AI消息结构：内容文本与内容块详解	8分22秒
7. Gemini 3与Gemini 2模型对比及AI消息元数据深度解析	5分5秒
8. 使用LangChain ChatModel实现流式响应教程	3分55秒
9. Gemini 3 图像分析从URL分析图像（多模态AI）	7分27秒
10. Gemini 3 本地图像分析使用Python处理图像文件	5分16秒
11. 使用Gemini 3进行PDF文档分析从PDF中提取财务数据	9分20秒
12. 使用LangChain构建自定义免费Ollama网络搜索工具	5分30秒
13. 使用LangChain创建实时天气API工具（逐步教程）	6分13秒
14. LLM函数调用教程：工具调用与绑定工具	9分54秒
15. Gemini 3 思维模式开启为复杂任务提供推理支持	5分30秒
16. 谷歌搜索内置搜索工具集成实现响应落地	6分47秒
17. Gemini上下文缓存教程：降低API成本并提升性能	5分26秒
18. Gemini API 上下文缓存文件管理中的文档上传	8分39秒
19. 生产环境缓存成本优化：缓存对话策略	6分6秒
20. 为金融PPT生成AI信息图 Nano Banana Pro模型教程	9分3秒
第五章 Langchain v1 智能体训练营：使用谷歌 Gemini 3 与 Gemini 2
1. Langchain智能体训练营学习内容概览	3分55秒
2. Langchain智能体金融分析与Gemini笔记本设置	8分29秒
3. AgentState中状态消息的管理方式	5分50秒
4. 使用Langchain和Gemini构建并执行你的第一个智能体	6分36秒
5. 深入解析智能体状态与Langsmith智能体调用追踪	9分33秒
6. 使用SQLite设置短期记忆	6分14秒
7. 在SQLite中存储代理聊天历史 Langchain短期记忆	7分49秒
8. 为什么需要上下文工程	6分49秒
9. Langchain摘要中间件详解	5分26秒
10. 运行时使用摘要中间件总结智能体长上下文	13分35秒
11. 限制代理中的模型与工具调用并附加备用大语言模型	12分26秒
12. 使用PII护栏保护用户身份	8分38秒
13. 将TODO规划器集成到您的智能体中以获得更佳答案	12分32秒
14. 流式代理响应以降低感知延迟	9分15秒
15. 使用Pydantic基础模型生成结构化响应	9分29秒
第六章 MCP金融股票研究智能体
1. 本节学习内容	3分8秒
2. 金融MCP笔记本设置	5分58秒
3. 结构化系统提示词提示工程详解	5分22秒
4. 连接雅虎财经MCP服务器与多服务器MCP客户端	6分5秒
5. 创建雅虎财经MCP代理	8分41秒
6. 将雅虎财经MCP代理作为Langchain工具加载用于股票研究代理	10分30秒
7. 使用TODO规划器创建股票研究助手	7分10秒
8. 股票研究代理与MCP代理端到端测试	8分32秒
第七章金融多模态深度RAG基础
1. 深度RAG管道架构预览	2分58秒
2. 什么是多模态检索增强生成及其在金融领域的挑战	5分41秒
3. 多模态RAG核心挑战	3分2秒
4. 设计多模态RAG的五种方法第1部分	6分9秒
5. 设计多模态RAG的5种方法第2部分	8分
6. 多模态RAG系统设计大师箴言	6分54秒
7. 课程深度RAG系统设计	9分7秒
第八章使用Docling进行批量多模态数据提取
1. Docling数据提取学习路径抢先看	3分19秒
2. 数据提取攻击计划与Docling	5分41秒
3. 像专家一样深入理解文档处理	7分58秒
4. 使用Docling导入设置笔记本	7分27秒
5. 从文件名提取元数据	7分53秒
6. 运行时创建输出目录	8分9秒
7. 在Docling转换器中加载PDF文件	7分24秒
8. 转换并保存PDF为Markdown	8分15秒
9. 深入解析Docling Markdown导出功能	5分29秒
10. 从文档中提取图片（图像）第1部分	7分16秒
11. 从文档中提取图片（图像）第2部分	7分16秒
12. 通过Markdown提取表格的方法论	6分
13. 在Markdown中追踪页码	6分27秒
14. 在Markdown中追踪表格编号	5分58秒
15. 从Markdown中提取带上下文的表格	7分50秒
16. 整合所有内容 Markdown 图表提取	8分53秒
17. 批量提取PDF和DIR中的Markdown表格与图表	5分8秒
18. 验证数据完整性	3分58秒
第九章使用多模态大语言模型（Gemini）生成图像描述
1. 图像描述生成学习路径抢先看	2分25秒
2. 使用多模态大语言模型描述图像的笔记本设置	4分21秒
3. 使用LLM（Gemini）进行图像描述的提示工程	3分49秒
4. 加载图像为base64以生成描述	6分17秒
5. 使用Gemini生成准确详细的图像描述	6分40秒
6. 在Markdown中生成并保存图片描述	7分9秒
7. 批量图像处理：为目录中所有图像生成并保存描述	6分54秒
第十章 Qdrant向量数据库批量数据导入
1. 学习路径设置抢先看	4分14秒
2. 选择Qdrant向量数据库而非Chroma、FAISS、Weaviate、Milvus和Pinecone	5分34秒
3. 在远程Qdrant服务器上创建免费Qdrant向量数据库	7分6秒
4. 创建Qdrant Docker Compose文件	5分57秒
5. 使用Docker本地部署Qdrant向量数据库	6分23秒
6. 向量数据库数据导入的笔记本配置	5分32秒
7. 深入探讨检索模型与分块大小	8分32秒
8. 创建并比较用于混合搜索的稠密与稀疏向量数据库	7分25秒
9. 在线与本地数据库创建财务文档集合	8分25秒
10. 创建元数据提取和文件哈希辅助方法	7分1秒
11. 检索已摄取文件哈希值用于去重第1部分	6分20秒
12. 检索已摄取文件哈希值用于去重第2部分	7分6秒
13. 使用正则表达式从文件路径提取元数据页码	7分18秒
14. 提取内容类型和源文档名称元数据	8分25秒
15. 提取基础元数据并用内容类型和文档名称填充	5分22秒
16. 在Qdrant向量数据库中摄取您的第一个文档	8分27秒
17. Qdrant向量数据库批量数据导入	7分10秒
18. 使用Qdrant仪表板概览已摄入数据	5分31秒
第11章数据检索混合搜索与交叉编码器重排序
1. 抢先看：学习路径设置	3分20秒
2. 高级RAG检索策略	6分42秒
3. 探索Qdrant向量数据库中的已摄入数据	5分49秒
4. Qdrant向量数据库搜索文档概述	6分5秒
5. 使用Qdrant控制台测试Qdrant搜索与筛选查询	8分10秒
6. 深度RAG检索笔记本设置	8分31秒
7. 使用LLM从用户查询中提取元数据的Pydantic模式编写	7分2秒
8. 使用Gemini LLM从用户查询中动态提取元数据过滤器	10分39秒
9. 基于提取元数据过滤器动态构建Qdrant过滤器	5分42秒
10. 使用Qdrant内置RRF算法构建混合搜索	10分46秒
11. 使用HuggingFaceCrossEncoder构建重排序器第1部分	6分39秒
12. 使用HuggingFace交叉编码器构建重排序器第2部分	8分22秒
13. 混合搜索端到端测试	6分10秒
第12章多模态金融研究助手与混合搜索
1. 学习路径抢先看	4分50秒
2. 多模态研究智能体入门	4分26秒
3. 多模态研究智能体笔记本设置	6分46秒
4. 将深度RAG笔记本转换为Langchain工具的检索功能	6分31秒
5. 编写结构化Langchain工具描述	8分15秒
6. 多模态研究智能体的系统提示工程	8分59秒
7. 实时金融研究员（雅虎财经MCP）Langchain工具	5分22秒
8. 创建带记忆功能的金融研究助手	8分33秒
9. 测试金融研究代理	10分15秒
10. 实时流式传输代理响应	9分34秒
11. 多模态研究智能体端到端测试	12分8秒
第13章深度金融研究助手与待办事项规划器
1. 抢先预览学习路径	6分10秒
2. 深度金融研究员笔记本设置	6分2秒
3. 深度金融研究员概览：TODO规划器与摘要中间件	7分54秒
4. 使用TODO规划器构建深度金融研究智能体	9分6秒
5. 深度金融研究代理端到端测试与TODO规划器	12分41秒
第14章深度智能体构建自主多智能体RAG系统入门
1. 自定义深度AI研究代理入门	4分45秒
2. 深度智能体设计理念	7分2秒
3. 深度智能代理如何模拟专家研究团队	7分33秒
第15章从零开始构建多智能体深度AI金融研究员
1. 学习路径抢先看	5分18秒
2. 多智能体深度人工智能金融研究员笔记本设置	8分42秒
3. Deep Agents 运行时中代理状态与工具 ID 的注入机制	8分6秒
4. 创建共享深度代理状态	6分21秒
5. 创建支持深度代理文件操作的实用方法	7分16秒
6. 编写ls()和read_files()工具用于深度代理	7分14秒
7. 编写深度代理的写入文件和清理文件工具	7分46秒
8. 编排器代理的提示工程	11分9秒
9. 面向研究型智能体的提示工程	8分32秒
10. 编辑代理提示工程	4分57秒
11. 创建研究员与编辑智能体	8分50秒
12. 为编排器构建研究计划编写工具	6分46秒
13. 构建深度研究工具run_researcher()	8分48秒
14. 为深度研究者合成构建run_editor()工具	5分30秒
15. 构建具备深度研究能力的编排器代理	6分29秒
16. 多智能体深度金融研究员的端到端测试	6分47秒
第16章 Deep Agent Langchain 多智能体深度研究
1. 学习路径抢先看	3分12秒
2. Langchain深度代理入门	7分46秒
3. Langchain深度代理笔记本配置	5分57秒
4. 深度智能体提示工程	5分43秒
5. 构建深度代理文件后端与研究子代理	6分45秒
6. 创建具有后端和子代理的Langchain深度代理	4分35秒
7. 端到端测试深度代理用于深度金融研究	6分54秒

1. 关于课程更新与获取

如何获取本站课程？
○ 免费获取方式：在本站签到、评论、发布文章等可获取积分，通过积分购买课程。
○ 付费获取方式：购买本站【月度会员】或【永久会员】。

课程购买后是否支持更新？
○ 是的，所有课程均提供免费更新服务。 我们致力于为您提供持续的学习支持。

如何获取更新？
○ 单独购买的课程： 您可在“个人中心”随时查看购买记录及最新下载链接，轻松获取免费更新。
○ 永久会员： 您可在相关页面直接查看最新下载地址，随时免费获取更新。
○ 非永久会员（重要提示）：通过会员权限下载的课程，在“个人中心”可能不显示具体订单记录。

因此，会员到期后，您将无法通过“个人中心”查看最新下载链接。
① 解决方案建议：续费会员： 恢复会员权限后，即可再次查看所有最新下载链接。
② 妥善保存下载链接： 我们强烈建议您在会员有效期内，保存好本站分享的课程下载链接。通常，课程更新内容会直接补充到原有分享链接中。

2. 关于课程资料

课程下载后资料是否齐全？
○ 绝大部分课程资料齐全。 我们尽力确保您获得完整的学习资源。
○ 少数情况说明： 极少数课程可能存在资料缺失情况。针对 Udemy 课程，资料形式多样，请知悉：本地文件（随视频下载）： 此类课件通常随视频一并提供，下载即得。

① 本地文件（含链接）： 课件文件中会提供资料下载链接，您需自行访问链接下载。此类资料通常也可获取。
② 在线平台存储（如 GitHub）： 讲师会在视频中说明资料获取方式（如访问特定平台），请您按指引自行下载。
③ Udemy 平台内资料：部分资料需登录您在 Udemy 购买的账号才能查看。此类资料本站无法提供，除非您自行在 Udemy 平台购买该课程。

3. 关于课程字幕

是否提供中英文双字幕？原本无字幕的课程是否支持？
○ 是的，本站下载的所有课程均提供中英文双字幕，包括 Udemy 原本无任何字幕的课程。 我们致力于提升您的学习体验。

Udemy 字幕现状与本站服务：
○ Udemy 绝大多数课程本身不提供任何字幕。在少数提供字幕的课程中，也几乎不提供中文字幕。

本站字幕服务流程：
① Udemy 有字幕： 我们会将其翻译成中文字幕，与英文字幕一同提供。
② Udemy 无字幕： 我们会通过技术手段识别生成英文字幕，再翻译成中文字幕，一同提供给您。

字幕服务重要说明（请您理解）：
○ 翻译精度： 字幕翻译采用谷歌翻译引擎完成，虽不及人工翻译精准，但足以保障您正常学习理解。
○ 若您仍然觉得字幕精度较低： 可联系站长针对性润色字幕（该服务仅限本站会员）。

4. 关于视频存储与使用

视频存储位置与观看/下载方式？
本站所有课程视频均存储于网盘平台。
您支持在线观看： 可在网盘内直接播放学习。
您支持下载： 可将视频下载至本地，使用播放器播放，更灵活便捷。

主要存储网盘：百度网盘

视频格式与加密情况？
本站所有课程视频均以 MP4 或 MKV 通用格式提供。
视频文件不加密，您可自由分享（请遵守相关法律法规）。
播放建议： 使用本地播放器（如 PotPlayer）播放时，可同时加载中英文字幕文件，学习体验更佳。您可参考我们提供的《PotPlayer 挂载中英双字幕教程》。

5. 关于售后支持与退款政策

遇到问题如何联系？
无论您在购买前或购买后遇到任何疑问，都欢迎随时联系站长。 我们将竭诚为您服务。

退款政策说明：
原则： 由于虚拟商品（课程、资料等）具有可复制性，一旦购买成功并完成下载，原则上不支持退款。

请您在购买前仔细阅读课程介绍、资料说明及本条款，确认符合您的需求。 如有不确定之处，欢迎先行咨询站长。

文章版权归作者所有，未经允许请勿转载。

THE END