【Udemy课程】2026深度智能体——基于Gemini与Langchain的多智能体检索增强生成系统 | 2026 Deep Agent – Multi Agent RAG with Gemini and Langchain

【Udemy课程】2026深度智能体——基于Gemini与Langchain的多智能体检索增强生成系统 | 2026 Deep Agent – Multi Agent RAG with Gemini and Langchain-幻仿编程
【Udemy课程】2026深度智能体——基于Gemini与Langchain的多智能体检索增强生成系统 | 2026 Deep Agent – Multi Agent RAG with Gemini and Langchain
此内容为付费资源,请付费后查看
49.9
立即购买
您当前未登录!建议登陆后购买,可保存购买订单
付费资源
资源分类: 人工智能查看预览
最近更新: 2026-01-17文件内容: 视频+中英文字幕+配套课件
视频分辨率: 1080P 高清文件大小: 3.81GB
视频语言: 英语视频字幕: 中英字幕

幻仿编程 Udemy 付费课程,独家中英字幕 + 配套资料!
限时1折特惠!课程永久访问权,随时随地学习!

2026 Deep Agent – 使用 Gemini 与 LangChain 的多代理 RAG

Langchain v1人工智能代理、多模态深度代理、多代理深度高级RAG、谷歌Gemini 3、Qdrant、Docker、Docling

讲师:KGP Talkie | Laxmi Kant


图片[1]-【Udemy课程】2026深度智能体——基于Gemini与Langchain的多智能体检索增强生成系统 | 2026 Deep Agent – Multi Agent RAG with Gemini and Langchain-幻仿编程

你将学到的内容

  • 使用 Google Gemini、LangChain v1、MCP 以及现代代理设计模式,构建可投入生产的 AI 代理。
  • 利用 Docling、Gemini、Qdrant 向量数据库和混合检索,设计并实现多模态 RAG 流水线。
  • 通过 Docling、Docker 与结构化数据抽取技术,大规模处理 PDF、表格和图像。
  • 在真实 AI 系统中实现混合检索、重排序、记忆、MCP 工具以及成本优化的上下文缓存。
  • 为金融场景创建具备编排器、研究员和编辑员的自主多代理研究系统。

先决条件

  • 需要具备基础的 Python 知识。熟悉 API、Docker 或 RAG 概念会更有帮助,但并非必须。

课程简介

本课程是一套完整、动手实践的指南,教你使用 Google Gemini、LangChain v1、MCP 与现代 RAG 技术,构建真实世界的 AI 代理和深度研究(DeepAgent)系统。

你将从 AI 代理的最基础概念出发,逐步迈向用于深度金融研究的高级自主多代理系统。课程采用循序渐进的设计,既适合初学者跟随学习,也能让有经验的开发者掌握先进的生产级模式。

本课程的重点不止于理论。你将通过 Python Notebook、真实 API、真实文档和真实数据流水线,一步步完成所有实现。

课程覆盖内容

首先,你会真正理解 AI 代理的本质。学习不同的代理模式、代理的推理方式、行动机制,以及如何为实际项目挑选合适的代理设计。

随后,你将正确搭建 Google Gemini AI Studio 与 LangSmith,包括创建 API Key、了解计费、速率限制以及追踪代理执行,以便像专业人士一样调试和监控代理。

接下来,你会参加一次 完整的 Gemini 与 LangChain 训练营。内容包括:在 Python 中使用 Gemini 模型、消息内部机制、流式响应、处理多模态输入、以及使用工具、函数调用、推理模式、 grounding 与上下文缓存来降低成本、提升性能。

在夯实基础后,你将进入 LangChain 代理的学习。你会构建具备记忆、状态管理、摘要中间件、后备模型、PII 保护、规划器、流式响应以及使用 Pydantic 的结构化输出的代理。

课程随后通过金融案例引入 MCP。你将连接外部 MCP 服务器(如 Yahoo Finance),将其加载为 LangChain 工具,并构建一个具备结构化提示和规划器的完整股票研究代理。

深度 RAG 与多模态金融系统

  • 本课程的大部分内容聚焦于金融领域的深度 RAG 系统。
  • 你将了解为何多模态 RAG 难度大,PDF、表格、图像以及长文档会出现哪些问题,以及如何设计可靠的深度 RAG 流水线。
  • 使用 Docling 从金融 PDF 中抽取数据,包括将 PDF 转为 Markdown、带上下文抽取表格、追踪页码、抽取图像,并在大规模下验证数据完整性。
  • 随后,利用多模态 Gemini 模型为图像生成精准描述,并将这些描述存入 Markdown,使整个流程保持在单一文本管道中。
  • 接着,将海量多模态数据写入 Qdrant 向量数据库。学习密集检索、稀疏检索、混合检索、元数据过滤、通过文件哈希去重,以及分块和检索模型的最佳实践。
  • 在此基础上,构建使用混合检索和交叉编码器重排序的高级检索流水线,以提升答案质量。

构建真实的多代理深度研究系统

在课程的最后阶段,你将从零搭建完整的多代理深度研究系统。

你会设计能够像专家研究团队一样工作的自主代理,包括编排器、研究员和编辑员。这些代理能够规划任务、执行深度研究、综合结果并生成结构化输出。

学习代理状态如何共享、工具如何在运行时注入、文件如何被代理管理,以及针对编排器、研究员、编辑员角色的提示设计差异。

此外,还会探索 LangChain 内置的深度代理架构,使用子代理和文件后端构建完整的深度金融研究代理。

适合人群

本课程面向希望超越基础聊天机器人的开发者,构建严肃 AI 系统的人群。

适合以下角色:

  • 从事 LLM 开发的 AI 工程师
  • 构建 RAG 系统的后端开发者
  • 处理文档与研究的数据科学家
  • 对 AI 自动化感兴趣的金融与分析专业人士
  • 任何想了解生产环境中真实多代理系统构建方式的人

建议具备基础 Python 知识,若有一定的代理或 RAG 经验更佳。

课程结束后,你将能够使用 Gemini 与 LangChain 设计、构建并调试高级 AI 代理、多模态 RAG 流水线以及自主多代理研究系统。

你不仅会理解概念,更会亲手搭建完整的端到端系统,可直接复用于真实项目、创业或企业环境。

适合人群:

  • AI 工程师、后端开发者以及数据科学家,想要使用 Gemini 构建代理、搭建多模态 RAG 系统,并通过 LangChain、Docling、Docker 与 Qdrant 实现深度研究工作流。
共 164 节课程 • 总时长 18 小时 25 分钟
第一章 入门介绍
1. 课程介绍6分51秒
2. 安装依赖文件1分53秒
第二章 代理模式与基础(适合初学者)
1. 欢迎来到课程 你将了解智能体2分27秒
2. 智能体基础入门必知要点4分2秒
3. AI智能体核心组件与工作流程解析5分23秒
4. ReAct智能体详解:推理与行动简化指南4分51秒
5. AI智能体类型 实战项目中的四大高效模式5分17秒
6. 如何为您的用例选择合适的代理4分15秒
第三章 谷歌Gemini AI Studio与Langsmith配置
1. 谷歌Gemini AI Studio与LangSmith一站式概览1分44秒
2. 如何领取300美元免费谷歌云积分(分步指南)3分43秒
3. 在Google AI Studio中创建免费的Gemini API密钥4分31秒
4. 谷歌AI工作室模型游乐场与功能导览6分31秒
5. Gemini模型定价指南 如何选择适合的模型5分29秒
6. 理解速率限制:智能体与自动化的最佳模型3分44秒
7. 生成并加载LangSmith API密钥用于代理追踪4分39秒
8. 测试你的谷歌双子星与LangSmith配置(快速演示)3分43秒
第四章 谷歌双子座3与Langchain训练营
1. Gemini 3 完整教程:LangChain 入门实战营2分3秒
2. 谷歌双子座3模型概览 功能特性与应用场景5分31秒
3. 免费网络搜索与天气API设置指南:Gemini与Ollama6分38秒
4. LangChain消息类型与ChatGoogleGenerativeAI7分3秒
5. Python中使用Google Gemini 3 AI模型入门7分29秒
6. 理解AI消息结构:内容文本与内容块详解8分22秒
7. Gemini 3与Gemini 2模型对比及AI消息元数据深度解析5分5秒
8. 使用LangChain ChatModel实现流式响应教程3分55秒
9. Gemini 3 图像分析 从URL分析图像(多模态AI)7分27秒
10. Gemini 3 本地图像分析 使用Python处理图像文件5分16秒
11. 使用Gemini 3进行PDF文档分析从PDF中提取财务数据9分20秒
12. 使用LangChain构建自定义免费Ollama网络搜索工具5分30秒
13. 使用LangChain创建实时天气API工具(逐步教程)6分13秒
14. LLM函数调用教程:工具调用与绑定工具9分54秒
15. Gemini 3 思维模式开启 为复杂任务提供推理支持5分30秒
16. 谷歌搜索内置搜索工具集成实现响应落地6分47秒
17. Gemini上下文缓存教程:降低API成本并提升性能5分26秒
18. Gemini API 上下文缓存文件管理中的文档上传8分39秒
19. 生产环境缓存成本优化:缓存对话策略6分6秒
20. 为金融PPT生成AI信息图 Nano Banana Pro模型教程9分3秒
第五章 Langchain v1 智能体训练营:使用谷歌 Gemini 3 与 Gemini 2
1. Langchain智能体训练营学习内容概览3分55秒
2. Langchain智能体金融分析与Gemini笔记本设置8分29秒
3. AgentState中状态消息的管理方式5分50秒
4. 使用Langchain和Gemini构建并执行你的第一个智能体6分36秒
5. 深入解析智能体状态与Langsmith智能体调用追踪9分33秒
6. 使用SQLite设置短期记忆6分14秒
7. 在SQLite中存储代理聊天历史 Langchain短期记忆7分49秒
8. 为什么需要上下文工程6分49秒
9. Langchain摘要中间件详解5分26秒
10. 运行时使用摘要中间件总结智能体长上下文13分35秒
11. 限制代理中的模型与工具调用并附加备用大语言模型12分26秒
12. 使用PII护栏保护用户身份8分38秒
13. 将TODO规划器集成到您的智能体中以获得更佳答案12分32秒
14. 流式代理响应以降低感知延迟9分15秒
15. 使用Pydantic基础模型生成结构化响应9分29秒
第六章 MCP金融股票研究智能体
1. 本节学习内容3分8秒
2. 金融MCP笔记本设置5分58秒
3. 结构化系统提示词提示工程详解5分22秒
4. 连接雅虎财经MCP服务器与多服务器MCP客户端6分5秒
5. 创建雅虎财经MCP代理8分41秒
6. 将雅虎财经MCP代理作为Langchain工具加载用于股票研究代理10分30秒
7. 使用TODO规划器创建股票研究助手7分10秒
8. 股票研究代理与MCP代理端到端测试8分32秒
第七章 金融多模态深度RAG基础
1. 深度RAG管道架构预览2分58秒
2. 什么是多模态检索增强生成及其在金融领域的挑战5分41秒
3. 多模态RAG核心挑战3分2秒
4. 设计多模态RAG的五种方法 第1部分6分9秒
5. 设计多模态RAG的5种方法 第2部分8分
6. 多模态RAG系统设计大师箴言6分54秒
7. 课程深度RAG系统设计9分7秒
第八章 使用Docling进行批量多模态数据提取
1. Docling数据提取学习路径抢先看3分19秒
2. 数据提取攻击计划与Docling5分41秒
3. 像专家一样深入理解文档处理7分58秒
4. 使用Docling导入设置笔记本7分27秒
5. 从文件名提取元数据7分53秒
6. 运行时创建输出目录8分9秒
7. 在Docling转换器中加载PDF文件7分24秒
8. 转换并保存PDF为Markdown8分15秒
9. 深入解析Docling Markdown导出功能5分29秒
10. 从文档中提取图片(图像)第1部分7分16秒
11. 从文档中提取图片(图像)第2部分7分16秒
12. 通过Markdown提取表格的方法论6分
13. 在Markdown中追踪页码6分27秒
14. 在Markdown中追踪表格编号5分58秒
15. 从Markdown中提取带上下文的表格7分50秒
16. 整合所有内容 Markdown 图表提取8分53秒
17. 批量提取PDF和DIR中的Markdown表格与图表5分8秒
18. 验证数据完整性3分58秒
第九章 使用多模态大语言模型(Gemini)生成图像描述
1. 图像描述生成学习路径抢先看2分25秒
2. 使用多模态大语言模型描述图像的笔记本设置4分21秒
3. 使用LLM(Gemini)进行图像描述的提示工程3分49秒
4. 加载图像为base64以生成描述6分17秒
5. 使用Gemini生成准确详细的图像描述6分40秒
6. 在Markdown中生成并保存图片描述7分9秒
7. 批量图像处理:为目录中所有图像生成并保存描述6分54秒
第十章 Qdrant向量数据库批量数据导入
1. 学习路径设置抢先看4分14秒
2. 选择Qdrant向量数据库而非Chroma、FAISS、Weaviate、Milvus和Pinecone5分34秒
3. 在远程Qdrant服务器上创建免费Qdrant向量数据库7分6秒
4. 创建Qdrant Docker Compose文件5分57秒
5. 使用Docker本地部署Qdrant向量数据库6分23秒
6. 向量数据库数据导入的笔记本配置5分32秒
7. 深入探讨检索模型与分块大小8分32秒
8. 创建并比较用于混合搜索的稠密与稀疏向量数据库7分25秒
9. 在线与本地数据库创建财务文档集合8分25秒
10. 创建元数据提取和文件哈希辅助方法7分1秒
11. 检索已摄取文件哈希值用于去重 第1部分6分20秒
12. 检索已摄取文件哈希值用于去重 第2部分7分6秒
13. 使用正则表达式从文件路径提取元数据页码7分18秒
14. 提取内容类型和源文档名称元数据8分25秒
15. 提取基础元数据并用内容类型和文档名称填充5分22秒
16. 在Qdrant向量数据库中摄取您的第一个文档8分27秒
17. Qdrant向量数据库批量数据导入7分10秒
18. 使用Qdrant仪表板概览已摄入数据5分31秒
第11章 数据检索混合搜索与交叉编码器重排序
1. 抢先看:学习路径设置3分20秒
2. 高级RAG检索策略6分42秒
3. 探索Qdrant向量数据库中的已摄入数据5分49秒
4. Qdrant向量数据库搜索文档概述6分5秒
5. 使用Qdrant控制台测试Qdrant搜索与筛选查询8分10秒
6. 深度RAG检索笔记本设置8分31秒
7. 使用LLM从用户查询中提取元数据的Pydantic模式编写7分2秒
8. 使用Gemini LLM从用户查询中动态提取元数据过滤器10分39秒
9. 基于提取元数据过滤器动态构建Qdrant过滤器5分42秒
10. 使用Qdrant内置RRF算法构建混合搜索10分46秒
11. 使用HuggingFaceCrossEncoder构建重排序器 第1部分6分39秒
12. 使用HuggingFace交叉编码器构建重排序器 第2部分8分22秒
13. 混合搜索端到端测试6分10秒
第12章 多模态金融研究助手与混合搜索
1. 学习路径抢先看4分50秒
2. 多模态研究智能体入门4分26秒
3. 多模态研究智能体笔记本设置6分46秒
4. 将深度RAG笔记本转换为Langchain工具的检索功能6分31秒
5. 编写结构化Langchain工具描述8分15秒
6. 多模态研究智能体的系统提示工程8分59秒
7. 实时金融研究员(雅虎财经MCP)Langchain工具5分22秒
8. 创建带记忆功能的金融研究助手8分33秒
9. 测试金融研究代理10分15秒
10. 实时流式传输代理响应9分34秒
11. 多模态研究智能体端到端测试12分8秒
第13章 深度金融研究助手与待办事项规划器
1. 抢先预览学习路径6分10秒
2. 深度金融研究员笔记本设置6分2秒
3. 深度金融研究员概览:TODO规划器与摘要中间件7分54秒
4. 使用TODO规划器构建深度金融研究智能体9分6秒
5. 深度金融研究代理端到端测试与TODO规划器12分41秒
第14章 深度智能体构建自主多智能体RAG系统入门
1. 自定义深度AI研究代理入门4分45秒
2. 深度智能体设计理念7分2秒
3. 深度智能代理如何模拟专家研究团队7分33秒
第15章 从零开始构建多智能体深度AI金融研究员
1. 学习路径抢先看5分18秒
2. 多智能体深度人工智能金融研究员笔记本设置8分42秒
3. Deep Agents 运行时中代理状态与工具 ID 的注入机制8分6秒
4. 创建共享深度代理状态6分21秒
5. 创建支持深度代理文件操作的实用方法7分16秒
6. 编写ls()和read_files()工具用于深度代理7分14秒
7. 编写深度代理的写入文件和清理文件工具7分46秒
8. 编排器代理的提示工程11分9秒
9. 面向研究型智能体的提示工程8分32秒
10. 编辑代理提示工程4分57秒
11. 创建研究员与编辑智能体8分50秒
12. 为编排器构建研究计划编写工具6分46秒
13. 构建深度研究工具run_researcher()8分48秒
14. 为深度研究者合成构建run_editor()工具5分30秒
15. 构建具备深度研究能力的编排器代理6分29秒
16. 多智能体深度金融研究员的端到端测试6分47秒
第16章 Deep Agent Langchain 多智能体深度研究
1. 学习路径抢先看3分12秒
2. Langchain深度代理入门7分46秒
3. Langchain深度代理笔记本配置5分57秒
4. 深度智能体提示工程5分43秒
5. 构建深度代理文件后端与研究子代理6分45秒
6. 创建具有后端和子代理的Langchain深度代理4分35秒
7. 端到端测试深度代理用于深度金融研究6分54秒
1. 关于课程更新与获取

如何获取本站课程?

免费获取方式:在本站签到、评论、发布文章等可获取积分,通过积分购买课程。
付费获取方式:购买本站【月度会员】或【永久会员】。

课程购买后是否支持更新?
是的,所有课程均提供免费更新服务。 我们致力于为您提供持续的学习支持。

如何获取更新?
单独购买的课程: 您可在“个人中心”随时查看购买记录及最新下载链接,轻松获取免费更新。
永久会员: 您可在相关页面直接查看最新下载地址,随时免费获取更新。
非永久会员(重要提示):通过会员权限下载的课程,在“个人中心”可能不显示具体订单记录。

因此,会员到期后,您将无法通过“个人中心”查看最新下载链接。
解决方案建议:续费会员: 恢复会员权限后,即可再次查看所有最新下载链接。
妥善保存下载链接: 我们强烈建议您在会员有效期内,保存好本站分享的课程下载链接。通常,课程更新内容会直接补充到原有分享链接中。
2. 关于课程资料

课程下载后资料是否齐全?
绝大部分课程资料齐全。 我们尽力确保您获得完整的学习资源。
少数情况说明: 极少数课程可能存在资料缺失情况。针对 Udemy 课程,资料形式多样,请知悉:本地文件(随视频下载): 此类课件通常随视频一并提供,下载即得。

本地文件(含链接): 课件文件中会提供资料下载链接,您需自行访问链接下载。此类资料通常也可获取。
在线平台存储(如 GitHub): 讲师会在视频中说明资料获取方式(如访问特定平台),请您按指引自行下载。
③ Udemy 平台内资料: 部分资料需登录您在 Udemy 购买的账号才能查看。此类资料本站无法提供,除非您自行在 Udemy 平台购买该课程。
3. 关于课程字幕

是否提供中英文双字幕?原本无字幕的课程是否支持?
是的,本站下载的所有课程均提供中英文双字幕,包括 Udemy 原本无任何字幕的课程。 我们致力于提升您的学习体验。

Udemy 字幕现状与本站服务:
○ Udemy 绝大多数课程本身不提供任何字幕。在少数提供字幕的课程中,也几乎不提供中文字幕。

本站字幕服务流程:
Udemy 有字幕: 我们会将其翻译成中文字幕,与英文字幕一同提供。
Udemy 无字幕: 我们会通过技术手段识别生成英文字幕,再翻译成中文字幕,一同提供给您。

字幕服务重要说明(请您理解):
翻译精度: 字幕翻译采用谷歌翻译引擎完成,虽不及人工翻译精准,但足以保障您正常学习理解。
若您仍然觉得字幕精度较低: 可联系站长针对性润色字幕(该服务仅限本站会员)。
4. 关于视频存储与使用

视频存储位置与观看/下载方式?
本站所有课程视频均存储于网盘平台。
您支持在线观看: 可在网盘内直接播放学习。
您支持下载: 可将视频下载至本地,使用播放器播放,更灵活便捷。

主要存储网盘:百度网盘

视频格式与加密情况?
本站所有课程视频均以 MP4 或 MKV 通用格式提供。
视频文件不加密,您可自由分享(请遵守相关法律法规)。
播放建议: 使用本地播放器(如 PotPlayer)播放时,可同时加载中英文字幕文件,学习体验更佳。您可参考我们提供的《PotPlayer 挂载中英双字幕教程》。
5. 关于售后支持与退款政策

遇到问题如何联系?
无论您在购买前或购买后遇到任何疑问,都欢迎随时联系站长。 我们将竭诚为您服务。

退款政策说明:
原则: 由于虚拟商品(课程、资料等)具有可复制性,一旦购买成功并完成下载,原则上不支持退款。

请您在购买前仔细阅读课程介绍、资料说明及本条款,确认符合您的需求。 如有不确定之处,欢迎先行咨询站长。

© 版权声明
THE END
喜欢就支持一下吧
点赞0 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容