幻仿编程 Udemy 付费课程,独家中英字幕 + 配套资料!
限时1折特惠!课程永久访问权,随时随地学习!
Python 自然语言处理训练营
使用文本处理、NLTK、情感分析和神经网络学习文本挖掘和 NLP 的基础知识
讲师:Ivo Bernardo
您将学到什么
- 在 Python 中处理字符串
- 使用自然语言工具包库
- 理解词向量背后的直觉
- 用于分析的预处理文本
- 理解文本矢量化
- 训练神经网络生成词向量
- 从网页获取文本数据
- 读取包含文本数据的文件
- 开发情绪分析工具
- 训练机器学习模型
探索相关主题
- 自然语言处理(NLP)
- 数据科学
- 发展
要求
- 互联网接入
- 至少具有 4 GB RAM 的计算机
描述
欢迎踏上充满活力的自然语言处理 (NLP) 和文本挖掘的首航之旅!本课程将带您零风险地(30 天退款政策)了解谷歌、亚马逊和微软等科技巨头文本数据运营的基石——基础概念。
文本挖掘已成为现代数据科学与分析的基石。这项技术的巨大飞跃使机器能够理解单词和短语,彻底改变了信息检索、翻译和文本分类等任务。我将帮助您探索这些领域,并从经典自然语言处理(NLP)的基础知识跨越到生成式人工智能工具(例如 ChatGPT)的神秘领域。
我们的旅程将从经典语言到神经网络,探索语言处理技术的演变。我们将从传统的统计方法入手,逐步深入到深度学习和神经网络的前沿领域。我希望通过理论与实践相结合,引领您探索自然语言处理 (NLP) 的世界。
如果 Python 还不是您的强项,请不要担心 – 本课程包含 Python 速成课程,可帮助您熟悉该语言并为我们将要介绍的其他主题提供必要的基础。
该课程将阐明各种关键的 NLP 概念,包括:
完成本课程后,您将掌握构建基础 NLP 应用程序的技能,并对大多数 NLP 算法背后的基本概念有深入的理解。这些知识将为您开启更深入的 NLP 研究之门,同时帮助您了解企业在发布 NLP 应用程序时所使用的策略和技术。
和我一起踏上这段激动人心的NLP之旅吧!无论您是新手,还是想要拓展视野的专家,这里都能满足您的需求。我热切期待着我们一起在课程中展开冒险!
本课程适合哪些人:
- 初级 Python 开发人员
- 经验丰富的 Python 开发人员,有兴趣学习 NLP
- 数据工程师
- 数据科学家
- 业务分析师
| 共 120 节课程 • 总时长 18 小时 6 分钟 | |
| 第一章 课程介绍 | |
| 1. 介绍 | 6分51秒 |
| 2. 注意:课程于2023年期间正在进行更新 | 2分19秒 |
| 3. 重要讲座,不要错过这一堂。 | 1分37秒 |
| 第二章 安装Anaconda和初始设置 | |
| 1. 幻灯片 设置环境 | 6分17秒 |
| 2. 安装Anaconda Distribution | 5分26秒 |
| 3. 将环境导入Anaconda | 4分26秒 |
| 4. 从零开始创建环境并安装单个库 | 7分4秒 |
| 5. 谷歌Colab上的替代运行笔记本 | 3分52秒 |
| 第三章 初学者可选 Python 基础迷你课程 | |
| 1. 幻灯片 Python 基础课程 第一部分 | 9分29秒 |
| 2. 幻灯片 Python 基础课程 第 2 部分 | 7分10秒 |
| 3. 入门指南 Jupyter Notebook 概述 | 15分9秒 |
| 4. 使用Python作为计算器 探索整数和浮点数 | 12分53秒 |
| 5. 使用数学库探索Python库模块 | 11分46秒 |
| 6. Python 字符串和索引 | 12分9秒 |
| 7. Python 列表 | 6分10秒 |
| 8. 讨论方法和可变性属性 | 6分36秒 |
| 9. Python 集合 | 3分1秒 |
| 10. Python 字典 | 2分40秒 |
| 11. Python 元组 | 1分54秒 |
| 12. 控制流If语句 | 5分11秒 |
| 13. 控制流 Python 循环 | 4分19秒 |
| 14. Python 函数 | 7分14秒 |
| 15. Numpy概述 | 7分30秒 |
| 16. Pandas概述 | 5分29秒 |
| 17. 教程 如何完成练习 | 2分22秒 |
| 18. 练习解决方案代码同步讲座 | 15分55秒 |
| 第四章 初学者可选:基本文本处理 | |
| 1. 幻灯片 基本文本处理 | 4分41秒 |
| 2. 为什么电脑不理解我们所说的语言 | 6分51秒 |
| 3. 字符串索引 | 5分30秒 |
| 4. 合并字符串 | 2分17秒 |
| 5. 迭代字符串和格式化方法 | 8分3秒 |
| 6. 测试字符串是否在句子中并转义字符 | 10分16秒 |
| 7. 字符串方法 1 句子长度转换 大小写方法 和 IsAlpha | 5分34秒 |
| 8. 字符串方法2 Split Strip 和 Join | 6分7秒 |
| 9. 字符串方法3 大写 替换 计数 查找 | 7分44秒 |
| 10. 练习解答代码同步讲座 字符串基础 | 9分42秒 |
| 第五章 探索NLTK自然语言工具包 | |
| 1. 幻灯片:NLTK入门:分词和文本规范化 | 8分43秒 |
| 2. 幻灯片 NLTK 词性标注和N-gram | 7分33秒 |
| 3. 章节介绍 | 3分49秒 |
| 4. 介绍分词和句子分词器 | 12分43秒 |
| 5. 单词分词示例 | 9分9秒 |
| 6. 清洗我们的Token 移除标点符号和转换为小写 | 9分38秒 |
| 7. FreqDist NLTK函数 | 7分1秒 |
| 8. 词干提取介绍:Porter、Lancaster和Snowball词干提取器 | 11分46秒 |
| 9. 词干提取应用示例 | 10分47秒 |
| 10. 词干提取简介 | 10分10秒 |
| 11. 词性 POS 标记 | 11分37秒 |
| 12. 训练我们自己的词性标注器 第一部分 | 14分5秒 |
| 13. 训练我们自己的词性标注器 第二部分 UniGram标注器 | 12分36秒 |
| 14. 训练我们自己的词性标注器 第3部分 双词标注器 | 10分8秒 |
| 15. 词形还原和词性标注 | 14分24秒 |
| 16. 停用词 | 10分12秒 |
| 17. NGrams概念 | 7分8秒 |
| 18. 练习解决方案代码跟随讲座 NLTK | 20分1秒 |
| 第六章 项目1:分析IMDB评论 | |
| 1. 项目描述 分析IMDB评论 | 3分54秒 |
| 第七章 词向量直觉 | |
| 1. 幻灯片 词语向量 直觉 | 11分5秒 |
| 2. 词向量介绍和创建OneHot向量 | 11分51秒 |
| 3. 初始化共现矩阵 | 7分59秒 |
| 4. 填充共现矩阵 | 14分9秒 |
| 5. 探索余弦相似度 | 9分12秒 |
| 6. 可视化词向量 | 5分15秒 |
| 7. 练习解决方案代码跟随讲座1词向量 | 12分55秒 |
| 8. 练习解决方案代码同步讲座2 词向量 | 8分4秒 |
| 第八章 可选读取文本数据到Python | |
| 1. 将文本数据读入Python | 4分29秒 |
| 2. 使用Pandas从CSV文件读取数据 | 9分13秒 |
| 3. 使用Python CSV读取CSV文件中的数据 | 4分31秒 |
| 4. 从TXT文件中读取数据 | 5分48秒 |
| 5. 使用Requests和BeautifulSoup抓取网页 – 维基百科示例 | 13分57秒 |
| 6. 使用Requests和BeautifulSoup抓取网页——Yahoo Finance示例 | 14分57秒 |
| 7. 抓取网页时请求错误 | 3分37秒 |
| 8. 使用特定库抓取网页 | 3分26秒 |
| 第九章 连续词袋模型实现和词嵌入 | |
| 1. 幻灯片 神经网络定义和 Word2Vec | 21分6秒 |
| 2. 连续词袋模型 CBOW 简介 | 11分55秒 |
| 3. CBOW 创建词汇和 OneHot 向量 | 11分4秒 |
| 4. CBOW 构建特征 X 和目标变量 y | 14分39秒 |
| 5. 神经网络简介和图示 | 6分57秒 |
| 6. CBOW 训练神经网络 | 13分9秒 |
| 7. CBOW 获取词向量嵌入 | 8分40秒 |
| 8. 提取维基百科数据用于CBOW模型 | 10分3秒 |
| 9. 从维基百科数据构建上下文 | 13分15秒 |
| 10. 将单词和上下文转化为数学向量 | 9分23秒 |
| 11. 在维基百科数据上拟合神经网络 | 9分46秒 |
| 12. 神经网络性能和根据上下文预测单词 | 5分22秒 |
| 13. 检索词嵌入和词相似度 | 10分11秒 |
| 14. 加载Word2VecModel | 5分38秒 |
| 15. Word2Vec 操作与向量类比 | 9分18秒 |
| 16. 使用PCA可视化Word2Vec向量 | 7分35秒 |
| 17. 练习解决方案代码跟随讲座 神经网络词向量 | 19分40秒 |
| 第十章 项目2:Python考古学家 | |
| 1. 项目描述 Python考古学家 | 2分18秒 |
| 第11章 文本表示 | |
| 1. 习题解答文本表示第二部分 | 11分14秒 |
| 2. 幻灯片文本表示 | 11分38秒 |
| 3. 阅读推文文件 | 5分2秒 |
| 4. 二进制向量化器 | 16分19秒 |
| 5. 计数向量器 | 4分40秒 |
| 6. TFIDF 向量器 | 10分53秒 |
| 7. 通过词嵌入创建文档向量 | 10分17秒 |
| 8. 习题解答文本表示第一部分 | 14分4秒 |
| 第12章 文本分类 | |
| 1. 幻灯片文本分类 | 12分56秒 |
| 2. 文本分类简介和将正面负面评论加载到Python中 | 11分19秒 |
| 3. 文本预处理用于文本分类 | 8分57秒 |
| 4. 探索性数据分析对数比和词语影响 | 16分36秒 |
| 5. 词干提取和评论向量化 | 14分2秒 |
| 6. 创建WordVec特征和目标数组 | 8分18秒 |
| 7. 逻辑回归的直觉和手动调整权重 | 17分38秒 |
| 8. 训练和测试拆分 | 5分38秒 |
| 9. 拟合和评估模型 | 6分39秒 |
| 10. 获取回归影响权重的系数 | 4分50秒 |
| 11. 使用Word2Vec特征训练模型 | 7分25秒 |
| 12. 混淆矩阵示例 | 10分4秒 |
| 13. 朴素贝叶斯训练 | 5分1秒 |
| 14. 预测新评论的情感 | 10分2秒 |
| 15. 练习解决方案 文本分类 | 19分31秒 |
| 第13章 文本生成马尔可夫链模型 | |
| 1. 幻灯片文本分类 | 9分46秒 |
| 2. 文本生成简介 句子分词 | 10分7秒 |
| 3. 文本生成 构建转移矩阵 | 12分52秒 |
| 4. 第一次尝试使用转移矩阵生成文本 | 7分59秒 |
| 5. 为维基百科数据创建转移矩阵 | 7分23秒 |
| 6. 从Wiki数据中根据前N个词生成文本 | 10分26秒 |
| 7. 练习题解答文本生成 | 16分11秒 |
| 第14章 课程结束 | |
| 1. 谢谢 | 47秒 |
| 1. 关于课程更新与获取 如何获取本站课程? ○ 免费获取方式:在本站签到、评论、发布文章等可获取积分,通过积分购买课程。 ○ 付费获取方式:购买本站【月度会员】或【永久会员】。 课程购买后是否支持更新? ○ 是的,所有课程均提供免费更新服务。 我们致力于为您提供持续的学习支持。 如何获取更新? ○ 单独购买的课程: 您可在“个人中心”随时查看购买记录及最新下载链接,轻松获取免费更新。 ○ 永久会员: 您可在相关页面直接查看最新下载地址,随时免费获取更新。 ○ 非永久会员(重要提示):通过会员权限下载的课程,在“个人中心”可能不显示具体订单记录。 因此,会员到期后,您将无法通过“个人中心”查看最新下载链接。 ① 解决方案建议:续费会员: 恢复会员权限后,即可再次查看所有最新下载链接。 ② 妥善保存下载链接: 我们强烈建议您在会员有效期内,保存好本站分享的课程下载链接。通常,课程更新内容会直接补充到原有分享链接中。 |
| 2. 关于课程资料 课程下载后资料是否齐全? ○ 绝大部分课程资料齐全。 我们尽力确保您获得完整的学习资源。 ○ 少数情况说明: 极少数课程可能存在资料缺失情况。针对 Udemy 课程,资料形式多样,请知悉:本地文件(随视频下载): 此类课件通常随视频一并提供,下载即得。 ① 本地文件(含链接): 课件文件中会提供资料下载链接,您需自行访问链接下载。此类资料通常也可获取。 ② 在线平台存储(如 GitHub): 讲师会在视频中说明资料获取方式(如访问特定平台),请您按指引自行下载。 ③ Udemy 平台内资料: 部分资料需登录您在 Udemy 购买的账号才能查看。此类资料本站无法提供,除非您自行在 Udemy 平台购买该课程。 |
| 3. 关于课程字幕 是否提供中英文双字幕?原本无字幕的课程是否支持? ○ 是的,本站下载的所有课程均提供中英文双字幕,包括 Udemy 原本无任何字幕的课程。 我们致力于提升您的学习体验。 Udemy 字幕现状与本站服务: ○ Udemy 绝大多数课程本身不提供任何字幕。在少数提供字幕的课程中,也几乎不提供中文字幕。 本站字幕服务流程: ① Udemy 有字幕: 我们会将其翻译成中文字幕,与英文字幕一同提供。 ② Udemy 无字幕: 我们会通过技术手段识别生成英文字幕,再翻译成中文字幕,一同提供给您。 字幕服务重要说明(请您理解): ○ 翻译精度: 字幕翻译采用谷歌翻译引擎完成,虽不及人工翻译精准,但足以保障您正常学习理解。 ○ 若您仍然觉得字幕精度较低: 可联系站长针对性润色字幕(该服务仅限本站会员)。 |
| 4. 关于视频存储与使用 视频存储位置与观看/下载方式? 本站所有课程视频均存储于网盘平台。 您支持在线观看: 可在网盘内直接播放学习。 您支持下载: 可将视频下载至本地,使用播放器播放,更灵活便捷。 主要存储网盘:百度网盘 视频格式与加密情况? 本站所有课程视频均以 MP4 或 MKV 通用格式提供。 视频文件不加密,您可自由分享(请遵守相关法律法规)。 播放建议: 使用本地播放器(如 PotPlayer)播放时,可同时加载中英文字幕文件,学习体验更佳。您可参考我们提供的《PotPlayer 挂载中英双字幕教程》。 |
| 5. 关于售后支持与退款政策 遇到问题如何联系? 无论您在购买前或购买后遇到任何疑问,都欢迎随时联系站长。 我们将竭诚为您服务。 退款政策说明: 原则: 由于虚拟商品(课程、资料等)具有可复制性,一旦购买成功并完成下载,原则上不支持退款。 请您在购买前仔细阅读课程介绍、资料说明及本条款,确认符合您的需求。 如有不确定之处,欢迎先行咨询站长。 |



























暂无评论内容