DeepSeek助力Python爬虫 2025 new_计量实证分析_现场班北京国富如荷网络科技有限公司-Peixun.net

上课信息

上课时间： 12小时, 在线课程随报随学
12小时, 2025年10月录播

上课地点： 在线学习，提供配套资料和授课老师答疑

课程章节详情

DeepSeek助力Python爬虫 2025 new

1. 爬虫基础

目标：掌握爬虫基本概念，爬虫基本流程，掌握网页基础知识，学会简单网页制作

1) 什么是网络爬虫

2) 爬虫的基本原理

3) web网页基础

4) 爬虫基本流程

2. 页面解析和数据存储

目标：掌握正则表达式的用法，学会利用正则表达式进行文本信息提取，掌握常见文本信息存储方法

1) 基于正则表达式的文本信息提取

2) 文本文件存储

3) JSON文件存储

3. urllib和requests

目标：掌握两种基本的请求发送方法，通过案例展示，实现单页和多页数据爬取，掌握动态页面爬取方法，掌握模

拟登录，IP代理常用方法，实现高效率、大规模的网络爬取

1) 请求头的构造

2) get请求与post请求

3) 单页和多页数据的爬取

4) 动态页面的数据爬取

5) 模拟登录

6) 代理的基本使用

7) 高效代理池的维护

4. Beautiful Soup和Xpath

目标：通过案例，掌握两种高效的网页信息解析和提取方法，实现网络数据的高效提取

1) Beautiful Soup简介

2) Beautiful Soup的页面解析

3) Beautiful Soup节点选择方法

4) 什么是Xpath

5) Xpath常用匹配规则

6) Xpath的节点选择

5. Selenium和Playwright

目标：通过案例，掌握动态渲染页面的两种自动化的爬虫方法

1) Selenium的安装与配置

2) Selenium的基本使用

3) 页面的访问与节点定位

4) 节点信息的获取

5) Playwright的安装

6) Playwright的编写模式

7) Playwright代码生成

8) Playwright的常用操作方法

6. 验证码的处理

目标：针对验证码反爬虫机制，掌握几种常用验证码识别方法

1) OCR识别验证码

2) 图像匹配识别滑动验证码

3) 深度学习识别滑动验证码

7. Scrapy和分布式爬虫

目标：掌握scrapy爬虫框架和常用方法，理解分布式爬虫原理

1) scrapy框架介绍

2) scrapy入门

3) scrapy的节点选择

4) Spider的用法

5) 分布式爬虫原理

6) 分布式爬虫部署

8. 基于DeepSeek辅助的网络爬虫

目标：利用DeepSeek辅助爬虫，提高爬虫效率

1) 自动提取信息

2) 适应动态网页

3) 突破反爬机制

报名时间	2025-10-09 00:00 至 2026-12-31 00:00
培训时间	12小时, 在线课程随报随学
培训地点	在线学习，提供配套资料和授课老师答疑
培训费用	2000元，提供电子版发票+通知+结业证书
授课安排	12小时, 2025年10月录播

【授课老师】

陈远祥，北京邮电大学副教授，博士生导师，北京大学博士，北京大学优秀博士后，人工智能资深讲师。主要科研方向：数据分析、大数据处理、智能信号处理和图像。

发表SCI/EI学术论文100余篇，其中第一或通讯作者论文60余篇，授权国家发明专利20余项。主持国家自然科学基金面上项目，国家重点研发计划课题，国家自然科学基金青年项目及博士后基金等多个国家级和省部级项目。IEEE、OSA会员，多个SCI期刊审稿人。

【课程大纲】

1. 爬虫基础

目标：掌握爬虫基本概念，爬虫基本流程，掌握网页基础知识，学会简单网页制作

1) 什么是网络爬虫

2) 爬虫的基本原理

3) web网页基础

4) 爬虫基本流程

2. 页面解析和数据存储

目标：掌握正则表达式的用法，学会利用正则表达式进行文本信息提取，掌握常见文本信息存储方法

1) 基于正则表达式的文本信息提取

2) 文本文件存储

3) JSON文件存储

3. urllib和requests

目标：掌握两种基本的请求发送方法，通过案例展示，实现单页和多页数据爬取，掌握动态页面爬取方法，掌握模

拟登录，IP代理常用方法，实现高效率、大规模的网络爬取

1) 请求头的构造

2) get请求与post请求

3) 单页和多页数据的爬取

4) 动态页面的数据爬取

5) 模拟登录

6) 代理的基本使用

7) 高效代理池的维护

4. Beautiful Soup和Xpath

目标：通过案例，掌握两种高效的网页信息解析和提取方法，实现网络数据的高效提取

1) Beautiful Soup简介

2) Beautiful Soup的页面解析

3) Beautiful Soup节点选择方法

4) 什么是Xpath

5) Xpath常用匹配规则

6) Xpath的节点选择

5. Selenium和Playwright

目标：通过案例，掌握动态渲染页面的两种自动化的爬虫方法

1) Selenium的安装与配置

2) Selenium的基本使用

3) 页面的访问与节点定位

4) 节点信息的获取

5) Playwright的安装

6) Playwright的编写模式

7) Playwright代码生成

8) Playwright的常用操作方法

6. 验证码的处理

目标：针对验证码反爬虫机制，掌握几种常用验证码识别方法

1) OCR识别验证码

2) 图像匹配识别滑动验证码

3) 深度学习识别滑动验证码

7. Scrapy和分布式爬虫

目标：掌握scrapy爬虫框架和常用方法，理解分布式爬虫原理

1) scrapy框架介绍

2) scrapy入门

3) scrapy的节点选择

4) Spider的用法

5) 分布式爬虫原理

6) 分布式爬虫部署

8. 基于DeepSeek辅助的网络爬虫

目标：利用DeepSeek辅助爬虫，提高爬虫效率

1) 自动提取信息

2) 适应动态网页

3) 突破反爬机制

【联系方式】

尹老师

电话：13321178792

QQ：42884447

WeChat：JGxueshu

发表

讲师介绍

陈远祥

DeepSeek助力Python爬虫 2025 new

1. 爬虫基础

2. 页面解析和数据存储

3. urllib和requests

4. Beautiful Soup和Xpath

5. Selenium和Playwright

6. 验证码的处理

7. Scrapy和分布式爬虫

8. 基于DeepSeek辅助的网络爬虫

1. 爬虫基础

2. 页面解析和数据存储

3. urllib和requests

4. Beautiful Soup和Xpath

5. Selenium和Playwright

6. 验证码的处理

7. Scrapy和分布式爬虫

8. 基于DeepSeek辅助的网络爬虫

讲师介绍

相关课程

Peixun.net

DeepSeek助力Python爬虫 2025 new

请认真填写以下信息，方便为您服务

Peixun.net

您关于：

DeepSeek助力Python爬虫 2025 new

的报名信息已经提交成功。

您可以选择登录或者注册更方便您管理课程。

DeepSeek助力Python爬虫 2025 new

1. 爬虫基础

2. 页面解析和数据存储

3. urllib和requests

4. Beautiful Soup和Xpath

5. Selenium和Playwright

6. 验证码的处理

7. Scrapy和分布式爬虫

8. 基于DeepSeek辅助的网络爬虫

1. 爬虫基础

2. 页面解析和数据存储

3. urllib和requests

4. Beautiful Soup和Xpath

5. Selenium和Playwright

6. 验证码的处理

7. Scrapy和分布式爬虫

8. 基于DeepSeek辅助的网络爬虫

讲师介绍

相关课程

Peixun.net

DeepSeek助力Python爬虫 2025 new

请认真填写以下信息，方便为您服务

Peixun.net

您关于：

DeepSeek助力Python爬虫 2025 new

的报名信息已经提交成功。

您可以选择 登录 或者 注册 更方便您管理课程。

您可以选择登录或者注册更方便您管理课程。