python爬虫视频包含程序、操作详细步骤
视频讲解清晰,零基础也可以。
主要包括:
【python 语法入门】
1、Python跟英语一样是一种语言
2、数据类型之字符串
3、 数据类型之列表元组集合
4、 数据类型之字典
5、数据类型之布尔值、None
6、逻辑语句(if&for&tryexcept)
7、列表推导式
8、理解函数
9、常用的内置函数
10、文件路径库os库
11、数据清洗re库
12、数据存储csv库
13、初学python常出错误汇总
【数据采集】
1、网络爬虫原理
2、发现网址规律
3、网络访问requests库
4、网页解析pyquery库
5、实战:大众点评
6、如何解析json数据
7、实战: 知乎
8、实战: 微博
9、实战: 批量下载多媒体文件
10、实战: 批量下载上市公司定期报告pdf
11、实战: 各种宏观经济、金融、政治数据下载
12、爬虫知识点总结
【文本处理入门】
1、文本分析概述
2、读取文件中数据(pdf、docx、txt、excel)
3、中文分词及数据清洗
4、实战: 词频统计(词云图制作)
5、实战: 中文情感分析(词典法)
6、实战: 将多文件数据汇总到一个excel
7、数据分析pandas库快速入门
8、实战: 对excel中的文本进行情感分析
9、从pdf中提取表格数据
10、共现法扩展情感词典(领域词典)
11、从非结构化文本数据中提取结构化数据(文本数据清洗re库)
【文本分析进阶】
1、了解机器学习
2、使用机器学习做文本分析的流程
3、scikit-learn机器学习库简介
4、文本特征抽取(特征工程)
5、实战:在线评论情感分析(机器学习法)
6、文本相似性(cos/编辑距离/jaccard)
7、实战: 使用文本相似性自动识别冲击(改变的)时间点
8、Kmeans聚类算法
9、LDA话题模型
10、文本分析在经管研究中的应用
评论前必须登录!
注册