Python数据挖掘与爬虫技术培训

时间:该课程暂无课程排期

地点:暂无地点信息

教练:W.W

重庆韬翔网络科技有限公司 创始人兼CEO

畅销书《精通Python网络爬虫》作者,资深IT技术专家、大数据专家和软件开发工程师,从事大型软件开发与技术服务多年,现任重庆韬翔网络科技有限公司、上海萌优电子商务有限公司创始人兼CEO,国家专利发明人。
精通Python技术,在Python网络爬虫、Python机器学习、Python数据分析与挖掘、Python WEB开发等多个领域都有丰富的实战经验。

| 课程大纲 |

主题

内容

第一天:
Python基础

Python语法基础
Python控制流结构
函数与模块
面向对象编程

Python数据分析与挖掘基础

人工智能技术与概述
Python数据分析模块使用基础
数据导入实战
数据清洗技术与数据预处理技术实战
Python数据可视化分析实战
淘宝网商品数据源的获取与数据预处理实战
淘宝网商品数据分布分析实战

常见分类案例与应用实战

手写体数字识别案例与实现
公司融资成功概率的预测案例与实现
分类效果太差怎么办?将弱分类改造为强分类案例与应用
课程销量预测案例与实战
常用的分类算法一览
趋势预测案例与应用
了解人工神经网络算法与应用

第二天:
Python网络爬虫基础

Python数据采集与网络爬虫基础原理
Python网络爬虫技能总览
语言的选择与框架的选择
正则表达式基础
Urllib模块与HTTP请求实战
浏览器伪装技术
案例:百度信息自动搜索爬虫
案例:糗事百科段子爬虫
案例:微信文章信息爬虫
构建UA代理池实战--防止简单反爬
构建IP代理池实战--防止被IP限制反爬

Python网络爬虫进阶

获取隐藏数据--抓包分析技术实战
腾讯视频评论爬虫实战
Scrapy框架基础
案例:京东商城商品信息爬虫
案例:新闻爬虫项目实战
中间件技术实战
案例:淘宝商品信息爬虫项目实战

第三天:
Python网络爬虫高级技术

常见的反爬套路与破解技巧
提升爬虫效率:分布式爬虫构建实战
数据去重技术:布隆过滤器实战
Selenium+PhantomJS技术实战
案例:腾讯动漫爬虫实战

数据清洗基础

数据清洗常见工具与选择
数据清洗的一般步骤
数据缺失值处理的一般套路
离群值处理的一般思路
数据转换与其他数据清洗基础

数据清洗工具与应用

datacleaner使用基础
使用datacleaner清洗你的数据
prettyPandas使用基础
使用prettyPandas快速实现数据清洗与做出美观的报表
数据清洗的其他方案:对比Python与R

总结

总结、回顾、答疑

国内外知名一线技术专家分享世界级软件研发管理实践,讲述他们在知名企业的成功案例与宝贵经验。
msup与企业深度合作,并为其量身定制个性化学习课程,精心设计内容与形式,提供最高质量的学习体验。

服务热线 : 400-812-8020

邮箱: market@msup.com.cn

官网: www.msup.com.cn