本站支持尊重有效期内的版权/著作权,所有的资源均来自于互联网网友分享或网盘资源,一旦发现资源涉及侵权,将立即删除。希望所有用户一同监督并反馈问题,如有侵权请联系站长或发送邮件到ebook666@outlook.com,本站将立马改正
作者多年从事网络爬虫领域的教学及研究工作,有着丰富的实践经验。
面向初学者全面介绍Python网络爬虫的实战宝典,涵盖网络爬虫的核心概念、算法和技术实现,内容系统,案例丰富。
本书是一本系统、全面地介绍Python网络爬虫的实战宝典。作者融合自己丰富的工程实践经验,紧密结合演示应用案例,内容覆盖了几乎所有网络爬虫涉及的核心技术。在内容编排上,一步步地剖析算法背后的概念与原理,提供大量简洁的代码实现,助你从零基础开始编程实现深度学习算法。
全书按照学习爬虫所涉及的核心技术从易到难,再到应用的顺序分为14章。第1章介绍Python的安装配置和基础语法。 第2章介绍爬虫类型、抓取策略以及网络基础知识。第3章介绍Python常用库。第4章介绍正则表达式的语法、匹配规则。第5章讲解PIL库、Tesseract库和TensorFlow库的语法、类型和识别方法。第6章介绍抓包利器Fiddler。第7章介绍数据存储。第8章介绍Scrapy爬虫框架。第9章介绍多线程爬虫。第10章介绍动态网页爬虫。第11章介绍分布式爬虫。第12章介绍电商网站商品信息爬虫项目。第13章介绍生活娱乐点评类信息爬虫。第14章介绍图片信息类爬虫项目。
赵国生,哈尔滨师范大学教授,工学博士,硕士生导师,黑龙江省网络安全技术领域特殊人才。主要从事可信网络、入侵容忍、认知计算、物联网安全等方向的教学与科研工作。担任中国计算机学会容错专委会委员、黑龙江省计算机学会网络专委会委员、中国青年博士论坛网络专委会委员、国家自然科学基金委项目评审专家、黑龙江省国资采购专家组成员、黑龙江省财政厅及黑龙江省高等法院信息化资讯专家、黑龙江省教育厅行业信息系统安全专题培训讲师、中国计算机学会高级会员、中国计算机学会YOCSEF哈尔滨副主席。荣获哈尔滨师范大学“先进工作者”“五四青年奖章”“宁齐堃”教学名师等荣誉。主持国家自然科学基金、黑龙江省自然科学基金、黑龙江省科技厅科技攻关等项目10项,发表SCI/EI检索论文50余篇,发明专利2项、实用新型专利6项,拥有软件著作权6项,获省/部级科技进步一等奖2项、三等奖1项,撰写《Linux操作系统原理与应用》《Matlab数学建模与仿真》《Matlab完全学习手册》《精通Labivew》等编著6部。目前担任《电子学报》《通信学报》《系统仿真学报》等期刊审稿专家。