Python,可以帮忙抢票,可以爬虫东西,关于Python爬虫怎么做?今天教大家一个案例,python爬虫多线程实战:爬取美桌1080p壁纸图片 | 技术
技术点分析
· 爬虫requests
· 多线程threading
· 文件io读写操作
· xpath 提取ur
· 正则
实战
· 分析url
搞清楚各个url 的关联win4000.com/wallpaper_205_0_10_1.html
URL中与分类的关系:
wallpaper : 桌面壁纸
205 :壁纸分类对应大陆明星
10 :图片尺寸对应1920*1080
分析到这一部,我们知道 ,如果要需要其他类型的壁纸,只需要更改网站分类代码就可以了。
· 谷歌 charme ,通过右键检查
chrame 浏览器右键提示。
按图顺序,依次找到对应的html标签。
通过查看,我们发现 中间展示 的图片是由一个ul 标签包裹的 多个Li
我们所要跳转的链接 就在 Li 标签中, 这时就需要使用xpath进行数据的提取。
到此,我们第一层url 的分析就完成了。可以写出以下代码段。
此时通过xpath 获到当前页面中的 ul 中所有li 标签了。
那单个明星的跳转链接只需要再次xpath 进行提取就Ok了。
完成到这里你的代码运行结果应该如下:是两个列表list。
运行结果
准备下载图片
到这,完成第一步,你已经成功获到 每个明星的跳转链接 :
url: win4000.com/wallpaper_detail_153895.html
再次进行url 的分析:
初步分析
通过上图的分析,可以找到这张图,是我们要 1080规格的。但很可惜,一共9张,现在只能找到一张图片的url。
选其中两张图片地址对比:
pic1.win4000.com/wallpaper/2018-12-26/5c22eb195abe8.jpg
pic1.win4000.com/wallpaper/2018-12-26/5c22eb1c722dc.jpg
好像就是后面文件名不同。如果一张张取是不是很麻烦?
不信你自己去试一下。点再分析一下页面,有个 【查看原图】 选项,点一下试试呢?
点击上图出,点完发现了url的变化。
再看看有没有惊喜的地方 :
上图为url分析。
通过上图的分析 ,我们发现原来这个big页面有我们想要的所有 1080P的图片,而且,全是用ul 包裹,放到单个Li 标签中 。那简单了,用之前的办法 再提取一次,就出来了。代码如下:
到这里,我们第一步就完成了一页24个明星图片的地址url的爬取。第二步,完成了单个明星的1080图片地址url的爬取。下一步,我们把图片保存到本地就顺利结束。
图片保存
按需求,要单独到一个文件夹内。那我们就需要在本地路径内 创建对应的文件夹。此处使用 star_img_name 列表中的值。需要使用到i/o读写操作。
顺利完成 这个需求:
源码展示
代码运行结果若不同,可看一眼源码:
运行起来是不是很慢(完善版使用多线程),而且这样看代码,是不是有种:干干巴巴的,麻麻咧咧的,一点都不圆润,盘他!!
完善版是可以完成可选分类,可选规格 ,多线程版。希望这个小实战案例可以帮到大家。
有关于Python爬虫的课程:
Python爬虫数据挖掘基础教程
python网络爬虫第一天
python网络爬虫第二天
有想学习的小伙伴,可以关注黑马程序员,后台回复“Python爬虫”哦!
学习Python可以参考回答:https://www.wukong.com/question/6621147311907012872/
Python可以用来做:
Web 应用开发、自动化运维、网络爬虫、数据分析、科学计算、人工智能,还可以用在各种场景与各种平台、设备、语言进行连接,因此被称为胶水语言。
相关岗位:
Linux运维
Python web网站工程师
Python web全栈工程师
Python自动化测试
Python 爬虫开发工程师
数据分析师
网络编程工程师
......
既然一直用Java应该在编程这一块是比较擅长的,我想提这个问题的人是想知道python的应用领域,这里谈一下我个人看法。
人工智能领域,因为最近几年人工智能的火热,Python也深受大家的欢迎,不知道有没有受到相关的感染
python在人工智能方面的应用,python是一种简单、易用但专业、严谨通用的语言,让普通人很容易入门,把各种基本的元素组合在一起协调动作。
正是因为这样,Python始终让开发者关注业务逻辑的本身,而不用考虑CPU等其它一些性能方面的不足,如果执行速度慢,可以利用C语言,与之相配合,来达到执行速度的提升。
python在人工智能方面的应用,对我们来说,是一件好事,无论是电子商务、搜索引擎、智能硬件等,都只是产生数据的源泉,我们都可以使用python依据商业逻辑希望得到的结果。
python在web程序中的应用,django、flask等一批优秀的框架为我们写web程序提供了最大可能的便捷
google、youtobe、豆瓣等国内外知名的公司都有在使用Python在开发应用,当然,对于我们普通的用记,Python中的django、flask框架为我们的web程序提供了最大的灵活性,我们可以通过简单的几行代码,就可以写出一个web程序,提高了我们的工作效率。
python在数据分析上的应用,更是许多人学习的初衷,简单、便捷的处理数据方式,为数据分析师们提供了更多的可能。
一个非常好的问题。制定一个学习计划,学习基础知识后,多写代码。
一,学习计划1. 制定一个切实可行的学习计划,要自律,不可三天打鱼两天筛网
2. 保证学习时间,多写代码
二,学习Python基础掌握Python语言基础,数据类型、基本语法、常用数据结构、常用类,等等,网上资源很多。
三,多写代码推荐一个在线编程网站,HackerRank,看名字就知道很牛,Hacker排行榜。其实里面有很多针对初学者的编程练习题,并且提供了成绩查询、排名、竞赛等功能。
1,注册账号,登录,选择要学习的编程语言
2,选择题目,筛选难度、功能类别
3,编写代码,测试,提交
4,根据通过单元测试情况获得分数,获得Python勋章。
我是工作多年的Web应用架构师,陆续发布关于软件开发方面的文章,欢迎关注我,了解更多IT专业知识。
总结,以上就是关于python网页版编程以及python爬虫怎么做的经验分享,卡友有疑问可以加wx或扫码加群!Copyright © 广州京杭网络科技有限公司 2005-2024 版权所有 粤ICP备16019765号
广州京杭网络科技有限公司 版权所有