又拍相册网站源码分享(又拍图片管家手机版)

各位老铁们,大家好,今天由我来为大家分享又拍相册网站源码分享,以及又拍图片管家手机版的相关问题知识,希望对大家有所帮助。如果可以帮助到大家,还望关注收藏下本站,您的支持是我们最大的动力,谢谢大家了哈,下面我们开始吧!

思路如下

爬取测试网站获取该网站多个主页的url获取主页中相册首页url得到相册内所有img图片的地址保存图片文件遍历执行

爬取测试网站

这个网站是百度搜的壁纸网站练手用的第一次用xpath可能不太熟练下面是网址

http://www.win4000.com/meinvtag2_1.html

获取该网站多个主页的url

defget_url_list():26,28,\nforjinrange(1,5):\ntry:\nurl=f&34;\nstatus=requests.get(url).status_code\nifstatus==200:\nli.append(url)\nelse:\nbreak\nexcept:\npass\nreturnli\n\n123456789101112131415

获取主页中相册首页url

defget_url(url):请求主页html源码\nret2=ret.textselector方法把ret转换数据类型放入变量selector\nurl2_list=selector.xpath(&34;Left_bar&39;).getall()print(url2_list)\nreturnurl2_list\n\n12345678

得到相册内所有img图片网址

defget_img_url(url):遍历从0到15\niflen(li)!=0:(列表从0开始所以需要i-1)\nresp=requests.get(url=url,headers=headers)判断网页状态码值为200为正常执行存储图片网址\nselector_1=parsel.Selector(resp.text)39;//div[@class=&34;]/a/@href&使用xpath定位到下一张图片网址\nli.append(result[0])保存文件\nifnotos.path.exists(f&34;/&39;):\nret=requests.get(url=url,headers=headers).text通过selector方法把ret转换数据类型放入变量selector\nimg_url=selector.xpath(&34;pic-meinv&39;).get()\nimg_data=requests.get(url=img_url,headers=headers).content\nfile_name=img_url.split(&39;)[-1]\nwithopen(f&39;,mode=&39;)asf:\nf.write(img_data)\nprint(&39;,file_name)\n\n1234567891011

遍历执行

if__name__==&39;:\n39;http://www.win4000.com/meinvtag26_1.html&list\nforimg_urlinget_img_url(url1):\nsave_img(img_url)\nexcept:\npass\n123456789

完整代码如下

importrequests\nimportparsel\nimportos\n\n\nheaders={&39;:&39;}\n\n\ndefget_url_list():34;http://www.win4000.com/meinvtag{i}_{j}.html&得到主页网址中,我需要的页面,相册第一张图片网页的html\nret=requests.get(url=url,headers=headers)将请求的html源码放入ret2变量\nselector=parsel.Selector(ret2)39;//div[@class=&34;]//ul/li/a/@href&getall方法提取每个相册首页源码\n得到相册内所有img图片的网址url\nli=[]\nforiinrange(0,15):如果li的长度不为0执行i-1定位到li列表内i个\nurl=li[i-1]get到url放入resp变量\nifresp.status_code==200:selector方法,把resp变量转换数据类型,放入变量selector_1\nresult=selector_1.xpath(&34;pic-meinv&39;).getall()将网址放入列表li\nelse:\nbreak\nreturnli\n\n\ndefsave_img(url):39;/{url.split(&34;)[-1]}&得到相册内部html源代码放入ret3变量\nselector=parsel.Selector(ret)39;//div[@class=&34;]/a/img/@src&39;/&39;img_test//{file_name}&39;wb&39;数据保存完成&39;__main__&url=&39;\ntry:\nforiinget_url_list():\nforurl1inget_url(i):#list\nforimg_urlinget_img_url(url1):\nsave_img(img_url)\nexcept:\npass\n\n12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061626364656667686970

小编是一名python开发工程师,这里有我自己整理了一套最新的python系统学习教程,包括从基础的python脚本到web开发、爬虫、数据分析、数据可视化、机器学习等。想要这些资料的可以关注小编,并在后台私信小编:“01”即可领取

END,本文到此结束,如果可以帮助到大家,还望关注本站哦!

Published by

风君子

独自遨游何稽首 揭天掀地慰生平