gb2312网站源码分享 25个经典网站源代码

大家好,今天小编来为大家解答以下的问题,关于gb2312网站源码分享,25个经典网站源代码这个很多人还不知道,现在让我们一起来看看吧!

1.1获取页面信息

1.2发现获取页面内容出现乱码

1.3分析页面信息得原页面编码为:gb2312,修改获取内容编码

2.1主页面源码已经获取到了,那我们到网页里看看源码的效果图吧

完整代码

importre\nimportos\nimportrequests\n”’\n小编准备的python学习资料,加群:821460695即可免费获取!\n”’\n下载图片函数\n”’\nfolder_name:文件夹名称,按图片简介\npicture_address:一组图片的链接\n”’\ndefdownload_pictures(folder_name,picture_address):\n\tfile_path=r’G:\\Beautiful\\{0}’.format(folder_name)\n\tifnotos.path.exists(file_path):\n\t\t下载图片保存到新建文件夹\n\tforiinrange(len(picture_address)):\n\t\t根据下载链接,发送请求,下载图片\n\t\t\tresponse=requests.get(picture_address[i][0])\n\t\t\tf.write(response.content)\n2.设置页面编码为gb2312\nhtml_code.encoding=’gb2312’\nhtml_text=html_code.text\n3.从主页面提取出所有图片组简介及图片组的链接\n3.1获取链接\npattern01=r'<ahref=”(.*?)”title=”.*?”class=”tit”target=”_blank”>.*?</a><span><u><ahref=”http://www.27270.com/ent/meinvtupian/”title=”美女图片”>美女图片</a>’\nbeautiful_url=re.findall(pattern01,html_text)\n3.2获取简介\npattern02=r'<ahref=”.*?”title=”.*?”class=”MMPic”target=”_blank”><i><imgsrc=”.*?”width=”190″height=”280″alt=”(.*?)”/></i></a>’\nbeautiful_words=re.findall(pattern02,html_text)\nlen(beautiful_url)\nforiinrange(len(beautiful_url)):\n\t4.2在页面中找到图片url\n\t4.3翻页爬取\n\t4.3.2翻页,获取图片地址\n\tforjinrange(len(pictures_url)):\n\t\tother_picture_url=r’http://www.27270.com/ent/meinvtupian/2018/{0}’.format(pictures_url[j])\n\t\tpictures_codes=requests.get(other_picture_url)\n\t\tpictures_codes.encoding=’gb2312’\n\t\tpictures_words=pictures_codes.text\n\t\tpicture_02=re.findall(pattern03,pictures_words)\n\t\tpicture_address.append(picture_02)\n\tprint(picture_address)\n\tdownload_pictures(beautiful_words[i],picture_address)\n

运行结果

.

关于本次gb2312网站源码分享和25个经典网站源代码的问题分享到这里就结束了,如果解决了您的问题,我们非常高兴。

Published by

风君子

独自遨游何稽首 揭天掀地慰生平