各位老铁们好,相信很多人对仿漫画网站源码分享都不是特别的了解,因此呢,今天就来为大家分享下关于仿漫画网站源码分享以及漫画网站模版的问题知识,还望可以帮助大家,解决大家的一些困惑,下面一起来看看吧!
在之前的文章中(Python爬取动态网页之selenium扫盲篇)用一个简单的介绍了一下Selenium,这次我们用Selenium爬取,网址:http://manhua.sfacg.com/
主要分为几个步骤:
从网页输入框中输入漫画名,检测是否含有该漫画
获取到漫画的链接,遍历出所有章节的链接
找到下一页按钮,下载每一页的图片
从网页输入框中输入漫画名,检测是否含有该漫画
这个和上篇文章中往百度输入框中的操作一样
这里我们需要判断一下有没有找到该漫画
获取到漫画的链接,遍历出所有章节的链接
在上面的步骤中我们获取到了漫画的链接,用浏览器打开
这里怎么样获取每一章节的链接就不讲了,代码更清楚
我们将所有章节的链接赋给了chapters,接下来遍历所有章节去下载图片
找到下一页按钮,下载每一页的图片
我们当中用到了两个函数,mkdir函数是用来建立漫画目录的,save_pic函数用来将图片存储到文件夹中
查看我们下载的图片
到这里爬取漫画就完成了,但是利用Selenium效率非常低,我下载这个漫画大概一共55话,每话平均22张图片,全部下载完用了18分钟
本文章是由热衷python和前端原创发布,如需转载请注明出处
OK,本文到此结束,希望对大家有所帮助。
