大家好,今天来为大家分享笑话网站源码分享的一些知识点,和笑话网站有哪些的问题解析,大家要是都明白,那么可以忽略,如果不太清楚的话可以看看本篇文章,相信很大概率可以解决您的问题,接下来我们就一起来看看吧!
Python版本:Python3
模块:Requests、Beautifulsoup、LXML
模块安装:pipinstallrequests、pipinstallbeautifulsoup4、pipinstalllxml
IDE:pycharm
网站分析
通过requests库来看看这个页面的源代码:
点开一个笑话查看全文,你会发现每一个都有一个?.html
按下F12查看其源代码,按照其布局发现:
每个笑话对应其中一个<li>标签,分析得每个笑话展开全文的网址藏在href当中,我们只需要获取href就能得到笑话的网址
通过以上代码,成功获得第一页所有笑话的网址后缀:
简单分析笑话页面html内容后,接下来获取一个页面全部笑话的内容:
关于笑话网站源码分享的内容到此结束,希望对大家有所帮助。
