大家好,贴吧电脑下载相信很多的网友都不是很明白,包括爬取百度贴吧页面html也是一样,不过没有关系,接下来就来为大家分享关于贴吧电脑下载和爬取百度贴吧页面html的一些知识点,大家可以关注收藏,免得下次来找不到哦,下面我们开始吧!
爬取目标:贴吧内容
url:https://tieba.baidu.com/f?
数据要求:输入贴吧名字和页数爬取整页
请求库:urllib
写法:函数
难度:入门
fromurllib.requestimportRequest,urlopen\nfromurllib.parseimporturlencode\n\ndefget_html(url):\nheaders={\n&39;:&39;\n}\nrequest=Request(url,headers=headers)\nresponse=urlopen(request)\nreturnresponse.read()\n\ndefsave_html(file_name,html_bytes):\nwithopen(file_name,&39;)asf:\nf.write(html_bytes)\n\ndefmain():\ntieba_name=input(&39;)\npage=int(input(&39;))\nfornuminrange(0,page):\nargs={\n&39;:tieba_name,\n&39;:&39;,\n&39;:num*50\n}\nurl=&39;+urlencode(args)\nfile_name=&39;+str(num+1)+&39;\nhtml_bytes=get_html(url)\nprint(&39;%(num+1))\nsave_html(file_name,html_bytes)\n\nif__name__==&39;:\nmain()
END,本文到此结束,如果可以帮助到大家,还望关注本站哦!
