微博网站源码分享,微博网站源码分享在哪

大家好,今天给各位分享微博网站源码分享的一些知识,其中也会对微博网站源码分享在哪进行解释,文章篇幅可能偏长,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在就马上开始吧!

Python库:requests、re、urllib、BeautifulSoup

二、实现分析:

尝试爬虫登陆网站时,会涉及到很多Javascript、验证码、cookies等很多的问题,为了避免太麻烦的登陆方式,我建议大家访问对应网站的移动版。比如访问新浪微博的移动版:http://weibo.cn,登陆网址为http://login.weibo.cn/login/,登陆界面为:

登陆界面比较简单,不涉及验证码和Javascript处理的问题。

分析网页源码,登陆主要需要填写一个表格的数据,表单数据名分别为:’tryCount’、’submit’、’vk’、’password_7659’、’backURL’、’remember’、’mobile’、’backTitle’,这其中’password_7659’和’mobile’需要自己填写对应的密码和账户名,其余的直接提取原网页的数据即可。

这里,新浪对输入元素名做了处理,每次访问得到的password元素名都不相同,连接了一个四位的随机数字,所以提取password时需要用正则匹配出来。

好了,文章到此结束,希望可以帮助到大家。

Published by

风君子

独自遨游何稽首 揭天掀地慰生平