大家好,感谢邀请,今天来为大家分享一下票开奖网站源码的问题,以及和我用Python把双色球的网站“黑”了!下个1.5亿大奖会是我吗的一些困惑,大家要是还不太明白的话,也没有关系,因为接下来将为大家分享,希望可以帮助到大家,解决大家的问题,下面就开始吧!
(1)分析标题
通过分析,发现标题信息在如下地方显示:
私信小编007即可获取小编精心准备的资料呢!如有需要源码请单独私信!
(2)分析开奖号码
通过分析,发现开奖号码在如下地方显示:
(3)分析往期开奖结果url
通过分析,发现网页是通过一个下拉菜单,选择相应的期号,会自动跳转对应的网站。
网站规律就是http://kaijiang.500.com/shtml/ssq/+”期号”+.shtml
2、思路分析
先提取网页数据,用BeautifulSoup从网页抓取数据,然后通过正则表达式,提取想要的数据。
3、代码:
importrequests\nfrombs4importBeautifulSoup\nimportre\n爬取标题\ndefgettitle(html):\ntitlehtml=html.find_all(“td”,class_=”td_title01″)\ntitletxt=str(titlehtml).strip()\np1=r’shtml”>(.*?)<f.*?<strong>(.*?)</strong>.*?</font>(.*?)</a>\n.*?right”>(.*?)</span>’\ntitles=re.compile(p1,re.S).findall(titletxt)\nqi=list(titles[0])\nqi[2]=(‘期’)\nreturn”.join(qi)\n爬取蓝色球\ndefgetbule(html):\nbulehtml=html.find_all(“li”,class_=”ball_blue”)\nbuletxt=str(bulehtml).strip()\np1=r’blue”>(.*?)</li>’\nbules=re.compile(p1,re.S).findall(buletxt)\nreturn’蓝球:’+”.join(bules)\n写入txt文件\nwithopen(r’D:\\1.txt’,’a’)asf:\nprint(htmlurl)\nf.write(a+’\\n’+b+’\\n’+c+’\\n’)\nf.close()\nif__name__==”__main__”:\nmain()\n
如果你还想了解更多这方面的信息,记得收藏关注本站。
