今天给各位分享网站源码分享抓取的知识,其中也会对获取整个网站源码进行解释,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧!
为了实现抓取某目标网站的歌曲以及作者,通过python+Xpath方式实现,并将抓取的结果保存到csv格式的excel表格里。
2、实现步骤:
(1)获取该网站的网页源码
(2)使用Xpath方式进行解析,找到要抓取的歌曲和作者所在的段落
(3)将解析后的结果写入到CSV格式的excel中
3、关键技术:
python、requests、Xpath、csv文件写入
4、代码实现:
34;http://www.show160.com/&34;GBK&先抓大,找到歌曲信息所在的片段\nitem_list=selector.xpath(&34;music_con1_1&34;cont&34;music_list&39;)\nsongAndAuthorList=[]\n39;div[@class=&34;]/a/text()&39;div[@class=&34;]/a/text()&34;name&34;author&将结果存入到excel表格里\nwithopen(&39;,&39;,encoding=&39;,newline=&39;)asf:\nwriter=csv.DictWriter(f,fieldnames=[&39;,&39;])\nwriter.writeheader()\nwriter.writerows(songAndAuthorList)
5、代码解析:
下面是源码的截图,
好了,文章到此结束,希望可以帮助到大家。
