小说阅读网站app程序源码分享?app小说网站源码运营版

很多朋友对于小说阅读网站app程序源码分享和app小说网站源码运营版不太懂,今天就由小编来为大家分享,希望可以帮助到大家,下面一起来看看吧!

《天才基本法》看完了,听说对原著改编很大,准备找原著看看。

以前学过一点儿python,《天才基本法》剧里多次推崇python让我又燃起热情复习了一下,正好就有了这个任务:python爬取《天才基本法》原著小说,然后导入到kindle等电纸书设备阅读。

由于长时间不用有些生疏,捣鼓了两小时才成功,python真是简练的语言,算上空行代码也没有50行!

首先搜索“天才基本法在线阅读”找到某个网站,你也可以直接使用我下面代码里那个网址。然后下载目录页的章节列表,最后逐个下载章节合并成一个txt文本文件。

先写一个根据网址获取html源码的通用函数。

def获取网页源码(url):\nheaders={\n&34;:&34;\n}\ntry:\nr=requests.get(url=url,headers=headers)\nr.raise_for_status()\nr.encoding=r.apparent_encoding\nreturnr.text39;网页地址访问失败&39;获取失败&开始爬取目录\n目录地址=&39;\n目录源码=获取网页源码(目录地址)\n章节地址和名称列表=[]\n源码解析器=BeautifulSoup(目录源码,&39;)\n目录代码=源码解析器.select(&39;)39;&39;a&39;href&39;章节列表下载成功!&按照章节顺序下载章节内容并保存到文件\n电子书文件=open(&39;,&39;,encoding=&34;)\nfor章节in章节地址和名称列表:\n章节地址=章节[0]\n章节名称=章节[1]\n章节源码解析器=BeautifulSoup(获取网页源码(章节地址),&39;)\n本章内容代码=章节源码解析器.find(&39;,id=&39;)\n本章内容文本=本章内容代码.text\n电子书文件.write(章节名称+本章内容文本+&34;)\nprint(章节名称+&39;)\n电子书文件.close()\nprint(&39;)

因为有200多页,运行了大约5分钟才结束。

用多线程可以加速,但我还不会,会的请指教一下。

另外有个小问题没有解决,在这里请教一下。小说源码中有许多空格和网页换行,如:

“想到这里,林朝夕的手机铃声响了。<br><br>她硬着头皮,赶忙接起”

,我使用“本章内容代码.text”忽略过去,但是这样就没有换行了,想进行替换:

本章内容文本=本章内容代码.replace(&34;,&34;)

但又提示“TypeError:&39;objectisnotcallable”,请问怎么办?

OK,本文到此结束,希望对大家有所帮助。

Published by

风君子

独自遨游何稽首 揭天掀地慰生平