其实影视投资网站源码分享大全的问题并不复杂,但是又很多的朋友都不太了解影视投资项目投资平台,因此呢,今天小编就来为大家分享影视投资网站源码分享大全的一些知识,希望可以帮助到大家,下面我们一起来看看这个问题的分析吧!
以前我写过一些爬取猫眼电影数据的图文:
如何利用C爬取「猫眼电影:热映口碑榜」及对应影片信息?如何利用C+Python破解猫眼电影的反爬虫机制?》来介绍。这里暂且搁置一下。
最后,我们用Jumony这套开源代码来获取网页对应的HTMLDOMTREE,这套开源代码可以在Github上下载。下载地址为:
https://github.com/Ivony/Jumony
Jumony下载
这里对Jumony就不做过多介绍了,要是大家感兴趣,可以在图文下方留言,我后面再写几篇图文来介绍这个工具。
以上对「猫眼电影:国内票房榜」以及对应影片详情的网页进行了详细的分析,也确定了使用的开源工具,下面我们看看具体的代码。
1.构建存储电影信息的结构Film
publicclassFilm\n{\n///<summary>\n///获取或设置排名\n///</summary>\npublicintNum{get;set;}\n///<summary>\n///获取或设置名称\n///</summary>\npublicstringMovieName{get;set;}\n///<summary>\n///获取或设置类型\n///</summary>\npublicstringType{get;set;}\n///<summary>\n///获取或设置主演\n///</summary>\npublicstringActor{get;set;}\n///<summary>\n///获取或设置上映时间\n///</summary>\npublicstringTime{get;set;}\n///<summary>\n///获取或设置实时票房\n///</summary>\npublicstringBoxInfo{get;set;}\n///<summary>\n///获取或设置总票房\n///</summary>\npublicstringSumBoxInfo{get;set;}\n///<summary>\n///获取或设置简介\n///</summary>\npublicstringIntroduction{get;set;}\n///<summary>\n///Markdown格式化输出\n///</summary>\n///<returns></returns>\npublicstringToString()\n{\nstringstr=Environment.NewLine\n+”—“+Environment.NewLine\n+”Top”+Num.ToString().PadLeft(2,’0′)+”<br>”\n+MovieName+Environment.NewLine\n+”-类型:”+Type+Environment.NewLine\n+”-主演:”+Actor+Environment.NewLine\n+”-上映时间:”+Time+Environment.NewLine\n+”-实时票房:<spanstyle=’color:757575′><b>”+SumBoxInfo\n+”</b></span>”+Environment.NewLine\n+”-剧情简介:”+Introduction+Environment.NewLine;\nreturnstr;\n}\n}\n
2.获取对应网页的HTMLDOMTREE
publicstaticIHtmlDocumentGetHtmlDocument(stringurl)\n{\nIHtmlDocumentdocument;\ntry\n{\ndocument=newJumonyParser().LoadDocument(url);\n}\ncatch\n{\ndocument=null;\n}\nreturndocument;\n}\n
3.获取存储票房数据的电影列表List<Film>
publicstaticList<Film>GetFilmsTicket()\n{\nList<Film>result=newList<Film>();\nstringurl=”https://maoyan.com/board/1″;//国内票房榜\nIHtmlDocumentdoc=GetHtmlDocument(url);\nif(doc==null)\nreturnresult;\nList<IHtmlElement>lists=doc.Find(“dd”).ToList();\nfor(inti=0;i<lists.Count;i++)\n{\nList<IHtmlElement>infor=lists[i].Find(“p”).ToList();\nFilmitem=newFilm();\nitem.Num=i+1;//排名\nstringdw,ticket;\nList<IHtmlElement>s;\nif(infor.Count<5)\n{\n//有些电影没有演员的数据,所以这里分开了。\nitem.Time=infor[1].InnerHtml().Trim().Remove(0,5);//上映时间\ndw=infor[2].InnerHtml().Trim();\ndw=dw.Remove(0,dw.Length-1);//实时票房单位\ns=infor[2].Find(“.stonefont”).ToList();\nticket=s[0].InnerHtml().Trim();//加密的实时票房\nitem.BoxInfo=ticket+dw;//实时票房\ndw=infor[3].InnerHtml().Trim();\ndw=dw.Remove(0,dw.Length-1);//总票房单位\ns=infor[3].Find(“.stonefont”).ToList();\nticket=s[0].InnerHtml().Trim();//加密的总票房\nitem.SumBoxInfo=ticket+dw;//总票房\n}\nelse\n{\nitem.Actor=infor[1].InnerHtml().Trim().Remove(0,3);//演员\nitem.Time=infor[2].InnerHtml().Trim().Remove(0,5);//上映时间\ndw=infor[3].InnerHtml().Trim();\ndw=dw.Remove(0,dw.Length-1);//实时票房单位\ns=infor[3].Find(“.stonefont”).ToList();\nticket=s[0].InnerHtml().Trim();//加密的实时票房\nitem.BoxInfo=ticket+dw;//实时票房\ndw=infor[4].InnerHtml().Trim();\ndw=dw.Remove(0,dw.Length-1);//总票房单位\ns=infor[4].Find(“.stonefont”).ToList();\nticket=s[0].InnerHtml().Trim();//加密的总票房\nitem.SumBoxInfo=ticket+dw;//总票房\n}\nIHtmlElementa=infor[0].Find(“a”).ToList()[0];//获取影片url\nitem.MovieName=a.InnerHtml().Trim();//名称\nurl=”https://maoyan.com”+a.Attribute(“href”).AttributeValue;\nIHtmlDocumenttemp=GetHtmlDocument(url);\nList<IHtmlElement>t=temp.Find(“li.ellipsis”).ToList();\nitem.Type=t[0].InnerHtml();//类型\nList<IHtmlElement>b=temp.Find(“.dra”).ToList();\nitem.Introduction=b[0].InnerHtml();//介绍\nresult.Add(item);\n}\nreturnresult;\n}\n
4.格式化输出「猫眼电影:国内票房榜」
privateList<Film>_lstTicket=newList<Film>();//票房\nprivatevoidbtnTicket_Click(objectsender,EventArgse)\n{\nif(_lstTicket.Count==0)\n_lstTicket=FilmHtmlDocument.GetFilmsTicket();\nstringresult=string.Empty;\nfor(inti=0;i<_lstTicket.Count;i++)\n{\nresult+=_lstTicket[i].ToString()\n+Environment.NewLine\n+”广告”+Environment.NewLine;\n}\nShowMarkdownData(result);\nShowInGrid(_lstTicket);\n}\n
表格显示
privatevoidShowMarkdownData(stringstr)\n{\nstringtemp=Environment.GetEnvironmentVariable(“TEMP”);\ntemp+=”\\\\film.txt”;\nStreamWritersw=File.CreateText(temp);\nsw.Write(str);\nProcess.Start(temp);\nsw.Close();\n}\n
Markdown显示
注:此处输出的是已经破解猫眼电影反爬虫机制之后得到的结果,关于如何破解猫眼电影的反爬虫机制,我会在下周二的技术图文中跟大家详细介绍。
5.Markdown文本的HTML渲染
HTML渲染
到此为止,关于如何利用C爬取One持有者返利数据!如何利用C爬取BigOne交易所的公告!如何利用C实现K最邻近算法?如何利用C+KDTree实现K最邻近算法?如何利用C实现神经网络的感知器模型?如何利用C爬取「京东-计算机与互联网图书销量榜」!如何利用C爬取「互动出版网-计算机图书销量榜」!如何利用C爬取带Token验证的网站数据?
影视投资网站源码分享大全的介绍就聊到这里吧,感谢你花时间阅读本站内容,更多关于影视投资项目投资平台、影视投资网站源码分享大全的信息别忘了在本站进行查找哦。
