分享一段源码挖掘IMDb电影信息

各位老铁们,大家好,今天由我来为大家分享影视传媒公司网站源码,以及分享一段源码挖掘IMDb电影信息的相关问题知识,希望对大家有所帮助。如果可以帮助到大家,还望关注收藏下本站,您的支持是我们最大的动力,谢谢大家了哈,下面我们开始吧!

Python能抓取网页上的信息,当然bash也可以,今天小编就拿bash脚本来挖掘IMDb中的电影信息噢!!挺好玩的!!!

我们是做教育的,希望大家能够学到知识,这个一直是我们的初衷!!

电影网站https://www.imdb.com,这个网站我自己登入上去看了看,确实可以登入,并不需要挂vpn,可惜的是英文。

因为代码太长了,我分屏了一下,大伙可以看行号码,不过我会把源码分享出去。

代码里用到了大量的sed和grep,这个sed我之前有分享,改天找个机会说说grep的使用。

写好了运行一下吧,在脚本后面lawrenceofarabia是电影的名字。

你看吧!出来一系列的电影了!当然你的英文要好!!

那我现在就分享一下代码吧!!

Date2019-09-17\nPATH=/bin:/sbin:/usr/sbin:/usr/local/bin:/usr/local/sbin:~/bin\nexportPATH\n\ntitleurl=”http://www.imdb.com/title/tt”\nimdburl=”http://www.imdb.com/find?s=tt&exact=true&ref_=fn_tt_ex&q=”\ntempout=”/tmp/moviedata.$$”\n\nsummarize_film()\n{\ngrep”<title>”$tempout|sed’s/<[^>]*>//g;s/(more)//’\ngrep–color=never-A2′<h5>Plot:’$tempout|tail-1|\\\ncut-d\\-f1|fmt|sed’s/^//’\nexit0\n}\ntrap”rm-f$tempout”0115\n\nif[$-eq1-a-z”$nodigits”];then\nlynx-source”$titleurl$1/combined”>$tempout\nsummarize_film\nexit0\nfi\n\n\nfixedname=”$(echo$@|tr”’+’)”\nurl=”$imdburl$fixedname”\nlynx-source$imdburl$fixedname>$tempout\n\nfail=”$(grep–color–color=never'<h1class=”findHeader”>No’$tempout)”\n\nif[!-z”$fail”];then\necho”Failed:noresultsfounfor$1″\nexit1\nelif[!-z”$(grep'<h1class=”findHeader”>Displaying’$tempout)”];then\ngrep–color=never’/title/tt’$tempout|\\\nsed’s/</\\\n</g’|\\\ngrep-vE'(.png|.jpg|>[]*$)’|\\\ngrep-A1″ahref=”|\\\ngrep-v’^–$’|\\\nsed’s/<ahref=”\\/title\\/tt//g;s/<\\/a>//’|\\\nawk'(NR%2==1){title=$0}(NR%2==0){printtitle””$0}’|\\\nsed’s/\\/.*>/:/’|\\\nsort\nfi\nexit0\n

大家可以复制下来运行一下,不懂的话直接私信小编,或者加群讨论!!一起学习一起进步!!!

我们是做教育的,希望大家能够学到知识,这个一直是我们的初衷!!

记住噢,加群讨论噢,不懂的可以问,也有人回答的。

关于本次影视传媒公司网站源码和分享一段源码挖掘IMDb电影信息的问题分享到这里就结束了,如果解决了您的问题,我们非常高兴。

Published by

风君子

独自遨游何稽首 揭天掀地慰生平