分享一段源码挖掘IMDb电影信息

各位老铁们，大家好，今天由我来为大家分享影视传媒公司网站源码，以及分享一段源码挖掘IMDb电影信息的相关问题知识，希望对大家有所帮助。如果可以帮助到大家，还望关注收藏下本站，您的支持是我们最大的动力，谢谢大家了哈，下面我们开始吧！

Python能抓取网页上的信息，当然bash也可以，今天小编就拿bash脚本来挖掘IMDb中的电影信息噢！！挺好玩的！！！

我们是做教育的，希望大家能够学到知识，这个一直是我们的初衷！！

电影网站https://www.imdb.com，这个网站我自己登入上去看了看，确实可以登入，并不需要挂vpn，可惜的是英文。

因为代码太长了，我分屏了一下，大伙可以看行号码，不过我会把源码分享出去。

代码里用到了大量的sed和grep，这个sed我之前有分享，改天找个机会说说grep的使用。

写好了运行一下吧，在脚本后面lawrenceofarabia是电影的名字。

你看吧！出来一系列的电影了！当然你的英文要好！！

那我现在就分享一下代码吧！！

Date2019-09-17\nPATH=/bin:/sbin:/usr/sbin:/usr/local/bin:/usr/local/sbin:~/bin\nexportPATH\n\ntitleurl=”http://www.imdb.com/title/tt”\nimdburl=”http://www.imdb.com/find?s=tt&exact=true&ref_=fn_tt_ex&q=”\ntempout=”/tmp/moviedata.$$”\n\nsummarize_film()\n{\ngrep”<title>”$tempout|sed’s/<[^>]*>//g;s/(more)//’\ngrep–color=never-A2′<h5>Plot:’$tempout|tail-1|\\\ncut-d\\-f1|fmt|sed’s/^//’\nexit0\n}\ntrap”rm-f$tempout”0115\n\nif[$-eq1-a-z”$nodigits”];then\nlynx-source”$titleurl$1/combined”>$tempout\nsummarize_film\nexit0\nfi\n\n\nfixedname=”$(echo$@|tr”’+’)”\nurl=”$imdburl$fixedname”\nlynx-source$imdburl$fixedname>$tempout\n\nfail=”$(grep–color–color=never'<h1class=”findHeader”>No’$tempout)”\n\nif[!-z”$fail”];then\necho”Failed:noresultsfounfor$1″\nexit1\nelif[!-z”$(grep'<h1class=”findHeader”>Displaying’$tempout)”];then\ngrep–color=never’/title/tt’$tempout|\\\nsed’s/</\\\n</g’|\\\ngrep-vE'(.png|.jpg|>[]*$)’|\\\ngrep-A1″ahref=”|\\\ngrep-v’^–$’|\\\nsed’s/<ahref=”\\/title\\/tt//g;s/<\\/a>//’|\\\nawk'(NR%2==1){title=$0}(NR%2==0){printtitle””$0}’|\\\nsed’s/\\/.*>/:/’|\\\nsort\nfi\nexit0\n

大家可以复制下来运行一下，不懂的话直接私信小编，或者加群讨论！！一起学习一起进步！！！

我们是做教育的，希望大家能够学到知识，这个一直是我们的初衷！！

记住噢，加群讨论噢，不懂的可以问，也有人回答的。

关于本次影视传媒公司网站源码和分享一段源码挖掘IMDb电影信息的问题分享到这里就结束了，如果解决了您的问题，我们非常高兴。

分享一段源码挖掘IMDb电影信息

Published by

风君子

近期文章

标签

书签