互联网电影数据库

影視數據庫

互联网电影数据库(英语:Internet Movie Database,简称IMDb)是一个关于电影演员电影电视节目、电视艺人电子游戏和电影制作小组的在线数据库。IMDb开办于1990年10月17日,从1998年开始成为亚马逊公司旗下的网站,在2020年10月17日时,IMDb庆祝了他们30周年的纪念。

IMDb
互联网电影数据库
IMDb官方标志
网站类型
在线电影、电视和电子游戏数据库
持有者亚马逊公司
创始人柯尔·尼德罕英语Col Needham[1]
网址www.imdb.com
商业性质
注册选择性

截至2021年9月,IMDb收录了共8,313,921部作品以及151,033,000个人物的资料[2]

概要

IMDb上有丰富的电影作品资讯,包括影片演员导演,剧情,影评这类的基本资讯,也有更深层的内容,比如影片相关的琐事花絮,片中出现的漏洞,影片音轨,屏幕的高宽比,影片的不同版本等等。演员,导演,作者和其他工作人员都在数据库中有自己的条目,其中列出他们参加过的影片,通常还有他们的传记。用户还可以在akas.imdb.com 找到那些在不同语言不同国家发行时使用了不同片名的电影[3]

IMDb不只是电影和电子游戏等的数据库,还提供每日更新的电影电视新闻,以及为不同电影活动比如奥斯卡奖推出特别报道。IMDb的论坛也十分活跃,除每个数据库条目都有留言板之外,还有关于多种多样的主题的各种综合讨论版。IMDb扩展出来的姐妹站IMDbPro为专业人士提供额外的资讯,如电影业界人士的联络方式,电影活动日期表等等。IMDbPro不是专门为普通大众设计服务的,内容也不是免费的。

任何人只要有电子信箱并使用接受Cookie的Web浏览器就可以在IMDb上建立帐户,提交资讯和对参加各种主题的投票。针对自动化查询的需求,数据库的大部分都能以压缩的文本文件格式下载,并用提供的工具解压(通常在命令行进行)。[4]

历史

  • 1989年时,Col Needham和其他人在Usenet新闻组rec.arts.movies电影和交换资讯。他们编写了一个常见问题解答(FAQ)列表,包含演员,导演和已经去世的电影制作者的传记。在1990年末,他们的FAQ已经收录了将近10,000部电影和电视剧。
  • 在1990年10月17日,Needham发布了一套UNIX的Shell脚本,该脚本可以搜索这4个FAQ,IMDb也由此诞生,不过那时的名字是rec.arts.movies电影数据库。
  • 到了1993年,数据库已经扩展到包括琐事花絮,传记,影片情节等内容,还带有一个集中的电邮界面,用于搜索该数据库。当年晚些时候,IMDb被移到了万维网上(当时还处在婴儿期的网络)。数据库被放置在威尔士卡地夫大学的电脑科学系的伺服器上。最初的网页界面作者是Rob Hartill。
  • 在1994年,扩展了的电邮界面开始接受自动数据提交,人们不必再给指定的维护人员发信而间接提供新内容了。这些年里,数据库在连接着世界各地镜像的网络上靠捐赠的带宽运行。
  • 在1995年,这一项目发展得很大,对Col Needham和其他的志愿者来说,依靠捐款和他们的空闲时间来维护它的运行已经明显不太可能。
  • 1996年,成立商业公司的决定被作出,IMDb在英国注册成为互联网电影数据库公司。维护数据库的人们成为其股东,依靠广告,许可证和合作获得利润。
  • 这种状态持续到1998年。数据库每时每刻都在成长,再一次到达了关键的时刻;利润被用在装置上,股东们很难接受辛苦劳动却只能得到很少收入的事实。一些大公司出价试图收购数据库,然而IMDb的股东们不肯轻易将其出售给无法保证继续免费提供其资讯的其他企业。
  • 就在这时,亚马逊的杰夫·贝索斯出现了。达成的交易是,IMDb得到了为股东们提供应有收入的资金,而Amazon.com可以在出售其DVD和录像带时使用IMDb的资讯资源。
  • IMDb的功能继续不断扩展,2002年新增了针对娱乐界专业人士的IMDbPro,提供多样的服务,包括电影制作和票房详细资料,以及电影公司目录。订阅的价格是每月$12.95,或每年$99.95(2005年4月5日价格)。

250部最佳影片

“佳片250”旨在列出数据库内评级最高的250部电影,评级以数据库注册用户评分为基础,再套用下列所述公式[5]。入选规范必须是曾公开上映的非纪录片,片长至少45分钟,评分达两万五千人次以上[6],并且只有定期投票习惯的用户才会采用计票,至于有效票数量多少、如何才是符合“有定期投票习惯”则还不为人知。IMDb宣称为了保持“佳片250”名单的公信力,他们“故意不公开有效计票的标准”[7]。除此之外,“佳片250”还套用精算学的“可信度公式”,对评分作加权评级[8],独立资料的数量越大(在此就是指合格用户的评分),统计处理后的可信度越高,IMDb原以下列公式计算加权评级(IMDb不公开现时公式):

 

以上:

 =加权评级
 =电影从0到10的平均分数(Rating)
 =评分人次(Votes)
 =进入名单的最少评分人次(目前为25000票)
 =全名单平均分数(目前维持在7.1)

公式所得的 即为“贝式后验平均值”(详见贝氏定理)。

该榜因其综合广泛性以及不时的令人吃惊的结果而受到嘱目。上榜的电影中既有老电影(如《吸血僵尸》,1922年),也有新电影(如《黑暗骑士》,2008年);既有流行影片(如得到超过420,000次投票的《魔戒首部曲:魔戒现身》),也有少有人问津的影片(如只有12,700张投票的《日出》)。榜上有各种不同类型的电影(如黑色影片《双重保险》、科幻片《银翼杀手》、音乐片《万花嬉春》、西部片《黄昏三镖客》、动画片《机器人总动员》等等);以及票房一般、很少获奖但却在影迷群体中有广泛的追随者的电影(比如《逃狱天才》、《死亡幻觉》等等)。截至2024年9月7日《逃狱天才》、《教父》、《黑暗骑士》为排名前三的电影。

这些条件是否能提供一个公正没有偏见的排行榜是有争议的。比如,新近上映的影片总是容易从一见钟情的影迷那里得到较高的评分,而这与成功影片应该经得起反复观赏的观念是不相符的。因此,有时新上映的影片冲进250最佳影片榜,甚至前100名,但随着更多观众的评分和重复观看后的评分而退出榜外的情景就十分常见了。另外一种对该榜的主要批评则是它反映的只是影片的受欢迎程度,并不体现对影片历史和艺术的客观知识。但实际上,在评论家年度评选和历史影片评选中,名列前茅的影片在最佳250部影片中通常排名很高。

目前在最佳250部电影名单中,主演最多影片的演员以詹士·史都华的10部作品最多,罗拔·迪尼路夏里逊·福各以9部作品居次。

在IMDb上还有最差的100部影片榜用基本相同的方法投票产生。经常位列榜首的影片是《马诺斯:命运之手》和《外太空九号计划》。[9]

前20名名单

名次 年份 电影名称 导演
1 1994 逃狱天才
The Shawshank Redemption
Frank Darabont
弗兰克·达拉邦特
2 1972 教父
The Godfather
Francis Ford Coppola
法兰斯·哥普拉
3 2008 黑暗骑士
The Dark Knight
Christopher Nolan
基斯杜化·诺兰
4 1974 教父2
The Godfather: Part II
Francis Ford Coppola
法兰斯·哥普拉
5 1957 十二怒汉
12 Angry Men
Sidney Lumet
薛尼·卢梅
6 1993 辛德勒名单
Schindler's List
Steven Spielberg
史提芬·史匹堡
7 2003 魔戒三部曲:王者再临
The Lord of the Rings: The Return of the King
Peter Jackson
彼得·杰逊
8 1994 黑色追缉令
Pulp Fiction
Quentin Tarantino
昆汀·塔伦天奴
9 2001 魔戒首部曲:魔戒现身
The Lord of the Rings: The Fellowship of the Ring
Peter Jackson
彼得·杰逊
10 1966 三虎枪
Il buono, il brutto, il cattivo
Sergio Leone
赛尔乔·莱昂内
11 1994 阿甘正传
Forrest Gump
Robert Zemeckis
罗伯特·泽米吉斯
12 1999 搏击会
Fight Club
David Fincher
大卫·芬查
13 2010 潜行凶间
Inception
Christopher Nolan
基斯杜化·诺兰
14 2002 魔戒二部曲:双城奇谋
The Lord of the Rings: The Two Towers
Peter Jackson
彼得·杰逊
15 1980 星球大战:帝国反击战
Star Wars Episode V: The Empire Strikes Back
Irvin Kershner
尔文·克许纳
16 1999 梦幻科技
The Matrix
The Wachowskis
沃卓斯基兄弟
17 1990 四海好家伙
Goodfellas
Martin Scorsese
马田·史高西斯
18 1975 飞越疯人院
One Flew Over the Cuckoo's Nest
Miloš Forman
米洛斯·福曼
19 1995 罚七奇案
Seven
David Fincher
大卫·芬查
20 1954 七武士
七人の侍
Akira Kurosawa
黑泽明

留言板

IMDb另一受欢迎的特色是其对应每个数据库条目,并且有47个主要板块的留言板系统。注册用户可以在这些留言板上分享和讨论关于电影,演员,导演的消息。至今已有超过六百万注册用户使用过留言板。[10]

著作权问题

所有为数据库提供内容的自愿者都对其作品拥有著作权,但同时准许对其的复制,修改,并将其内容许可给IMDb。相应的,IMDb不允许其他人在未经许可情况下使用其电影概述或生平简介。使用软件方法屏蔽该网站显示的广告也被明令禁止。影片名录中一小部分可以被引用,而且只能用于非商业性的网站。

可信度

由于数据库的人物传记、琐事等部分是采取用户自由贡献,但又并未要求用户对其贡献内容附上参考来源,因此缺少有效而立即的机制,以阻止蓄意破坏者添加未经查证、或对该人物诋毁性的资料。部分人物消息准确度因此有争议。

中国大陆访问状况

  • 2010年1月7日,IMDb.com被中国大陆防火长城封锁,与其他被封的海外网站一样,官方没有提供任何解释。[11]2010年2月3日,在中国大陆被解封,可以正常访问。[12]
  • 2010年10月,IMDb.com再次被封锁。坊间盛传的一个原因是,当时IMDb首页上出现了一部和西藏有关的记录片《云后的太阳》(《When the dragon swallowed the sun》)的预告视频[来源请求]。此后在中国大陆访问该网站一直处于不稳定状态。
  • 2013年3月初,IMDb.com被解除封锁,各项功能均可在中国大陆正常使用,页面显示完整。[13][14]
  • 2016年3月,测试发现部分影片页面无法访问,如凛冬烈火页面无法打开,访问此链接后一段时间内无法打开IMDb网站,而后网站恢复访问。因此IMDb不属于在中国大陆完全自由访问的网站[15]。但2020年8月的测试显示全部影片页面均可以访问。
  • 2021年7月,测试发现使用中国移动网络无法访问IMDb网站。

API

IMDb的数据在官网上可以免费下载,可惜的是免费提供下载的数据是文本格式,不能检索。为了使IMDb的数据能够被更多人使用,许多开发人员用各自的方法实现了不同的API,目前主要有以下几种:

IMDB API ORG

此接口由中国人开发[16],是一个轻量级的Web服务(RESTful接口),它提供一种IMDB数据的有效访问方式。就像前面说的一样,虽然IMDB的数据可以在官网上免费下载,但是却没有提供一个很好的API来检索这些资讯。此Web服务旨在一定范围内解决这一问题。[17]

此接口相较于其它接口具备以下特点:

  1. 支持中文译名检索
  2. 支持中文数据返回
  3. 支持JavaScript调用接口(可以使用AJAX技术直接获取结果,非JSONP方式)
  4. 返回的数据字段更丰富
  5. 支持多条结果返回
  6. 请求限制宽松

此接口是唯一支持中文检索的IMDb API。

OMDB API

此接口的作者为Brian Fritz[18],是之前The IMDB API接口的作者,因为受到IMDb官方的要求而更换了域名,是较早一批提供IMDb数据检索的服务(RESTful接口)。

在英文世界,该服务有较高的知名度。

该接口支持JAVASCRIPT调用。

此接口是由The Movie Database数据库开放的API,严格来说它并不是检索的IMDb数据,它是一个独立的数据库,只是返回数据中提供了IMDb的一些相关数据,如:IMDb ID,IMDb Rating等。[19]

该接口提供的方法更多,但是需要授权使用,限制较多。

参考文献

  1. ^ 黄敏. 英影迷建成最大电影数据库. 经济参考报. 2011-01-07 [2022-01-20]. (原始内容存档于2022-01-20) (中文). 
  2. ^ Database Statistics. IMDb. [2017-03-10]. (原始内容存档于2015-11-07). 
  3. ^ IMDb - Movies, TV and Celebrities. IMDb. [2017-03-10]. (原始内容存档于2015-06-27). 
  4. ^ Alternative Interfaces. IMDb. [2017-03-10]. (原始内容存档于2020-11-29). 
  5. ^ Top 250 movies as voted by our users. IMDb. [2007-03-01]. (原始内容存档于2009-02-18). 
  6. ^ Types of titles excluded from the Top 250. IMDb. [2007-04-25]. (原始内容存档于2017-03-25). 
  7. ^ The user votes average on film or show X is 9.4, so it should appear in your top 250 Movies or TV list, yet it doesn't. Why?. IMDb. [2017-03-10]. (原始内容存档于2017-03-25). 
  8. ^ Ragnar Norberg, Department of Statistics. Credibility Theory (PDF). London School of Economics. [2007-03-01]. (原始内容 (PDF)存档于2007-07-03). 
  9. ^ Users, IMDb. IMDb Bottom 100. IMDb. [2017-03-10]. (原始内容存档于2007-12-09). 
  10. ^ IMDb Message Boards. IMDb. [2017-03-10]. (原始内容存档于2017-02-28). 
  11. ^ China blocks access to movie site. 好莱坞报道. 2010-01-08 [2010-01-22]. (原始内容存档于2010-01-29). 
  12. ^ IMDB unblocked after 29 days site. 环球时报. 2010-02-08. (原始内容存档于2013-04-24). 
  13. ^ 全球最大电影数据库3年后解封. 云南资讯报. 2013-03-07. (原始内容存档于2013-04-28). 
  14. ^ 中国解禁互联网电影数据库IMDb. RFA. 2013-03-08. (原始内容存档于2019-05-03). 
  15. ^ 10 Crazy Ways China Censors The Internet. 2016-02-13. (原始内容存档于2016-03-14). 
  16. ^ IMDB API 发布. 蒙趣空间. 2013-04-28 [2017-03-10]. (原始内容存档于2013-04-28). 
  17. ^ IMDB API, IMDB Web Service. archive.is. 2013-05-03 [2017-03-10]. (原始内容存档于2013-05-03). 
  18. ^ OMDb API - The Open Movie Database. omdbapi.com. [2017-03-10]. (原始内容存档于2020-11-20) (英语). 
  19. ^ TMDb API Documentation — Movie & Cast Information. archive.is. 2013-05-03 [2017-03-10]. (原始内容存档于2013-05-03). 

外部链接