电影票房预测模型
‘壹’ 电影票房预测系统的介绍
电影票房预测系统,美国票房收入预测的先驱BarryLitman对美国80年代近700部电影进行分析推出票房收入预测模型。
‘贰’ 用百度指数怎么进行电影票房预测
网络指数反应了网友对于某一个词的关注程度,网络指数越高表明网友搜索越多,证明网友越关注该电影,进而该电影的票房越有可能更好
‘叁’ 怎样预测票房
票房预测:需求与现实
从1896年西洋影戏传入上海徐园,到1905年中国拍摄首部国产电影《定军山》,再到2013年全国电影票房突破200亿
大关,(4)有着百余年历史的中国电影产业,在近几年呈现出飞跃式发展的态势,无论是影片质量、院线建设还是投资规模都有了长足的发展。与此同时,随着
“大数据”时代的到来,电影观影群体、观影偏好与心理、电影信息传播和获取方式也都在发生着深刻的变化。
毋庸置疑,多样化资本的加入是中国电影不可或缺的发展引擎,然而,电影行业以投资回报率难以预测着称,大投入未必有大产出,票房预测工具的缺失使得投资者
无法有效对冲投资风险,华人着名导演吴宇森的《风语者》就拖累了米高梅公司最终走向破产。因此制作与发行公司不得不考虑所有对票房有影响的因素:辣妈李小
璐对《私人订制》票房贡献几何;《风暴》票房为何远低于其金牌制片人江志强预期;被吐槽“烂片”的《富山春居图》和《小时代》缘何票房却一路走红;成龙大
叔的《警察故事2013》有无必要拍成3D;《泰囧》的“报复性”观影效应能否复现……这一切的一切其实都可以从“大数据”中找到答案。因为网络上的每一
次浏览、查询乃至点击所汇聚成的群体智慧都“蝴蝶效应”般地影响着电影的最终票房。
2013年Google在一份名为《Quantifying Movie Magic with Google Search》(5)
的白皮书中公布了其电影票房预测模型,该模型主要利用搜索、广告点击数据以及院线排片来预测票房,Google宣布其模型预测票房与真实票房的吻合程度达
到了94%,但并未见其公开对未上映电影的预测结果。
搜狗公司借助“深思”系统,建立了更为复杂的模型,用于预测国内电影票房,并在新浪微博上提前发布了2013年12月国内上映电影的首周票房预测结果。很高兴到目前为止预测结果与真实数据非常接近,同时,我们的模型还可以用于对影响票房的因素进行定量分析。
搜索查询量的奥秘
搜狗搜索每天都响应上亿次的搜索请求,查询词的分布和变化趋势能够很好的反映出中国网民的兴趣点和关注指向。与Google的研究类似,我们也发现,电影
上映前相关查询词的搜索次数与票房收入有着很强的关联性。这一点很好理解,用户的主动搜索行为体现了用户对这部电影的潜在兴趣。
我们选取了2013年1-11月国内上映的180部电影的票房和上映前的搜索量数据作为训练集,用于训练一个基础的线性回归模型。实验发现,单纯利用搜索
量训练得到的模型,预测得到的首周票房与真实票房的相关度R方值仅为68%,这与Google仅用搜索数据得到的结果70%很接近。(注:R方值取值为0
至1,值越大表示模型预测效果越好),这个结果也说明无论在中国还是美国,用户的搜索行为是很相似的。
用搜索量来进行预测票房是一个好的开始,但是准确度还远远不够。同时很多搜索词还存在歧义的情况,比如《生化危机》,既是电影也是游戏,混在一起会造成票
房预测值偏高。进一步研究发现,游戏意图的查询请求量较为平稳,但电影意图的查询请求在上映前则有一个高峰,也可以通过用户点击的URL来进一步确认用户
的搜索意图。因此模型需要再引入查询量的变化趋势和用户点击的分布情况。修正后的模型可以达到74%的准确度,这时模型已经可以对电影票房进行一个粗略的
估计。
社交媒体:用户的情感分析
社交媒体数据对票房预测也会有一定帮助。假设你是某个明星的粉丝,打算去看他主演的电影,那么你很可能会提前转发该电影的相关微博给你的朋友。国外已经有
很多预测项目都是在针对Twitter数据做研究,这里我们主要采用国内部分微博网站的数据来进行预测。通过自然语言理解技术,分析出用户对未上映影片的
情感倾向,从而转换为用户的观影需求。进一步可以考虑的因素包括微博转发深度、评论活跃程度,以及相关微博数量随电影上映日期临近的变化趋势,这些数据都
可以被有效的提炼为特征并加入到模型中。
微博数据的加入使得准确率超过了80%。
结语
预测专家纳特·西尔弗在《信号与噪声:大数据时代预测的科学与艺术》一书中提到,大数据时代的预测更容易失败,大部分失败的预测都源于一种盲目的自信,用精确的预测来冒充准确的预测。
对此我们有着清醒的认识,目前的票房预测模型还有若干需要改进的方向。首先,目前模型的主要思想是通过电影上映前的用户关注度来推算首周票房,这实际上没
有考虑电影上映后的口碑对票房的影响;其次,模型较为依赖历史数据,可能难以识别一些上映后脱颖而出的小成本“黑马”电影;再次,目前的技术只能提前10
天预报出首周票房,还可以更加超前。
总体而言,“深思”系统代表了搜狗公司在社会化预测方面一些新的尝试。我们试着从繁杂的海量数据中筛选出真正的信号,努力穿越不确定性的迷雾,区分出未来
图景的哪些部分可以预测,哪些不可预测。通向这个未来的道路还在探索之中,但目前工作已经取得了一些不错的进展,并给予了我们更大的信心。
‘肆’ 电影票房分析及预测
从20世纪初的西洋镜戏法到今天占据全球电影业总产值的三分之一强,资本的加入让好莱坞在过去百年的发展中变得越来越理智--比起商业片流水线缔造者,它更像一个数学家--它精于计算每一项决定对利润的贡献:《蝙蝠侠》续集是否要接受男演员片酬的狮子大开口以获得百分之几的忠实粉丝买票入场;是否要在动作片的第37分钟增加感情戏以争取女性观众;是否要为这部烂透了的原着聘请收费高昂的剧本医生;一个小金人编剧的名头到底值多少钱……这就是在电影开机之前最为重要的环节:票房预测。
华尔街不仅给好莱坞带来了密集的资金支持,也带来了理性的金融工程技术,后者好像一把衡量艺术的尺子。一位浸淫于电影行业的金融人士一语中的:"在这个行业里充斥着暧昧不清、晦暗不明,有真正的艺术家、也有忽悠的吹水者,但到底怎么判断是否能合作,项目是否有投资价值,全凭经验"。
如何预测
早在80年代,美国票房收入预测的先驱BarryLitman对美国80年代近700部电影进行分析推出票房收入预测模型。该系统对之后美国电影投资界产生了颠覆性的影响。电影票房预测系统能分析预测不同种类电影的票房价值,已经成为国际电影产业投融资的重要参考工具,对电影产品定价及衍生产品开发都具有较强的指导作用。
预测系统
电影票房量化分析及预测系统(Box Revenue Prediction)是在考察导演、主要演员、制片、发行及市场营销、电影生命周期、电影类型、发行地区等影响电影票房的诸多因素基础上,基于资产定价模型,综合采用金融工程和回归统计分析方法研发出的预测系统。它能分析预测不同种类电影的票房价值,成为电影产业投融资重要参考工具,对电影产品定价及衍生产品开发都具有较强的指导作用。
中国第一套BRP系统
2012年1月,中影集团联合艾亿新融资本推出了国内第一套基于电影票房预测的估值与定价分析系统--BRP系统。通过对过去4年中600多部影片的统计分析,该BRP系统发现了6条有趣的现象:
·低成本的影片一般会比大片更卖座
·无名小卒主演的影片要比明星主演的影片利润率更高
·类型的艺术特征跟利润之间不存在直接关联,但评论的多寡(无论好评或者劣评)跟利润之间有密切关系
·不含暴力、色情成分的家庭影片最容易赚钱
·大片的续集要比普通新片更容易赚钱
·明星在为影片带来更高票房的同时,也往往拉低了利润率,因为大部分收入进了明星的口袋
‘伍’ 空天猎电影票房预测,票房能过8亿吗
不能。天空猎现在全部票房是3.17亿(已下线)!这是一个不算太高的数据。原因如下:
1、天空猎实在国庆期上映,而国庆期,成龙的英伦对决;刘德华甄子丹的追龙都是非常强有力的对手。
2、由于前期战狼2的火爆,观众对战争动作类影片多了一些免疫力,如果天空猎水平不能超过战狼很多,则很难取胜,现在看了也正是如此!
3、空战类电影不像普通动作,一般军迷都是看不懂的其中的道,所以,自然难以引起共鸣例如桶滚机动、例如最后的巴伦支海手术刀等。而战狼2的撤侨和五星红旗,是中国人都会引起共鸣。
4、
空天猎不算烂片,但是是一部非常平庸的电影,除了歼20(还有空警500等),其他没啥亮点!而观众都是要看故事的,空天猎主要是故事没讲好!
所以看完后很多人都说,空天猎飞机太好看了,歼10、空警500、幻影、歼20都给电影加分,就是女主角和男主角不给力。下次飞机多一点,主角还是演你们的跑 男去吧!
‘陆’ 电影行业怎样预测影片的票房
这个真没谁有多准,大家都一个档次的,你这次预测靠谱点,没准下一次就失手。
像今年的《侏罗纪世界》和《速度与激情7》,年前没谁会预测到能达到15亿美金的票房,碾压妇联2争夺年度票房冠军,再比如扑街的《明日世界》,很多预测人脸都被打肿了。
很多时候都是根据上映第一周的票房来推测后续能达到什么水准比较靠谱。这个时候一般后续票房下跌水准也能把握得相对准确点。但遇上《阿凡达》这种BUG片(次周票房几乎零跌幅),也是要命的。
‘柒’ 电影票房预测系统的电影票房如何预测
早在80年代,美国票房收入预测的先驱BarryLitman对美国80年代近700部电影进行分析推出票房收入预测模型。该系统对之后美国电影投资界产生了颠覆性的影响。电影票房预测系统能分析预测不同种类电影的票房价值,已经成为国际电影产业投融资的重要参考工具,对电影产品定价及衍生产品开发都具有较强的指导作用。
‘捌’ 如何评价电影票房预测模型的发展和建设瓶颈
从我们的分析与实际操作来看,实际上对电影票房预测模型的发展与建设造成最大阻碍的在于数据的不真实性、指标的选择可用性以及一些违规暗箱操作上;还有譬如电影市场的发展速度太快,去往的历史数据可参考性低,模型得跟着市场的变化而变化等这些方面,在我们建模时造成了极大的阻碍。而基于我们的电影票房预测模型,我们的预测有相当的准确性与可信度。从2015年7月到现在我们每天都会公布我们的票房预测结果,在于竞争对手的比拼与较量中始终保持领先地位,准确率一直保持全国第一。而我想,如果当数据、指标、操作开始正规化明朗化,电影票房的预测模型也将越做越好,越做越准。
‘玖’ 如何专业地预估票房
图1. 2012年票房收入与搜索量的曲线 (红色是票房收入,灰色是搜索量,横轴是月份,纵轴是数量) 经过改进后的模型: 图2 提前一个月预测票房的效果 (横轴是预告片搜索量,纵轴是首周票房收入,灰色点对应实际某部电影的首周票房收入,红色点对应预测的首周票房收入) Google可以通过这个模型提前一个月预估出电影票房,不过如果是在拍电影前就预估票房,可能不太现实,之前有个问题也回答过,其实演员在拍一部好片或者烂片的时候,心态是差不多的。在没开拍电影前,就预估票房,很可能本身就是个误会。
‘拾’ 如何专业地预估票房
这个项目我还真的做过,大概是在2011年中国电影票房开始爆发的时候。试来试去,最靠谱的算法仍然是多元线性回归,预测目标是官方公布的某部电影的最终票房值,当时的R2达到70%多。如果将进口电影排除,R2能够提高到80%以上。主要是进口电影非常容易出现黑天鹅,比如一个《阿凡达》就足以将模型刷爆。多元线性回归看起来很low是不是,但后来看到一篇Google关于预测电影票房的论文,也是说最好的票房预测模型仍然是多元线性回归。不过后来这个模型的价值就不大了,因为后来中国电影市场以超越想象的速度蓬勃发展,不断出现票房黑天鹅,而且还有各种严肃的刷票房行为,所以对于模型来说,实在是臣妾做不到。题主所说的在电影拍摄前就预测票房也超越了模型的能力,当初的设计是在电影首映前一个月开始预测,定期修正预测值。多元线性回归使用的各因素总结如下。用户的期待度。通过手机网络指数以及微博等媒体的提及次数来表示,搜索或者提及次数越多,证明用户越期待,越容易转化为票房。核心元素的影响力。核心元素包括导演、主演以及是否有前序剧情,比如:007系列或者冯小刚都是对票房的保证,而另一方面,有些演员又是票房毒药。主要是收集豆瓣上这些核心因素与电影评分和历史票房的关系,最后可以归结成对新影片票房的影响因子。竞争态势。主要通过同期上映的影片数量来评价,同期上映的影片越多,证明竞争越激烈,越难取得较高的票房。进一步的规划,是将同期上映影片的预测票房加入进来作为权重,以衡量竞争对手的实力,更准确地评价竞争态势。简单说,和《阿凡达》同期上映,比和《无极》同期上映,要悲壮很多。基本面。主要是就是当期电影市场的总体情况,可以使用该电影上映前T12M(Trailing 12 months)的总票房作为基本面。