電影票房和數量研究
1. 豆瓣電影數據分析
這篇報告是我轉行數據分析後的第一篇報告,當時學完了Python,SQL,BI以為再做幾個項目就能找工作了,事實上……分析思維、業務,這兩者遠比工具重要的多。一個多月後回過頭來看,這篇報告雖然寫得有模有樣,但和數據分析報告還是有挺大差別的,主要原因在於:a.只是針對豆瓣電影數據分析太過寬泛了,具體關鍵指標到底是哪些呢?;b.沒有一個確切有效的分析模型/框架,會有種東一塊西一塊的拼接感。
即便有著這些缺點,我還是想把它掛上來,主要是因為:1.當做Pandas與爬蟲(Selenium+Request)練手,總得留下些證明;2.以豆瓣電影進行分析確實很難找到一條業務邏輯線支撐,總體上還是描述統計為主;3.比起網上能搜到的其他豆瓣電影數據分析,它更為詳細,可視化效果也不錯;
本篇報告旨在針對豆瓣電影1990-2020的電影數據進行分析,首先通過編寫Python網路爬蟲爬取了51375條電影數據,採集對象包括:電影名稱、年份、導演、演員、類型、出品國家、語言、時長、評分、評論數、不同評價佔比、網址。經過去重、清洗,最後得到29033條有效電影數據。根據電影評分、時長、地區、類型進行分析,描述了評分與時長、類型的關系,並統計了各個地區電影數量與評分。之後,針對演員、導演對數據進行聚合,給出產量與評分最高的名單。在分析過程中,還發現電影數量今年逐步增加,但評分下降,主要原因是中國地區今年低質量影視作品的增加。
另外,本篇報告還爬取了電影票房網( http://58921.com/ )1995-2020年度國內上映的影片票房,共採集4071條數據,其中3484條有效。進一步,本文分析了國內院線電影票房年度變化趨勢,票房與評分、評價人數、時長、地區的關系,票房與電影類型的關聯,並給出了票房最高的導演、演員與電影排名。
清洗、去重後,可以看到29033條數據長度、評分、評論數具有以下特點:
結合圖1(a)(b)看,可以看到電影數據時長主要集中在90-120分鍾之間,向兩極呈現階梯狀遞減,將數據按照短(60-90分鍾),中(90-120分鍾),長(120-150分鍾),特長(>150分鍾)劃分,各部分佔比為21.06%, 64.15%, 11.95%, 2.85%。
結合圖2(a)看,可以看到我們採集到的電影數據評分主要集中在6.0-8.0之間,向兩極呈現階梯狀遞減,在此按照評分劃分區間:2.0-4.0為口碑極差,4.0-6.0為口碑較差,6.0-7.0為口碑尚可,7.0-8.0為口碑較好,8.0-10.0為口碑極佳。
這5種電影數據的佔比分別為:5.78%, 23.09%, 30.56%, 29.22%, 11.34%
再將評分數據細化到每年進行觀察,可以發現,30年內電影數量與年度電影均分呈反相關,年度均分整體呈現下降趨勢,2016年電影均分最低,電影數量最多。
進一步做出每個年份下不同評級等級的電影數據佔比,可以發現,近年來,評分在[2.0,6.0)的電影數據佔比有著明顯提升,評分在[6.0,7.0)的數據佔比不變,評分在[7.0,10.0)的數據佔比減少,可能原因有:
對照圖5,可以發現,評分與時長、評論人數的分布大致呈現漏斗狀,高分電影位於漏鬥上部,低分電影位於漏斗下部。這意味著,如果一部電影的評論人數很多(特別是超過30w人觀影),時長較長(大於120min),那麼它大概率是一部好電影。
根據各個國家的電影數量作圖,可以得到圖6,列出電影數量前十的國家可得表格2,發現美國在電影數量上占第一,達到8490部,中國其次,達6222部。此外,法國,英國,日本的電影數量也超過1000,其餘各國電影數量相對較少。這可以說明美國電影有著較大的流量輸入,在中國產生了較大的影響。
進一步分析各國電影的質量,依據評分繪制評分箱線圖可得圖7,在電影數量排名前20的國家中:
接著我們可以探索,哪個國家的電影對豆瓣評分隨年份下降的貢獻最大,考慮到電影數量對應著評分的權重。根據上述各國的電影評分表現,我們可以猜測電影數量較多的國家可能對年度均分的下降有較大影響。於是,我們再計算出這些國家的年度電影均分,並與整體均分進行比較分析。
再作出中國大陸,中國台灣,中國香港的均分箱線圖圖9(a),可以看到,大陸電影均分低於港台電影,且存在大量低分電影拉低了箱體的位置。
分析相關性可得,大陸、香港、台灣電影年度均分與全部評分關聯度分別為R=0.979,0.919,0.822,說明濾去台灣和香港電影,大陸電影年度均分的變化趨勢與全部評分變化更接近。圖9(b)可以進一步反映這一點。
可以看到,大部分類型集中在X×Y=[10000,30000]×[6.00,7.50]的區間范圍內,劇情、喜劇、愛情、犯罪、動作類電影數量上較多,說明這些題材的電影是近三十年比較熱門的題材,其中劇情類電影佔比最多,音樂、傳記類電影平均得分更高,但在數量上較少,動作、驚悚類電影評論人數雖多,但評價普遍偏低。
除此之外,還有兩塊區域值得關註:
根據類型對電影數據進行聚合,整理得到各類型電影評分的時間序列,計算它們與整體均分時間序列的相關性,可得表格4與圖11,可以看到劇情,喜劇,懸疑這三種類型片與總分趨勢變化相關性最強,同時劇情、喜劇類電影在電影數量上也最多,因此可以認為這兩類電影對於下跌趨勢影響最大,但其餘類別電影的相關性也達到了0.9以上,說明幾種熱門的電影得分的變化趨勢與總體均分趨勢一致。
前面已經得知,中美兩國電影佔比最高,且對於均分時間序列的影響最大。在此,進一步對兩國電影進行類型分析,選取幾種主要的類型(數量上較多,且相關性較高)進行分析,分別是劇情,喜劇,愛情,驚悚,動作,懸疑類電影,繪制近年來幾類電影的數量變化柱狀圖與評分箱線圖可得圖12,13,14,15。
對導演與演員進行聚合,得到數據中共有15011名導演,46223名演員。按照作品數量在(0,2], (2,5], (5,10], (10,20], (20,999]進行分組統計導演數量,可以發現,15009名導演中有79.08%只拍過1-2部作品,46220名演員中有75.93%只主演過1-2部作品。忽略那些客串、跑龍套的演員,數據總體符合二八定律,即20%的人占據了行業內的大量資源。
在此,可以通過電影得分、每部電影評論人數以及電影數目尋找優秀的電影導演與演員。這三項指標分別衡量了導演/演員的創作水平,人氣以及產能。考慮到電影數據集中可能有少量影視劇/劇場版動畫,且影視劇/劇場版動畫受眾少於電影,但得分普遍要高於電影,這里根據先根據每部電影評論數量、作品數量來篩選導演/演員,再根據電影得分進行排名,並取前30名進行作圖,可得圖17,18。
結合電影票房網( http://58921.com/ )採集到的3353條票房數據,與豆瓣數據按照電影名稱進行匹配,可以得到1995-2020年在中國大陸上映的電影信息,分別分析中國內地電影的數量、票房變化趨勢,票房與評分、評價人數、時長、地區以及類型的關系,此外還給出了不同導演與演員的票房表現以及影片票房排名。
如圖19所示,國內票房數據與上映的電影數量逐年遞增,2020年記錄的只是上半年的數據,且由於受疫情影響,票房與數量驟減。這說明在不發生重大事件的情況下,國內電影市場規模正在不斷擴大。
對電影數據根據類型進行聚合,繪制散點圖21,可以發現:
提取導演/演員姓名,對導演/演員欄位進行聚合,計算每個導演/演員的票房總和,上映電影均分、以及執導/參與電影數目進行計算,作出票房總和前30名的導演/演員,可得圖22,23,圖中導演/演員標號反映了票房排名,具體每位導演/演員的上映影片數量、均分、每部電影評價人數、平均時長與總票房在表5、表6中給出。
最後根據電影票房進行排名,得到票房排名前20的電影如表格7所示,可以看到絕大部分上榜電影都是中國電影,索引序號為3、10、12、14、18、19為美國電影,這也反映了除國產電影之外,好萊塢大片占據較大的市場。
本篇報告採集了1990-2020年間豆瓣電影29033組有效數據,從豆瓣電影的評分、時長、地區、類型、演員、導演以及票房等信息進行分析評價,主要有以下結論:
2. 電影票房的統計分析有哪些
復制的很全 不過已經過時了 就拿那個3天票房說吧 赤壁 3天破億 變形金剛4天破億 那他們3天的總票房應該 在前面
幾個例子:
十面埋伏 3天的票房可以達到5000多萬 然而總票房屈指可算 3天票房多是宣傳力度大 而後面票房狂跌是口碑差 影片本身不好看 口口相傳。可以看出宣傳對票房的影響之大,而口碑對票房的影響同樣雷人
泰坦尼克號 是1997年開始逐步上映的 當時的投資是很驚人的 然而上映後票房低的讓投資人慾哭無淚,可影片本身拍攝非常完美,催下了無數人的眼淚,口碑非常好 導致票房逆增長,最後創下了票房冠軍,上映時間長達8個月,觀影之熱,直至無法下檔,最後的票房在11年後的今天都沒有一部影片可以超越,看來口碑的好壞是決定票房的第一因素。
最後再說一部電影 今年賀歲檔的 桃花運 票房糾正下 不是3000萬 而是4000萬 對於這樣一部投資的電影,這樣的票房是很高的,今年賀歲的喜劇片 愛呼2 女人不壞 非誠勿擾 每一部的質量都在桃花運之上。桃花運 影片本身是非常粗糙的 故事最後草草收尾 可票房怎麼會那麼高呢?原因很簡單,檔期選的好,沒有一部片子在數周內和其分羹,結果就是大家來到影院就這一部電影 愛看不看,檔期的好壞也非常重要
3. 2020年影片數量和影片票房比2019年少的主要原因
2020年影片數量和影片票房比2019年少的主要原因我國電影票房市場近年來保持高速增長的態勢,觀影人次從2012年的4.4億,增長2018年的17.16億,年均復合增長率達到25.5%。國內電影票房從2012年的170.7億元增長到2019年642.7億元,年均復合增長率達到20.85%。中國電影產業在國民經濟新的發展形勢下實現了快速增長。以電影票房收入衡量,我國電影市場已經成為僅次於美國的全球第二大電影市場,銀幕總數居全球領先的地位。2019年全國電影總票房642.66億元,同比增長5.4%。雖然2019年電影票房市場增速放緩,但從中長期來看中國電影票房仍將維持較高的增長速度。主要原因在於中國人均觀影次數和每百萬人口票房金額與北美地區存在較大差距,隨著中國居民消費水平上升、城市化進程的深入和對文化產品的需求,電影市場還有較大的發展空間。
4. 電影的票房是怎麼算的
票房可以用觀影人數或門票收入來計算,而通常我們所講的票房,就是用門票收入來計算的。即,票房=票價X購買人數。
比如某影院一天放映了6場《李茶的姑媽》,有學生票:40元,共10人,標准票:80元,共10人,團體票:30元,共10人,會員票價:20元,一共10人,那麼,這一天該影院的總票房就是:4000+8000+3000+2000 。
現在各大電影院都實行電腦售票,這些售票系統是和國家電影局電影專項基金管理中心聯網的,每天都會在固定的時間自動向專基中心發送票房數據。因此,相對來說,電影票房對判斷某部電影的觀影人數,影片受歡迎程度還是有很大參考意義的。
(4)電影票房和數量研究擴展閱讀
電影票房的影響因素:
影片票房的好壞取決於多種因素的綜合,包括影片題材及劇本、主創團隊、影片定位、影片質量、票價、檔期、發行、院線排片、宣傳推廣等多個方面。題材和劇本是一部影片的核心;科幻、魔幻題材一向是票房大熱的選項,貼近生活、打動人心的情感題材也比較受觀眾青睞。
主創團隊如導演、主演、製片人和製作團隊等,都是吸引觀眾的重量級籌碼,能夠在影片上映前期對觀眾形成最大的吸引和沖擊;影片定位是指影片為自己影片的市場預估,比如從劇本設置、演員選擇等方面切入設定目標人群定位。
影片質量包含了劇本、拍攝、製作、演員表演等綜合因素,是電影藝術成就的衡量標准,是一部電影成功的最重要因素等等。
參考資料來源:網路-電影票房
5. 電影票房是如何統計的
行業常用的票房收入計算公式為「票房=總座位數×場次×上座率×平均票價×天數」。比如某影院一天放映了6場《李茶的姑媽》,有學生票:40元,共10人,標准票:80元,共10人,團體票:30元,共10人,會員票價:20元,一共10人,那麼,這一天該影院的總票房就是:4000+8000+3000+2000 。
現在各大電影院都實行電腦售票,這些售票系統是和國家電影局電影專項基金管理中心聯網的,每天都會在固定的時間自動向專基中心發送票房數據。因此,相對來說,電影票房對判斷某部電影的觀影人數,影片受歡迎程度還是有很大參考意義的。
電影票房的影響因素
1、影片題材及劇本。題材和劇本是一部影片的核心,科幻、魔幻題材如《變3》、《哈7》及此前的《阿凡達》等影片,一向是票房大熱,除題材具有想像空間而吸引觀眾外,這類影片本身就需要大成本支撐,因此獲得票房佳績也不足為奇。另外,貼近生活、打動人心的情感題材影片,如《非誠勿擾》、《失戀33天》等,也成為「應景」主題,為影迷所期待。
2、主創團對主創團隊,隊如導演、主演、製片人、製作團隊等,無一不是吸引觀眾的重量級籌碼。例如國民大導張藝謀、馮小剛的力量甚至大過於影片題材,成為觀眾期待的焦點;演員的力量同樣如此——有些人光名字就是號召力,如楊冪的《孤島驚魂》一舉開創「粉絲電影」的先河,演員對票房的貢獻不容小視。製片人、製作團隊的名氣,同樣能為一部影片帶來「萬眾期待」的效果。
3、影片定位,影片定位是指片方對自己影片的市場預估。首先應該是目標人群定位,從影片的劇本設置、演員選擇、拍攝手法到後期製作風格、傳播途徑、傳播手段等等,都要迎合大部分的目標人群喜好,奠定穩定的票房基礎。其次要正確預估票房,有時片方過於自信,會影響影片上映後的側重點。尤其在做傳播工作之前,應該根據檔期、題材、排片等因素做好影片的定位和票房預估的溝通。
以上內容參考網路_票房
6. 電影票房分析及預測
從20世紀初的西洋鏡戲法到今天占據全球電影業總產值的三分之一強,資本的加入讓好萊塢在過去百年的發展中變得越來越理智--比起商業片流水線締造者,它更像一個數學家--它精於計算每一項決定對利潤的貢獻:《蝙蝠俠》續集是否要接受男演員片酬的獅子大開口以獲得百分之幾的忠實粉絲買票入場;是否要在動作片的第37分鍾增加感情戲以爭取女性觀眾;是否要為這部爛透了的原著聘請收費高昂的劇本醫生;一個小金人編劇的名頭到底值多少錢……這就是在電影開機之前最為重要的環節:票房預測。
華爾街不僅給好萊塢帶來了密集的資金支持,也帶來了理性的金融工程技術,後者好像一把衡量藝術的尺子。一位浸淫於電影行業的金融人士一語中的:"在這個行業里充斥著曖昧不清、晦暗不明,有真正的藝術家、也有忽悠的吹水者,但到底怎麼判斷是否能合作,項目是否有投資價值,全憑經驗"。
如何預測
早在80年代,美國票房收入預測的先驅BarryLitman對美國80年代近700部電影進行分析推出票房收入預測模型。該系統對之後美國電影投資界產生了顛覆性的影響。電影票房預測系統能分析預測不同種類電影的票房價值,已經成為國際電影產業投融資的重要參考工具,對電影產品定價及衍生產品開發都具有較強的指導作用。
預測系統
電影票房量化分析及預測系統(Box Revenue Prediction)是在考察導演、主要演員、製片、發行及市場營銷、電影生命周期、電影類型、發行地區等影響電影票房的諸多因素基礎上,基於資產定價模型,綜合採用金融工程和回歸統計分析方法研發出的預測系統。它能分析預測不同種類電影的票房價值,成為電影產業投融資重要參考工具,對電影產品定價及衍生產品開發都具有較強的指導作用。
中國第一套BRP系統
2012年1月,中影集團聯合艾億新融資本推出了國內第一套基於電影票房預測的估值與定價分析系統--BRP系統。通過對過去4年中600多部影片的統計分析,該BRP系統發現了6條有趣的現象:
·低成本的影片一般會比大片更賣座
·無名小卒主演的影片要比明星主演的影片利潤率更高
·類型的藝術特徵跟利潤之間不存在直接關聯,但評論的多寡(無論好評或者劣評)跟利潤之間有密切關系
·不含暴力、色情成分的家庭影片最容易賺錢
·大片的續集要比普通新片更容易賺錢
·明星在為影片帶來更高票房的同時,也往往拉低了利潤率,因為大部分收入進了明星的口袋
7. 影片票房是怎麼計算的
票房可以用觀影人數或門票收入來計算,而通常我們所講的票房,就是用門票收入來計算的。即,票房=票價X購買人數。
比如某影院一天放映了6場,有學生票:40元,共10人,標准票:80元,共10人,團體票:30元,共10人,會員票價:20元,一共10人,那麼,這一天該影院的總票房就是:4000+8000+3000+2000 。
(7)電影票房和數量研究擴展閱讀
電影業中,票房已經成為衡量一部電影是否成功的重要指標之一,可以用觀眾人數或門票收入來計算,一般直接用來衡量一部電影的熱播程度。2016年1月,電影市場管理工作會議在北京召開,電影局出重拳整頓市場秩序,如果影院偷漏瞞報票房,院線要承擔連帶責任,影院放映質量差等問題也會被集中治理。
2018年12月31日,國家電影局發布的數據顯示,當年全國電影總票房為609.76億元,同比增長9.06%,城市院線觀影人次為17.16億,同比增長5.93%;國產電影總票房為378.97億元,同比增長25.89%,市場佔比為62.15%,比去年提高了8.31個百分點,市場主體地位更加穩固。
8. 電影票房除了人口數量還和什麼有關
經濟,分析如下:
美國電影協會發布了2017 年電影市場報告,報告顯示2017年全球票房收入創新高
達406億美元。其中:
第一名——北美市場(美國+加拿大)——111億美元
第二名——中國大陸市場(不算港澳台)——79億美元
第三名——日本——20億美元
第四名——英國——16億美元
第五名——印度——16億美元
第六名——韓國——16億美元
第7名——第11名分別為:
法國15億美元;德國12億美元;俄羅斯10億美元;澳大利亞9億美元;墨西哥9億美元
也就是說,經濟第一位,票房第一,經濟第二位的票房第二,經濟第三的票房第三。所以,票房跟經濟和人口有關!