240萬名演員職業生涯數據,揭露演藝圈“潛規則”
2019-06-23 10:57

240萬名演員職業生涯數據,揭露演藝圈“潛規則”

成功的背后,可否有通用的秘訣?從前這是一個哲學之問,但隨著海量的數據被挖掘,被結構化,關于成功的科學(Science of Success)開始變成一門顯學。從科學家,藝術家到后來的初創企業、體育明星,成功背后的規律被不斷挖掘出來。而今年6月在 Nature Communication  上發表的新文將研究對象擴展到了演員。


Photo by James Kresser on Unsplash,本文來自微信公眾號:集智俱樂部(ID:swarma_org),作者:郭瑞東


論文題目:Quantifying and predicting success in show business

論文地址:https://www.nature.com/articles/s41467-019-10213-0


尋求樂趣是人生活中的重要部分,在娛樂業蓬勃發展的當下,來自英國Queen Mary University的科學家們在 Nature Communication 上發表了一篇關于演藝生涯的大數據分析研究。論文分析和討論了演員職業生涯背后的一些規律,它不僅值得科研從業者閱讀,更值得關注演藝界的從業者與觀眾閱讀。如果一家娛樂公司想用大數據來改善公司的運營,節約成本,做出嚴謹的選擇。那么這篇文章能提供切實的建議。初入社會的演藝界新人想要了解行業全景,發展規律,也可以用文中的一些結論來幫助自己做出思考,權衡與取舍。


演藝從業者需要知道的職業規律


先上結論,文章對來自不同影視數據庫的數據進行了分析,從影視數據庫IMDB中列出的1888年到2016年來的所有電影電視節目中,匯總了約240萬演員的職業生涯數據(其中男演員151萬,女演員89萬)得出了有關演員職業生涯的四條普遍規律。我們來看看結論:


大部分演員的職業生涯堪憂


有90%演員處在失業狀態,只有2%的演員能夠靠演員的收入實現經濟獨立。69%的男演員,68%的女演員的演員終生都只參演一部戲。“跑龍套”之后再無其他收入。


演藝界存在顯著的馬太效應


富者愈富,越是成名的演員,出演次數越多。演員的好年景和好年景往往聚在一起,而壞年景之后往往會接著是另一個壞年景。對他們來說,演技本身不一定意味著確定會成功,更主要的影響因素是在演藝圈的網絡中處在的位置。


職業生涯早期更容易爆發式成功


不管男女,綜觀演員的職業生涯,一年能接到好幾部戲的好事多半發生在職業生涯的早期。越是在職業生涯的后期,一年參演多部戲的幾率越低,這個現象在女性演員身上尤其明顯。


大數據預測能力有限


現階段的信息無法準確預測職業演員的長期成就,一個演員出演幾部戲和其演藝生涯的長度并不是相關的,這意味著不是堅持的越久,就越可能成為大明星。這同樣意味著沉寂多年又重新回歸的演員,究竟哪一年能夠東山再起,也是無法預測的。


影視公司需要知道的行業規律


當前,能夠采集到的數據遠遠比IMDB上提供的對過往電影的回溯性介紹要更具信息量,因此任何對規律的挖掘性嘗試都是值得的。并且這些嘗試能給人提供決策上的幫助。比如演員職業生涯預測,什么類型的演員更適合什么角色,觀眾有什么樣的選擇傾向。


最新的權威研究表明機器學習可以預測不同背景的演員,在職業生涯的什么時間段更有可能“成功”。該算法使用了一萬五千名男演員,六千名女演員,從IMDB這個公開數據庫網站整理出演出記錄,進行訓練。基于這個數據庫的預每100次只有約15次會出錯。這說明使用大數據去預測娛樂業從業者成功的可能性是可行的。


大數據能夠預測成功可能性


具體來說,演藝公司可以預測哪些演員或者歌手具有更大的可能性走紅;直播網站可以預測哪些主播在什么領域會火;視頻網站也可以預測出潛在的大V在哪里,因而可以根據預測結果,優化,精準推廣,最終提高用戶的使用時間和滿意度。


大數據能夠揭示用戶偏好


不止是預測誰會成功,還可以預測不同的演員在哪種類型的劇中更容易成功,更適合扮演反派還是正面角色什么話題更受觀眾歡迎。來自視頻網站Netflex的案例提供了更進一步的,大數據能夠預測用戶的偏好,比如某些元素組合的戲能夠大火,從而讓開發商按圖索驥的打造“紙牌屋”等一系列廣受好評的美劇。


規律背后的大數據分析方法


如果你想知道研究中的細節與分析,那么你會對下面的內容感興趣。論文使用的大數據分析能提供定量評價的視角。


在嚴謹的科學研究中衡量,評價演員的成功程度并不是一件易事。不像學術界,體育界,演藝界的觀眾們更傾向于依賴對演員的總體感受而不是某一方面的成就來做出評判。雖然IMDB數據庫對每部電影有打分,但出演IMDB前250的影片,或者獲得奧斯卡獎,在星光大道上留名卻不像獲得諾獎,學術獎項那樣具備極其嚴謹的評判標準。同時,大部分演員的職業生涯中都會有很長的間隔,演藝界這種人氣漲落卻是常事,但是學術界很少會出現發了一篇文章后,好幾年都不發第二篇文章的現象。


本文中用每年出演的次數來衡量演員生涯的成功程度,這種定義方法能夠以一個統一的標準來評估不同年份不同類型的數據,是相對公平客觀的。


下面來介紹一下文章中一些重要的分析過程。圖1描述了一個演員的職業生涯,這些可直接獲得的數據可以稱為“一級數據”,有了它我們就能匯總出演員職業生涯的長度、參演總數、具有多少年演出記錄等“二級數據”。而成功的科學研究,就是要在這些“二級數據”之間尋找相關性,確定能否通過“一級數據”去預測“二級數據”。


圖1:演員職業生涯規律。圖中的每個點代表一年,這個點上對應的數字代表Ta今年參演的次數。


當“二級數據”的樣本量足夠大時,“二級數據”的分布及對應統計指標就構成“三級數據”。這里樣本越多,收集樣本時采樣越無偏,即“三級數據”越能代表真實情況。有了它,就有可能去驗證在其他領域發現的規律是否具有普遍性。


老戲骨永遠是少數


圖2是由大量演員職業生涯長度匯總而來的“三級數據”,描述了職業生涯持續時間長度與之對應出現的概率。這張圖中藍線和黑線分別為女演員和男演員的職業生涯數據,展示了男女演員職業生涯長度規律相同的和相異的部分。這里需要注意的是,由于在曲線的開始階段有所不同,女性擁有0-10年演藝生涯的可能性高于男性,因此在右上方對圖中的橫軸0-10的部分進行了縮放。


圖2:演員職業生涯長度的分布。橫軸是演員職業生涯的總時間,縱軸是該生涯長度的演員在群體中出現的概率。


兩性演員具有不同的“待機”模式


在下面的分析中,為了使短間隔的數據更容易閱讀,論文作者換用柱狀圖來展示數據。如圖3所示,他們首先隨機化演員兩部戲之間的等待時間數據,創建了一個假想的等待時間分布Pnull(τ)作為對照的基準。然后將演員根據性別分類,分別展示兩性演員與假想等待時間之間的區別。除以模擬的等待時間,得到相對偏差幅度。從而,我們就可以看出男女演員在等待時間上呈現出的明顯的差異。


其中男性演員擁有一年等待時間的可能性比女性低,女性演員更容易在投演一部戲后馬上加入下一部,但是如果時間線拉長到兩年及以上,情況則正好相反。銷聲匿跡一段時間后的男性演員比女性演員更容易回歸演藝圈。證明長時間的“待機”對女性演員的職業生涯威脅更大。側面論證了女性演員的職業黃金時間集中在職業生涯的前期。


圖3:等待時間τ的差異分布


“奇跡年”趕早不趕晚


下圖圖4展示了演員的“奇跡年”,既高產階段發生時間的分布,這種現象傾向于發生在早期而不是晚期,也就是人們常說的“出名要趁早。”


圖4:演員生涯的奇跡年時間分布


奇跡是可預測的


如圖5,雖然演員職業生涯的成功存在巨大的不可預測性,但是職業演員職業生涯中的“奇跡年”現象卻有一些發生規律。在科研領域中,科學家最有影響力的論文似乎在他職業生涯的任何階段都有可能出現。但是演員的職業生涯平均規律則顯示,演員的演出數量會出現在一段時間內的驟增,然后再次下降。


如圖所示,一個演員,事業的“奇跡年”前有明顯的事業上升和下降。和不考慮時間相關性的隨機模型對比,這種奇跡年的出現和消失是具備演出數量變動的前兆的。由此,娛樂產業就可以預測某個演員是否會在短期內迎來巔峰。


圖5:可預測的奇跡年。圖中的縱軸表示在這一年間出演的角色總量,橫軸表示距離奇跡年的時間距離。


預測質量——算法的誤差分析


最后說說論文算法質量的評價方法。算法的效率由準確率,找回率,F1等指標衡量。但本篇文章這類判斷真假的計算更應注意錯誤的類型和來源,這篇研究使用一個二分類算法,其中的假陽性指的是模型預測的成功年份沒有出現,即統計學中的第一類錯誤;假陰性是沒有預測出的成功年份,即統計學第二類錯誤。將假陽性和假陰性按縱軸頻率,橫軸預測與真實的差異畫直方圖,可以看出代表假陽性的黃色在分布上明顯大于代表假陰性的灰色。


圖6:預測結果的誤差分析


這兩張圖可以說明兩個結論:首先,模型預測給出的成功年份傾向于比真實的成功年份早一些,說明預測模型的假陽性來自數據集本身的特點,如果是特定算法導致的錯誤,那假陽性和假陰性的數據應該呈現相似的分布。而對于假陰性的分析,這里分布接近正態分布,這暗示著在較長的尺度上,下一年是否成功,是隨機的。


回顧全文,作者文中雖指出演藝界的成功和演技之間未發現明確聯系,這個結論卻缺少論證。參考王大順團隊近期的成果,研究了那些獲得杰出成就的科學家的職業生涯。如果拿每年奧斯卡的最佳男女主角配角,再加上金球獎,戛納威尼斯等幾個歐洲電影節的獎項,來定義演技突出的演員,研究一小群演技杰出的演員的職業生涯相對平均水平的演員有什么特殊點,也許以揭示出演員演技對職業生涯的影響。


本文來自微信公眾號: 集智俱樂部(ID:swarma_org),作者:郭瑞東,編輯:陳曦、王怡藺

本內容為作者獨立觀點,不代表虎嗅立場。未經允許不得轉載,授權事宜請聯系[email protected]

正在改變與想要改變世界的人,都在虎嗅APP

贊賞
關閉贊賞 開啟贊賞

支持一下 ??修改

確定

讀了這篇文章的人還讀了...

回頂部
收藏
評論2
點贊31
七星彩走势图