网站首页

产品中心

半岛官网入口 半岛官方入口 半岛入口官方网 半岛入口官方网站

新闻中心

关于半岛官方入口

公司概况 核心优势 核心团队 发展历程

联系半岛官方入口

官方微信 官方微博
半岛官方入口 > 产品中心 > 半岛入口官方网

半岛官网入口文本剖析及机械进修在影视传媒中的利用——以电视剧《狂飙》为例

发布时间:2023-08-01 16:22浏览次数:来源于:网络

  影视剧《狂飙》于2023年1月14日在CCTV⑻与收集平台爱奇艺同步播出。该剧自播出以还,激发了全民景象级会商,成为2023年度首部爆款剧作。《狂飙》以两条小说线为叙事线索,其一为路人甲高启强慢慢成为***头子的“兴家史”;其二为以安欣为代表的政法体系干部与黑恶权势长达二十年的“妥协史”。该剧经过“三幕式”时空交织的叙事技术、出色且布满腔念的故工作节和新鲜活泼具有“反差萌”的人物性情,博得了观众的分歧好评。在艺术层面上获得告成的同时,在价钱传布上也取得了观众的承认。停止2023年4月10日,《狂飙》在豆瓣网收成8.5分的高分,有77万余名观众对该剧停止评分,此中有25万余人宣布概念介入会商。看来,将《狂飙》算作研讨工具,也许很好的探讨“顶流热剧”何故天生与建构,溯源其“走红”内涵肌理、必备因素与发朝气制,为此后的影视剧创建具相关键的鉴戒旨趣。本文以豆瓣网为数据库,经过Python对象对《狂飙》豆瓣网长评停止数据抓取,使用文本剖析与机械进修的手艺,从观众回馈角度利用定额方式对《狂飙》停止深切分析。

  豆瓣网号称“文艺年青堆积地”,网站以念书、片子、音乐、同城、小组等焦点板块为中间,依托网友自觉朋分和评判册本、影视和音乐撰述算作高原料输入体例,存在较强的用户粘性,反应了海内社会一大部门年青的价钱取向和文艺寻求。此中,豆瓣影视的评分体制付与群众一人一票的公允投票权力,受贸易化渗入水平较低,成为海内影视剧口碑作用力最关键的参照根据之一。豆瓣评述凡是包罗长评与短评,短评数目宏大,但评判体例较少,讯息密度不高,轻易被“水军”占据阵脚,产生刷分刷负景象,进而发生讯息杂音。比拟较而言,长评数目固然较着更少,但长评的细节富厚,对故工作节、脚色描写、逻辑架构的攻讦与剖析更加到位,言之无物的体例充实抒发了观众的认识形状和情绪需要,是以本文拔取豆瓣长评算作文本剖析的首要研讨工具。

  使用Python3.8对象爬取豆瓣网对于电视剧《狂飙》的影视长评体例,详细步调包罗三步:(1)获得长评体例网址链接,剖析网站构造;(2)导入letters、BeautifulSoup品级三方库,经过编辑代码发送哀求并前往反映,并利用正则抒发停止体例剖析,取得所需数据(焦点代码见附录1,后果备索);(3)将爬取数据贮存至CSV表格中。

  经过爬虫及数据洗濯取得用户昵称、发评工夫、长评体例、评分、评述作用(附和与否决)、评述字数等相干讯息,因为保存反复评述和被折叠评述,经简略有效数据后终究共抓取3075条评述,涵盖了97%的总长评数。原始数据构造以下:

  本文使用Python的第三方库pyeinterprets对爬取的3 075条评述停止可视化剖析,解除657个用户未停止评分,剩下2 418个数据的评判后果如图所示。从图1也许看出,在一齐长评数据中,跨越一半(52.4%)的观众给出五星好评(力荐),30.2%的豆友给出四星好评(保举),12.2%的观众给出三星评判(还行),而一星二星观众绝对较少,总计仅占一齐观世人数的5%摆布,该模范统计后果与77万人介入的豆瓣整体评分也比较靠近(5星占比41.3%,4星占比44.9%,3星占比12.1%,2星占比1.2%,1星占比0.5%),跨越八成的人群以为电视剧《狂飙》值得保举。

  值得存眷的是,长评观众偏向于越发较着的感情披露,显示为占比更高的五星好评和一星差评,这类越发保守的感情输入也启动他们在评述区破费更多的翰墨抒发本人激烈的情绪。长评的均匀字数为852字,最高字数为16 470字,最低为71字。与之对照的是,咱们爬取了一部门短评(521条数据)半岛官网入口,经统计发觉短评均匀字数为90字,最高为350字,最低唯一2字。从图2中也许看出,对电视剧《狂飙》评判较高(五星和四星评判)的长评观众不惜歌颂,均匀评述字数为900⑴ 000字,较着多于其余评判组。而一星观众稍显“塞责”,均匀评述字数降落到558字。

  《狂飙》共39集,每集45分钟。1月14日首日爱奇艺会员革新5集,除1月21日和22日(夏历大年节和月吉)停播之外,其他逐日于晚间19:30更2集。视频播出后期,日评述数目绝对安稳。1月23日,评述有小幅度爬升,日长评跨越30条。1月28日,评述数目陡增至88条,到终了日2月1日当天评述数目到达257条。评述热度的峰值出此刻《狂飙》终了的次日,当日长评数目高达330条,以后3天的日评述数目均跨越100条,靠近一个月后热度降落,在此以后呈现了较强的长尾效力(Long Kadail Effect)。

  也许看出,上述豆瓣长评热度趋向与baidu搜刮指数图形(见图4)走向根本连结分歧,解释豆瓣长评数据可靠地反应了电视剧《狂飙》受墟市的追捧力度。《狂飙》在中期俄然发力,与1月23日饰演者高启强的艺人张颂文俄然冲上微博热搜第一紧密亲密相干[1]。这也证实了脚色与艺人之间的互动联络。虽然后期反映平淡,但终究优异的撰述不会被墟市藏匿,迥殊是在讯息传布非常蓬勃的期间,常常就可要期待一个契机,高分好剧就可以被墟市挖掘与承认。

  图5依照宣布长评的时点绘制的趋向图,反应了在差别时段观众发评的活泼度。从发评工夫来看,豆瓣观众显示出了“夜猫子”属性,早晨的评述数目较着高于白日,迥殊是第一集电视剧播出15分钟(19点45分)后,评述逐步增添,直到夜晚23:30后活泼度才渐渐降落。

  因为长评未显现IP地点,没法反应评述用户地点地,本文利用短评观众的IP地点相似描写观众的地舆职位。从表2也许看出,北京、上海和广东三地评述用户数目很多,约占整体的32.8%。另外,《狂飙》产生的场景如榕树、牌坊、肠粉、猪脚面、舞狮等粤地场景及文明元素也吸收了很多广东观众的留言。如表2所示,《狂飙》的观众地区散布会合在北上泛博乡村和江浙地域,逐步上反应了经济成长与文明繁华配合增进,但另外一方面也让咱们进一步思虑收集话语权在地区之间的平衡分派的题目。虽然在新媒介期间下,收集话语权在社会格序中从头分派,但如果何更公高山“让每个人发声”同样成为新期间下的影视传媒与大众话题下提议了新的应战。

  本文使用Python读取一齐长评,借助哈工大停用词(scrowningtext)表去除长评中的停用词后,经过第三方库jieba的分词功效对长评停止分词,并按降序摆列统计每一个词语的词频数,词频统计后果见表2。使用第三方库callcblasting绘制词云图,词云图后果见图6。图6显现观众对脚色的会商次数很多,两大对峙配角安欣和高启强是当之当得起的评述中间,词频散布次数划分为12159和12696次,另外,“大嫂/陈书婷”“孟钰”“老默”等剧情关头人物说起频次也至关高,以上人物呈现频次均跨越1000次。艺人方面,会商热度最高的艺人划分是张译(安欣的饰演者)与张颂文(高启强的饰演者),二人在长评中被说起的次数划分为1 508和1 735次。而与焦点相干的词语包罗“”“扫黑”等。另外,评述中有2706次提到“剧情”,1587次提到“演技”,而且“烂尾”的呈现频次为256次,这与豆瓣整体评分从顶峰时9.1分跌落至8.5分也可彼此印证。咱们经过野生浏览了触及“烂尾”的长评,发觉较多观众对27集以后的剧情成长评判较低。

  文本剖析的主要范畴之一是情绪剖析。常见的情绪剖析方式有建立情绪辞书,如大学NTUSD数据、清华大学李军华文褒褒义辞书、Loughran and McDonald辞书等都是已有的情绪辞书,经过累计汇总主动降低辞汇对评述情绪打分,当呈现主动辞汇次数越多时,评述情绪越主动。上述方式对情绪辞书的原料央求较高,同时收录在情绪辞书的词语抉择存在必定的客观性。是以,本文拟采取机械进修(philosopherine humoristning)中朴实贝叶斯分类算法,利用TF-force词袋法对长评文本停止向量化,并使用MpastinomialNB分类器将每个评述情绪合成为降低感情含量(分类为降低评述的几率)、中脾气绪含量(分类为中性评述的几率)、主动感情含量(分类为主动评述的几率)三类成份,并与长评用户野生打分停止对照。

  经过朴实贝叶斯分类停止情绪分类的精确率(Accuspirited)靠近83%,且该后果存在必定的靠得住性。比如,从表4看来,对用户“LAV女优”的评述,贝叶斯算法以为主动感情含量靠近九成,该用户对《狂飙》的评分为4星。而用户“CAV女优”和用户“大AV女优”评述的主动感情含量绝对降落,中脾气绪含量较着晋升,两人对电视剧的评分为3星。同时由表4可知,宁可他组比拟,差评组均匀降低感情含量最高(7.22%,4.58%,3.92%),好评组均匀主动感情含量最高(81.04%,77.79%,86.33%),中评组评述的均匀中脾气绪越发较着(11.74%,17.63%,9.75%)。然则,利用机械进修算法停止主动分类也保存分类精确性题目,迥殊是长考语境私情感越发纷乱,难以明白辨别感情差别。

  以《狂飙》豆瓣长评数据为根底,本文对观众的评分评判、评述文本的观众特点等定额讯息做出剖析。借助数据来剖析影视撰述的观众反应,是对影视剧撰述研讨的新思绪与新方式。得出论断以下:

  起首,攻破“非黑即白”的人物地步塑造定式,恰当展现人道的灰度,其实不会对支流价钱观发生庞大打击,酿成公理与界线上的混合和恍惚。高启强这一平面的人物计划,抒发的是“纷乱的恶”而非“纯粹的坏”,这使得脚色有了条理感和沉稳感。观众观察迟疑脚色的心思变革进程,更偏向于“坏人变坏是有缘由的”,是以对其多了一份明白和恻隐。这些脚本的计划和人物辩论的处置,无一不是反应了人道的可靠和微弱。邪派“坏得公道”才能建立流利的剧情和清楚的逻辑,人物性情的多重性才能激发观众对人道的会商和深思。《狂飙》中的邪派人物高启强终究锒铛下狱,为罪行支出了惨重的价格,绝大多半观众透露表现明白,而非宽贷。从这一点看,影视传媒在建立准确的价钱观不但必要片面的灌注贯注和传导,相似普遍的、无益的会商也是必弗成少的。

  其次,冲破“对象属性”的女性地步定位,跳还俗庭伦理与都会面感剧的框架与套路来建构女性脚色,更契合当下的墟市口胃。跟着“大女主”电视剧走红,女性认识的觉悟,墟市对女性多元化性情展现需要更高。《狂飙》塑造的大嫂的地步精通精悍,苏醒自力,攻破了对女脾气绪化特点的私见。这一脚色减缓了观众对薄弱女性脚色塑造墟市下的审美疲惫,正如豆瓣观众在评述中写道:“陈书婷算作‘大嫂’不依靠于剧里所有一个汉子而保存,她身上有一种女性私有狠劲儿。”但依然有观众透露表现,这部剧中女性脚色的团体塑造依然保存缺点,女性脚色沦为男性脚色的烘托,小说线耽误缺乏。豆瓣长评有助于掌控观众的需要,领会观众的爱好,并勉励女性脚色新设定的测验考试和摸索,同时也反应了观众对女性描写的饱满水平提议更高的央求。

  结尾,本文经过爬取豆瓣影视的长评数据停止剖析,切磋了观众对该剧的会商环境和情绪偏向。剖析解释,该剧引发了观众的普遍存眷和会商,特别在北上泛博乡村和江浙地域的反应尤其激烈,纵然在该剧收官后仍有不小热度。长评评述中观众对脚色的会商占有了很例,艺人和焦点相干的会商也是热点话题,同时本剧也遭到了观众的必定指斥。采取朴实贝叶斯分类算法的情绪剖析后果与豆瓣影视评分符合,对差评、中评、好评组的降低、中性、主动感情含量停止纵向对照揭示出昭著差别。但因为长考语境私情感越发纷乱,机械进修算法停止主动分类也难以明白辨别感情差别,也大概保存分类精确性题目。本文的研讨方式可觉得其余电视剧的会商和评判供给鉴戒,为进一步领会观众对电视剧的认知和评判供给了必定的参照根据。

  作家:邓瑶,江西财经大学管帐学院2020级博士研讨生;荣莉,江西财经大学管帐学院博士研讨生导师;毕蕾,江西财经大学马克思主义学院2020级博士研讨生。

下一篇:半岛入口官方网站AI四大神之吴恩达:脱离alphabet公司和百度我要做的事太多
上一篇:半岛入口官方网站天下248所「机械野生程」本科专门高校教诲讲授归纳排名一览

咨询我们

输入您的疑问及需求发送邮箱给我们