大数据分析过往的36年春晚:冯巩老师上春晚次数最多
32019年除夕是2月4日,和2000年是同一天。
4冯巩老师从86年至今,雷打不动地从未缺席过春晚。
5蔡明老师,是女性中上春晚最多的。
6周董上过5次春晚,刘德华是四大天王中上春晚最多、最早的。
7歌曲类节目基本占了所有节目的一半,小品占了15%,相声是9%。
作者:苏克1900
昨晚的春节联欢晚会,你看了吗?
看过那么多春晚,哪一年、哪些节目、哪些人你还留有深刻印象呢。
记忆中,只完整地看过2005年到2015年十年春晚。05年之前,还很小,看不懂;15年之后,长大了,也看不懂。
如今,距离第一届春晚1983年,整整过去了36年,3轮的「十二生肖」年。来回顾一下过往36届春晚的一些有趣数据。
分析内容
接下来,通过Python数据分析,会回答下面这些问题,在知道答案之前,你可以先猜猜看:
谁导演春晚次数最多?
谁主持春晚次数最多?
哪两年的除夕刚好是同一天?
谁上春晚次数最多,堪称「钉子户」?
港台明星上春晚次数对比
歌曲、小品、相声类节目数量对比
数据获取
网上搜了挺久都没有找到齐全的春晚节目数据,连春晚官网也没有,结果在维基百科上找到了。
右侧信息表有导演、主持人、除夕当天日期这几项数据。
节目单表是每一年春晚上表演的节目,包括:节目类型、节目名、演员名这几项数据。
Python抓取这类表格数据,方法简单,几行代码就能搞定,修改URL的page参数,可以循环遍历抓取1983到2018年所有的节目数据。
数据抓取代码如下:
1importrequests
2importpandasaspd
3fromurllib.parseimportquote
4
5defget_content(year):
6keywords = quote('年中国中央电视台春节联欢晚会')
7url ='https://zh.wikipedia.org/wiki/{}{}'.format(year,keywords)
8# 1 节目单; 0 节目信息
9ifyear !=2014:
10response = pd.read_html(url)[1]
11else:
12response = pd.read_html(url)[3]
13response['year'] = year
14response.drop([0],inplace=True)#删除首行
15response.to_csv('chinese_newyear.csv',mode='a',encoding='utf_8_sig',index=0,header=0)
16
17if__name__ =='__main__':
18foryearinrange(1983,2018):
19get_content(year)
抓取下来的节目信息:
抓取下来的节目数据:
抓取下来的数据是脏数据,用Python清洗处理一下就可以分析,这些不是重点,所以下面直接进入分析环节,来一探究竟。
数据分析
谁导演春晚次数最多?
导演是春晚的总负责人,好比厨师,厨师决定了春晚大餐好不好吃。36年间,有很多导演负责过春晚,比如近些年的哈文、朗昆,你可能想知道他们是不是导演次数最多的,下面就来看看导演次数最多的十大导演:
导演次数最多的是黄一鹤和朗昆导演,两个人都导演了5次。
黄一鹤导演对于80后之后的人来说,不算熟悉,因为他导演春晚的时候是在80年代,很多人都没有出生。朗昆则相对熟悉些,最近一次导演是2009年。那一年的春晚,是印象最深刻的一届,因为诞生了赵本山最棒的小品《不差钱》(个人之见)。
哈文一共导演了3次,都在2010年之后,其他的导演就不那么熟悉了,相比于主持人、演员,他们是幕后工作者。
谁主持春晚次数最多?
导演过后就是主持人了,他们堪称春晚的门面,大家也更熟悉些,不管是早年的赵忠祥、倪萍,中生代的朱军、董卿,还是近年新晋的康辉、李思思以及我们新疆大帅锅尼格买提,只要一提名字,你马上就能对号入座。
可你知道主持界的「钉子户」是谁?「常青树」又是哪些人?来看看春晚主持次数最多的TOP10名单:
一眼望去,十个人每一个都很熟悉。
排第一的是主持了21年的朱军,称得上劳模了,从1997年连续不间断地住持到2017年,远超其他主持人。
排第二的是周涛,主持了14年,2011年之后退居幕后,2016年又复出了一次。对她的印象,莫过于2003年和冯巩合作过的一个小品《马路情歌》: