热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

拍森python百度百科_用Python检测国产电视剧后,发现了各位演员的真实水平.........

②剧集信息③演员信息通过爬取以上三个页面的数据,我们可以获得完整的电视剧评分及演员信息数据,用于之后的数据对比及可视化。我们以爬取第一部分的代码为例&

② 剧集信息

5fb238ec71af4a3292c4d64b08800f6f.jpeg

③ 演员信息

dcb5476d29b94c7a84ed35c01a53cf4f.jpeg

通过爬取以上三个页面的数据,我们可以获得完整的电视剧评分及演员信息数据,用于之后的数据对比及可视化。

我们以爬取第一部分的代码为例,展示整体爬取思路:

driver = webdriver.Chrome()

driver.maximize_window()

driver.close()

driver.switch_to_window(driver.window_handles[0])

url = 'https://movie.douban.com/tag/#/?sort=U&range=2,10&tags=%E7%94%B5%E8%A7%86%E5%89%A7,%E4%B8%AD%E5%9B%BD%E5%A4%A7%E9%99%86'

js='window.open("'+url+'")'

driver.execute_(js)

driver.close()

driver.switch_to_window(driver.window_handles[0])

whileTrue:

try:

js="var q=document.documentElement.scrollTop=10000000"

driver.execute_(js)

driver.find_element_by_class_name('more').click()

time.sleep(2)

except:

break

name = [k.text fork indriver.find_elements_by_class_name('title')]

score = [k.text fork indriver.find_elements_by_class_name('rate')]

url = [k.get_attribute('href') fork indriver.find_elements_by_class_name('item')]

pd.DataFrame({'name':name,'score':score,'url':url}).to_excel('电视剧名称.xlsx')

02 剧集对比

我们在剧集对比部分主要展示两部分数据。

首先是TOP15以及BOTTOM15的剧集评分及拍摄年代:

f5703a9876b3428b85f0f739fe03dde2.jpeg

5973090ab3af4ff9be537b61362fee04.jpeg

可以看到十分鲜明的对比,评分较高的剧集大多拍摄年份剧集都有一定的年头,并且历经时间的考验,愈发展示其独特的魅力。

相反,一些评分较低的剧集,往往都是近年来拍摄的,可能这也与剧集增多有关。

需要提醒的是榜单中的《寻秦记》不是古天乐版本,那是经典中的经典,至于榜单中出现的版本,大家可以有机会亲自去了解一下。

正所谓没有无缘无故的爱,也没有无缘无故的恨。

我们也选取了豆瓣当中对于剧集的一些有意思的点评。

通过点评,让我们了解这些评分产生的原因。

TOP篇

1

许多年以后观看发现,其中造型与性格塑造完美,准确把握原著,时代影响力巨大,印象极其深刻。------《西游记》

2

老一代影艺人是以一种虔诚的态度对待红楼梦的,87版之后,世间再无真人版红楼。------《红楼梦》

3

这就是我的圣经,思想启蒙之作 ------《我爱我家》

4

鞋儿破 帽儿破 身上的袈裟破 你笑我 他笑我 一把扇儿破 经典 ---《活佛济公》

5

绝对是国产情景喜剧无法超越的巅峰之作!其中每个角色都是无法复制的! ------《武林外传》

BOTTOM篇

1

没见到甜蜜,倒是这个演技每一秒都是暴击 ------《甜蜜暴击》

2

现在还是有这么多粗糙的偶像剧,玩了几十年的老套桥段还在用 ------《极光之恋》

3

瞟了半集被吓死了,演技跟痴呆似的= = ------《路跑甜心》

4

剧情奇葩,演技浮夸,特技粗糙。一剧融合了以上的所有元素,导演简直就是演艺圈的火锅店老板 ------《来自星星的继承者们》

5

于妈拍的那版.....其实还挺好看的! ------《新笑傲江湖》

03 演员对比

我们此次根据演员参演的剧集评分,考虑演员在其中角色的重要性进行赋权,结合剧集评论数量,加权平均得到每个演员的评分情况。

首先是我们评选的评分靠前的演员及其出生年份。

17cd7ddb4c984d9ebdf9a0ef90860422.jpeg

估计大部分年轻的读者,可能对这些名单中的演员很多都不是很熟悉。

在此小编建议各位可以去看一下这些老戏骨的剧集,感受他们所散发的魅力。

同时我们也专门对比了下80后、90后(包含00后)的评分,找寻其中的佼佼者。

73795162cb474708b99d800041f7094c.jpeg

6866007d2d454d33a940b0b4772a2226.jpeg

刘昊然在评分中领跑其他的90后,考虑到其今年只有20岁出头,我们也期望他在未来能给我们带来更多经典的作品。

可能很多读者对TOP20的演员并不是很熟悉,其实大可不必,因为下面的榜单中相信大多都会是你所熟悉的。

37e87bd829e7410e8d633c212658dea0.jpeg

想必看到这里,各位会找到熟悉的感觉,我们相信榜上的各位演员其实也是最具潜力的演员。

只要努力雕琢演技,未来一定会受到观众对其演技的认可。

我们同时分别对比了一下男、女演员。

11498d014eb040c1889f5048a8c85c1d.jpeg

bd10a170410f41579526ac323160c116.jpeg

在此需要指出的是,余文乐和赵又廷上榜并不是因为其剧集评分真的偏低,主要是其参与的大陆制作剧集评分较低。

并且我们此次没有统计港台剧。

我们也希望榜单中的各位演员未来更加精彩的表现。

04 星座分布

感谢豆瓣给我们提供了演员星座的数据,小编周围也有许多对星座十分感兴趣的朋友,不妨我们看一下星座的分布情况。

7a3a0ac1f9db4a99998c1a3549732adc.jpg

看来星座整体分布还是比较平均的,只是天秤座和天蝎座略多于其他星座。

关于星座,至于你信不信,反正小编是不怎么信的

关于矩形树图的实现,可以参考以下代码。

frompyecharts importTreeMap

star_stat = actor_data.groupby('xingzuo').agg({'name':'count'}).reset_index().sort_values('name'

,ascending=False)[0:12].reset_index()

data = [{'value':star_stat['name'][i],

'name':star_stat['xingzuo'][i]+' '+str(star_stat['name'][i])} fori inrange(star_stat.shape[0])]

treemap = TreeMap("星座分布图", width=1200, height=600)

treemap.add("星座分布", data, is_label_show=True, label_pos='inside')

treemap.render('星座分布.html')

05 城市分布

我们在看完了星座分布之后,再继续来看一下演员的城市分布。

看看有多少自己的老乡在参演着电视剧。

bfca8a7808a24f93b699094ee867bd63.jpg

不出意外,北京和上海两大中心城市的演员数量也是最多的,而第三名就是小编的家乡青岛了。

之前每当小编提及青岛,总是会提起青岛的明星多,这次的数据更加使得小编未来有了交流(chuixu)的底气。

我们下面分别来看一下TOP5的各个城市明星名单。

北京

913cfd138b0f4c79bda2d9e361a39b86.jpeg

上海

24671e3cfbaf4444a19b5748de69d2b8.jpeg

青岛

a0cafdb25476471c9457d8daa761151c.jpeg

哈尔滨

6871792ddd954c6c8734884737d780e7.jpeg

西安

8a4f2877952f4ca4abe41c152f969b4d.jpeg

-END-

转载声明:本文转载自「数据森麟」。



推荐阅读
  • CSS3选择器的使用方法详解,提高Web开发效率和精准度
    本文详细介绍了CSS3新增的选择器方法,包括属性选择器的使用。通过CSS3选择器,可以提高Web开发的效率和精准度,使得查找元素更加方便和快捷。同时,本文还对属性选择器的各种用法进行了详细解释,并给出了相应的代码示例。通过学习本文,读者可以更好地掌握CSS3选择器的使用方法,提升自己的Web开发能力。 ... [详细]
  • 计算机存储系统的层次结构及其优势
    本文介绍了计算机存储系统的层次结构,包括高速缓存、主存储器和辅助存储器三个层次。通过分层存储数据可以提高程序的执行效率。计算机存储系统的层次结构将各种不同存储容量、存取速度和价格的存储器有机组合成整体,形成可寻址存储空间比主存储器空间大得多的存储整体。由于辅助存储器容量大、价格低,使得整体存储系统的平均价格降低。同时,高速缓存的存取速度可以和CPU的工作速度相匹配,进一步提高程序执行效率。 ... [详细]
  • ASP.NET2.0数据教程之十四:使用FormView的模板
    本文介绍了在ASP.NET 2.0中使用FormView控件来实现自定义的显示外观,与GridView和DetailsView不同,FormView使用模板来呈现,可以实现不规则的外观呈现。同时还介绍了TemplateField的用法和FormView与DetailsView的区别。 ... [详细]
  • web.py开发web 第八章 Formalchemy 服务端验证方法
    本文介绍了在web.py开发中使用Formalchemy进行服务端表单数据验证的方法。以User表单为例,详细说明了对各字段的验证要求,包括必填、长度限制、唯一性等。同时介绍了如何自定义验证方法来实现验证唯一性和两个密码是否相等的功能。该文提供了相关代码示例。 ... [详细]
  • 本文介绍了在iOS开发中使用UITextField实现字符限制的方法,包括利用代理方法和使用BNTextField-Limit库的实现策略。通过这些方法,开发者可以方便地限制UITextField的字符个数和输入规则。 ... [详细]
  • 本文由编程笔记#小编为大家整理,主要介绍了logistic回归(线性和非线性)相关的知识,包括线性logistic回归的代码和数据集的分布情况。希望对你有一定的参考价值。 ... [详细]
  • YOLOv7基于自己的数据集从零构建模型完整训练、推理计算超详细教程
    本文介绍了关于人工智能、神经网络和深度学习的知识点,并提供了YOLOv7基于自己的数据集从零构建模型完整训练、推理计算的详细教程。文章还提到了郑州最低生活保障的话题。对于从事目标检测任务的人来说,YOLO是一个熟悉的模型。文章还提到了yolov4和yolov6的相关内容,以及选择模型的优化思路。 ... [详细]
  • Python正则表达式学习记录及常用方法
    本文记录了学习Python正则表达式的过程,介绍了re模块的常用方法re.search,并解释了rawstring的作用。正则表达式是一种方便检查字符串匹配模式的工具,通过本文的学习可以掌握Python中使用正则表达式的基本方法。 ... [详细]
  • 解决python matplotlib画水平直线的问题
    本文介绍了在使用python的matplotlib库画水平直线时可能遇到的问题,并提供了解决方法。通过导入numpy和matplotlib.pyplot模块,设置绘图对象的宽度和高度,以及使用plot函数绘制水平直线,可以解决该问题。 ... [详细]
  • 本文介绍了Python爬虫技术基础篇面向对象高级编程(中)中的多重继承概念。通过继承,子类可以扩展父类的功能。文章以动物类层次的设计为例,讨论了按照不同分类方式设计类层次的复杂性和多重继承的优势。最后给出了哺乳动物和鸟类的设计示例,以及能跑、能飞、宠物类和非宠物类的增加对类数量的影响。 ... [详细]
  • IjustinheritedsomewebpageswhichusesMooTools.IneverusedMooTools.NowIneedtoaddsomef ... [详细]
  • 基于dlib的人脸68特征点提取(眨眼张嘴检测)python版本
    文章目录引言开发环境和库流程设计张嘴和闭眼的检测引言(1)利用Dlib官方训练好的模型“shape_predictor_68_face_landmarks.dat”进行68个点标定 ... [详细]
  • 树莓派语音控制的配置方法和步骤
    本文介绍了在树莓派上实现语音控制的配置方法和步骤。首先感谢博主Eoman的帮助,文章参考了他的内容。树莓派的配置需要通过sudo raspi-config进行,然后使用Eoman的控制方法,即安装wiringPi库并编写控制引脚的脚本。具体的安装步骤和脚本编写方法在文章中详细介绍。 ... [详细]
  • SpringMVC接收请求参数的方式总结
    本文总结了在SpringMVC开发中处理控制器参数的各种方式,包括处理使用@RequestParam注解的参数、MultipartFile类型参数和Simple类型参数的RequestParamMethodArgumentResolver,处理@RequestBody注解的参数的RequestResponseBodyMethodProcessor,以及PathVariableMapMethodArgumentResol等子类。 ... [详细]
  • 本文由编程笔记#小编整理,主要介绍了关于数论相关的知识,包括数论的算法和百度百科的链接。文章还介绍了欧几里得算法、辗转相除法、gcd、lcm和扩展欧几里得算法的使用方法。此外,文章还提到了数论在求解不定方程、模线性方程和乘法逆元方面的应用。摘要长度:184字。 ... [详细]
author-avatar
safadfdfdsfsd
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有