# Python_Data **Repository Path**: jackonz2017/Python_Data ## Basic Information - **Project Name**: Python_Data - **Description**: No description available - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2020-07-17 - **Last Updated**: 2020-12-19 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 电影受众群体分析 | 发布日期 | 2020-07-15 | | ---------- | -------------- | | 项目名称 | 中国电影受众群体分析 | | 项目现状 | 进行中 | | 项目所有者 | 王鹏杰 | | 项目设计师 | 王鹏杰 | | 项目开发者 | 王鹏杰 | | 项目测试者 | 王鹏杰 | ### 数据源 - 源数据:[豆瓣TOP250排行榜](https://gitee.com/jackonz2017/Python_Data/blob/master/douban_250.csv) - [PY文档](http://jackonz2017.gitee.io/python_data) - 数据栏:link:豆瓣相关电影链接、title:电影名、year:上映时间、director:导演、director_country:导演国籍、type:电影分类、length:电影时长、country_region:发行国、language:语言、avg_rating:豆瓣评分、num_of_ratings:评分人数、people_watched:已观影人数、people_wants_to_watch:想观影人数、num_comment:短评、num_reviews:长评 ![输入图片说明](https://images.gitee.com/uploads/images/2020/0718/195833_1769ac48_1648200.png "屏幕截图.png") ### 数据分析结果价值宣言 - 主要分析的目标数据:中国市场受众对于电影不同维度接受喜爱程度分析 - 加值:视频平台能够就此研究,购买相应受众较多的电影版权,节省版权开支。 ### 数据分析结果可视化 #### 使用的可视化模块 - pyecharts玫瑰饼图/地图 #### 可视化模块具体介绍 - pyecharts是一款将python与echarts结合的强大的数据可视化工具,简单的几行代码就可以将数据进行非常好看的可视化,而且还是动态的。基本步骤为导入相关图表包、进行图表的基础设置,创建图表对象、利用add()方法进行数据输入与图表设置(可以使用print_echarts_options()来输出所有可配置项)、利用render()方法来进行图表保存。 #### 预计可视化展示的结果以及数据故事的阐述 - 玫瑰饼图展示豆瓣评分前43位导演电影作品的总评分,进入豆瓣前250名的优秀电影,有的导演可能不止一部,我们可以观察总评分,借此反应各国导演对于中国观影群体的影响程度,借此研究哪种题材的电影在中国最具有市场。 ### 问题表述 ![图片出自](https://images.gitee.com/uploads/images/2020/0718/210204_8cb6407b_1648200.png "屏幕截图.png") - 随着新媒体行业的快速发展,类似于爱奇艺、哔哩哔哩、腾讯视频等视频平台已经发展及其成熟,影视作品的生产也不仅仅依托于传统的电视媒体。然而在这些平台上的影视作品虽多,但大多数都是年代较新的影片,对于比较久远的电影,或题材相对小众的影片版权的购买都比较小心谨慎,也使得诸多海外的优秀老片难见踪影。 - 其二就是中国引进国外电影受到广电总局的限制,每年都只有有限的配额,但是国内电影市场的增长却不断提高,如何在有限的条件下,引进优良的外国影片,吸引观众,增加平台用户粘性。 ### 解决方案表述 - ![输入图片说明](https://images.gitee.com/uploads/images/2020/0718/223323_537d25ca_1648200.png "屏幕截图.png") - 书影音一直都是豆瓣的核心竞争力,大家通过给书影音打分,写评论,做标记而聚集在一起。而在点评电影方面,豆瓣也一直是国内的权威媒体之一,通过研究豆瓣TOP250部电影,从其不同维度,来找到适合中国影迷的电影关键词,无论是视频平台引进电影,还是电影厂商寻找电影导演题材,都可参考此次研究报告结果。 #### 数据分析思路及方法 - 首先我要研究的内容是国内外导演对于中国市场观众的影响力,我通过计算豆瓣TOP250中所有电影导演的电影评分总分值,来产出玫瑰饼图。我运用pyecharts模块创建玫瑰饼图,就能够直观的看出国内外导演对于中国市场观众的影响力。 - 其次研究中国观众喜欢哪个国家的电影,我通过计算各个国家出产所有电影数量和地理信息,来产出交互地图。运用pyecharts模块创建MAP,就能够直观的看出中国观众喜欢哪个国家的电影。 #### 数据分析流程及成果 ![输入图片说明](https://images.gitee.com/uploads/images/2020/0718/215934_1c26462e_1648200.png "屏幕截图.png") - 国内外导演对于中国市场观众的影响力玫瑰饼图,需要用到的维度有:director:导演和avg_rating:豆瓣评分,通过分进合击,将这两个维度的数据从总表中拆分出来,并通过.agg()中"SUM"方法计算出该导演所有电影作品(豆瓣TOP250内)评分的总分值。从结果我们可以得知在豆瓣TOP250榜单中,在中国最具有影响力的导演为宫崎骏,总计七部作品上榜,总分62.7名列榜首,其次就是克里斯托佛·诺兰、史蒂文·斯皮尔伯格,以及中国导演王家卫、李安,还有大卫·芬奇六位导演属于第一阵列。 - ![输入图片说明](https://images.gitee.com/uploads/images/2020/0718/233242_a02120ee_1648200.png "屏幕截图.png") - 影片产地数量地图,需要用到的维度有country_region:发行国、title:电影名发行,通过分进合击,将这两个维度的数据从总表中拆分出来,并通过.agg()中"count"方法计算出该国家所有电影数量。从结果我们可以看出,美国电影依然是中国观众最喜欢的电影,其次是日本。 ### 学习/实践心得总结及感谢 - 多亏CSDN博客上的大佬分享自己的心得,以及容易出错的地方。在学习的过程中,首先意识到的问题就是python基础不是特别牢固,有很多操作,有想法,但是为了这个想法浪费了不少时间,其实操作很简单。在实际的操作中,很难脱离以前的练习文件来独立做出自己的东西。但是进步之处就是学会了如何设置pyecharts配置项 - 部分国内电影产业发展分析资料出自[2018年中国电影市场规模发展现状及2019年中国国产电影发展趋势分析](http://www.chyxx.com/industry/201910/799522.html)