excel学习库

excel表格_excel函数公式大全_execl从入门到精通

数据可视化

1、数据可视化概述

1.1、数据可视化的作用

数据可视化是指将数据通过图表的方式传递出来,让用户能够快速、准确地理解所要表达的信息,从而提高沟通效率

传递更多的信息

形象生动,便于理解

随着大数据行业的发展,用户对数据可视化的要求越来越高,好的可视化能力能够使用户更快的理解所要表达的内容,更加形象生动。所谓“字不如表,表不如图”,图表的重要性可见一斑,在统计分析产品、用户画像等数据产品上,都需要具备优秀的数据可视化能力。现在常见的如“一图看懂XXX”等,都是用图表来传递信息,是典型的数据可视化成果。

1.2、图表的分类

根据各类图表的功能作用,用户可以选择不同的图表来准确、恰当的传递信息。常见的图表使用指南如下图(来自网络),基本罗列出了结合具体需求你可以用到图表。

结合笔者自身数据可视化的经验,笔者会根据图表的功能来对其进行分类,但是分类结果跟上图有一定差别。按照图表表达的功能,主要可以分为五类图表:

1)趋势类图表:

2)对比类图表:

3)构成类图表:

4)分布类图表:

5)地图类图表

组合图表是现实中使用得更多的

1.3、常用图表

如上所述,图表主要分为五类,常用的图表包括柱状图、折线图、饼图、散点图、雷达图等,以下为一些常见的图表。

1.3.1、柱状图

柱状图中还包括与其类似的条形图、瀑布图、直方图等,主要是为了反映事物的变化趋势、分布情况、规模情况等。

柱状图可以按照时间绘制,反映事物变化趋势,如某个指标最近一年变化趋势,也可以按照其它维度绘制,如区域、机型、版本等,反映事物的分布情况。

条形图是将柱状图垂直放置,整体跟柱状图差不多,但是换了一个视角。

瀑布图能够反映事物从开始到结束经历了什么过程,用于分解问题原因或事物构成因素特别好用,如上月收入是怎么变成本月收入的,就可以通过瀑布图分解每一个收入组成部分所做的贡献,找出哪一组成部分提升了收入,哪一组成部分降低了收入(excel2016版新增瀑布图,当然也可以通过自己构造数据绘制瀑布图)。

直方图反映事物的分布情况,可以看出事物主要集中在哪里,如查看付费用户付费金额分布等。

1.3.2、折线图

折线图是点和线连在一起的图表,可以反映事物发展趋势和分布情况,与柱状图相比,更适合代表增幅、增长值,而不太适合代表绝对值。

面积图就是在折线图下加上阴影面积,也主要是为了反映事物发展趋势和分布情况。

1.3.3、饼图

饼图是将一个圆饼分为几份,用来反映事物的构成情况,类似图表还包括环图、旭日图等。旭日图有多个圆环,可以直观的显示事物组成部分下一层次的构成情况,比如某个省分为几个市,每个市下面又有几个县、每个县下面又有几个镇,就是将事物层层分解(excel2016版新增旭日图,感觉很实用)。

1.3.4、散点图

散点图是事物两个维度的交叉分布情况,反映不同维度间的关系,如不同产品在市场占有率、预期增长率两个维度间的分布情况,很多二维矩阵就是通过散点图来实现的,以两个维度的平均值作为分割线,如常见的波士顿矩阵。通过散点图我们可以看出不同事物间是怎么交叉分布的,它们之间有什么关系,是正相关、负相关或随机分布。

类似的图表还有气泡图,气泡图还可以通过气泡面积的大小表示值的大小,相对于散点图来说多了一个维度,如前面不同产品的例子,气泡的大小可以代表各产品营收的多少。

1.3.5、雷达图

雷达图主要表达事物在各个维度上的分布情况,从而可以看出事物在什么地方强、什么地方弱。比如一个学生各个学科的得分,就可以通过雷达图清晰表达出来,用户能够一眼看出这个学生哪一科强、哪一科弱,又如一个产品在各个评价维度上的评分。

1.3.6、地图

地图可以形象的反映事物在地理上的分布情况以及人员迁徙情况,主要包括地理分布图(全球、全国、各省市等)、迁徙图、热力地图(省市、街道等)等。全国、各省市地图可以通过SAS、R、Python等实现,后面的迁徙图可以通过Echart实现,或通过Remap包调用。

1.3.7、树状图

树状图主要是为了反映事物的构成情况,相对于饼图的优点是,树状图可以更清晰的显示更多组成部分,比如饼图可能组成部分多于8个就显得很挤,而且占比小的就很不清晰,但是树状图却不会,它能够充分利用区域面积(excel2016版新增树状图,当然也可以通过echart实现)。

1.3.8、漏斗图

漏斗图主要用来反映关键流程各个环节转化情况,让用户能够一眼看清整个流程转化情况,如常见的电商购物转化流程,从浏览商品-添加进购物车-生成订单-支付订单-交易完成等一连串购买流程。下面是手游的转化漏斗图,通过分析各个步骤的转化率,能够发现问题所在,找准改进方向。

1.3.9、词云图

词云图是为了描述事物的主要特征,如一个人主要特征是什么,高、帅、富,或者其它,能够让人一眼看出一个事物的主要特征,越明显的特征越要突出显示。同时,还有象形的词云图,如轮廓是一个人、一只鸟等,用以反映事物主题,从而更加形象生动。词云可以通过Python、R实现,最好使用一些在线词云工具,简单方便,如tagxedo、tagul等。

1.3.10、热力图

热力图主要是反映地理、点击热力分布情况,从而看出哪里是人群最多的地方、哪里是用户点击最多的地方等,可以反映用户出行习惯、使用习惯等。

1.3.11、组合图表

绝大多数图表都不是单独存在的,都是多类型的图表组合在一起的,这样才能够传递更多的信息,提供综合的视角。如我们想看到不同事物间的对比,则我们可以使用双柱图、双折线图、双雷达图、双环图等,可以清晰表达不同事物在不同维度上的对比情况。

如果我们想表达事物的绝对值和增长率,则我们可以使用柱状图、折线图的组合图形, 如果我们想要表达某个事物的构成,不能看到不同维度间的对比,则可以使用堆积柱状图。

有时候我们不想自己的图表只是单调柱图,可能想更生动些,这时就可以用到象形图,图表内容不再是单调的柱图,而是其它图形。excel里面也能实现象形图,先准备好想要的图形,然后点击柱状图中的柱,然后复制,这样图形就会复制到柱状图中,柱子用其它图形替代掉了,但是这时会发现图形被拉升的变形了,这时需要设置填充,选择“层叠”,然后象形图就好了。

1.3.12、其它图表

当然除了这些场景图表外,还有股价图、曲面图、箱形图、桑基图、仪表盘、象形图(用形象的图形来表示多少,excel也可以做)等。

1.4、新颖图表

以下为一些比较新颖的图表。

1.5、图表配色

突出主题让人看着舒服

图表配色的原则主要有:

图表配色不能太花

图表配色要重点突出

2、数据可视化工具

Excel、SAS、Python、R、Echart

2.1、Excel

Excel应该是使用最广泛的可视化工具,包含基本所有常用的图表,新版Excel里面有地图、旭日图、瀑布图等,同时,可以搭配Power BI使用,后者是一个“托拉拽”式的数据可视化工具。

2.2、SAS

SAS系统中通过SAS Graph模块实现,图表可视化的过程步有proc plot、proc chart、proc gplot、proc gchart、proc sgplot、proc gmap。其中,proc sgplot是很强大的综合数据可视化过程,基本能够绘制所有的基本图表,proc sgplot主要用于绘制地图。

2.3、Python

Python里面能够支持数据可视化的第三方包有很多,笔者主要使用matplotlib,它基本能够绘制所有的基本图表。另外,wordcloud包可以用来绘制词云,pyHeatMap包可以用户绘制热力图。

2.4、R

Python里面能够支持数据可视化的第三方包也有很多,笔者主要使用ggplot、ggplot2,这两个包基本能够绘制所有的基本图表。另外,wordcloud包可以用来绘制词云,Remap包可以用来调用Echart绘制迁徙图、热力图等。

2.5、Echart

Echart中的图表丰富多样,都有相应的js代码,通过修修改改就可以画出自己想要的图表,还开发了一些Python、R接口,可以通过第三方包调用部分图表。

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

«    2024年12月    »
1
2345678
9101112131415
16171819202122
23242526272829
3031
控制面板
您好,欢迎到访网站!
  查看权限
网站分类
搜索
最新留言
    文章归档
      友情链接