数据可视化,听起来高大上,实际上只不过是转换了表现形式,从文字变成了图表,只不过有的图表支持交互操作、有的图表只能静态展示。而数据可视化,简单的可以使用 Excel 实现,复杂的用 python 编程实现,但本质都是一样的,就是用生动直观的图形画面去表达枯燥的数字。
要做数据可视化,远比做数据分析简单很多,因为无需寻找数值变化背后的规律,只需将数值变化直观地表示出来。不过,虽然简单,但也不是随便一个人就能够胜任的。要做数据可视化,就必须知道都有哪些可视化方式。
比较常规的数据可视化,就是在统计学中大家都学过的折线图、柱状图和饼图,这里需要强调一下,二维表不算是数据可视化,因为二维表并不能直观地表现数值间的差异,而前面的几种都可以通过形状大小来展示数值变化。

而为了更好看,可以给条形图、柱状图和饼图,可以用上立体感等图案美化方式,而为了方便聚焦则可以加上交互功能,例如支持点击、放大和显隐等。总而言之,本质上就是一种更为好看的条形图、柱状图或饼图罢了。
有传统的图样,就有不传统的图样。在文本相关的数据可视化中,就有一种比较新颖的表现方式,称之为 WordCloud,这种数据统计图统计的是不同统计项在指定数据集中出现的次数,次数多的就用大字号表示,次数少的就用字号小的表示,如下面:

这种非传统的统计图例,Excel 并没有原生支持,而是通过一些插件或其他间接方式才能赋予能力,倒不如直接用 python 编程来得方便,因为 python 第三方软件包中就有一个专门用于生成词云的 WordCloud,而这个 WordCloud 可以根据参数设置生成不同形状的词云,远比用 Excel 制作的词云更加富有表现力。
除了词云外,随着大数据分析的兴起,近几年出现了不少新的统计图例,像雷达图、对比柱形图、聚合气泡图和漏斗图等等,而这些绘制方式不同的统计图例,都是一个从事数据可视化工作的人,必须知道也必须会绘制的,否则,光靠那些从课本上学到的很朴素的基础图例,是没办法在求职中脱颖而出的。

总而言之,数据可视化的要领,就是根据数据集的特性,选择好看又直观的统计图例去描述数据。