用作显示一组数据分散情况资料的统计图,因形状如箱子而得名。在各种领域也经常被使用,常见于品质管理。它主要用于反映原始数据分布的特征,还可以进行多组数据分布特征的比较。通过箱形图我们可以观察数据是否有偏向性、是否对称、数据是否有异常值、数据分布是否太过密集等。
“一千个读者就有一千个哈姆雷特。”这句话也同样适用于数据分析,不同的人对于数据也会有着不同的理解。数据可视化可以帮助我们以更简单的方式去分析数据和找到数据背后隐藏的信息。数据可视化涵盖的知识点非常多,我尝试结合使用哈伯曼的癌症生存数据,来看看数据可视化是如何帮助我们在一堆杂乱无章的数据中找到隐藏的信息的,让我们开始吧!