![一图抵万言:从Excel数据到分析结果可视化](https://wfqqreader-1252317822.image.myqcloud.com/cover/786/36610786/b_36610786.jpg)
2.2 重新组织数据
大多数情况下,直接使用原始表格数据是绘制不出理想的图表的。另外,有些图表尽管可以使用原始数据直接绘图,但是,总觉得这样的图表缺少了点什么,似乎有一种想要说又说不出来的感觉。
大部分的图表需要把原始表格数据进行重新组织,以便能够用来绘图,这种数据的重新整理和组织,大多数情况下需要使用函数来提高效率。
例如,图2-9所示的表格是公司近年来的人数统计,现在需要用图表来分析这个表格。
![img](https://epubservercos.yuewen.com/343FE0/19429157701063906/epubprivate/OEBPS/Images/txt002_9.jpg?sign=1738903010-FVkUJ3iNP2CRFOSsiolPp4s7fJctETYO-0-821cccb993c18d9b2f4ac79eb9577213)
图2-9 公司近年来的人数统计
在画图之前,先要仔细阅读一下表格,想想要怎么表达这张表格。
由于是不同维度、不同类别的几年人数统计结果,这就意味着,需要在某个维度下,分析不同类别的人数变化情况。
例如,从年龄上看,35岁以下的人数是怎么变化的?是逐年减少,还是逐年增加?51岁以上的人数是逐年减少还是逐年增加?这种分析,有助于了解企业员工年龄分布及其逐年的变化趋势。
对于每个维度而言,其下的类别个数是不同的,年龄下有5个,性别下就只有2个,这样的分析,需要制作动态图表,选择不同的维度来分析不同类别的人数逐年变化。图2-10和图2-11所示就是一个分析例子。
![img](https://epubservercos.yuewen.com/343FE0/19429157701063906/epubprivate/OEBPS/Images/txt002_10.jpg?sign=1738903010-uUnFNEypgPYrTSZC7O0uNentERnvBhBt-0-ab254fceac50311d5f7be3a38f7f405c)
图2-10 分析指定维度下各个类别人数的逐年变化(1)
![img](https://epubservercos.yuewen.com/343FE0/19429157701063906/epubprivate/OEBPS/Images/txt002_11.jpg?sign=1738903010-Tg4tPKSTfyx3LpK0VoYCxQgofS9bnibw-0-f64c5b83bd1069a23bb7aa5ae00a108a)
图2-11 分析指定维度下各个类别人数的逐年变化(2)
这样的图表,需要设计辅助区域来完成,也就是要对原始表格数据重新整理,以便满足制作图表的要求,如图2-12所示。而要快速设计这样的数据区域,函数肯定是离不开的。
![img](https://epubservercos.yuewen.com/343FE0/19429157701063906/epubprivate/OEBPS/Images/txt002_12.jpg?sign=1738903010-tGMm5yFgaex6vm3o3NBcl39olffattaY-0-48f79fdc8a2dce7e498a412d4571b224)
图2-12 重新组织绘图数据
有时候,对数据做简单的处理,就会使图表变得更加信息突出,也更加引人注目。例如,图2-13所示的表格数据,很多人就直接使用柱形图。
![img](https://epubservercos.yuewen.com/343FE0/19429157701063906/epubprivate/OEBPS/Images/txt002_13.jpg?sign=1738903010-FPpyEDveMY4C4wmnJsGp17sBm31FP2ya-0-17023ef549969c25fc643b5ab30e0c5d)
图2-13 直接使用数据绘制的柱形图
先想想,这个表格数据的信息是什么?当然是各个分公司的业绩对比。那么,既然是业绩对比,这个柱形图就没有把这个对比表达出来,领导还需要睁大眼睛,从图中寻找哪个分公司最好,哪个分公司最差,这是这个图表的一个缺点。
通过简单的排序处理,就能让图表变得与众不同,如图2-14所示。
![img](https://epubservercos.yuewen.com/343FE0/19429157701063906/epubprivate/OEBPS/Images/txt002_14.jpg?sign=1738903010-3XdqewsjgzHdOglkkw78p2HP5C3qpyhb-0-9008c463c4d6284e838b020c3b0f9104)
图2-14 先排序再画图的分公司业绩对比分析图
这样的业绩排名,如果再做进一步的分析,例如设置一条平均线,把那些平均值以下的自动标为红色,平均值以上的自动标为蓝色,效果如图2-15所示,这样的图表就更能表达出你对数据的一种思考和特殊处理:哪些分公司业绩较好,哪些分公司业绩较差。
![img](https://epubservercos.yuewen.com/343FE0/19429157701063906/epubprivate/OEBPS/Images/txt002_15.jpg?sign=1738903010-Vz6cvh73PnNmAGVQYSkSMmnqnh1SQ9ka-0-e1b79fdf4ad0c34997e8edd1560307bc)
图2-15 自动标注均值以上和均值以下的柱形
而要绘制这样效果的图表,重新设计数据区域是不可少的,如图2-16所示。
![img](https://epubservercos.yuewen.com/343FE0/19429157701063906/epubprivate/OEBPS/Images/txt002_16.jpg?sign=1738903010-UF5uCGMvYOnBKUg6i7fifh83aj6bch5s-0-37cf5ad54d8817c50a28755f2c93b933)
图2-16 重新设计三列数据,使用函数进行处理