上QQ阅读APP看书,第一时间看更新
6.3 茎叶图
茎叶图是用于展示定量数据的一种图,用于将分布的密度和形状进行可视化处理。这种图的一个显著特征是保留原始数据至少两位以上,并将数据按顺序排列。一个基本的茎叶图是用一条竖线分开两列,左边一列包含茎,右边一列包含叶。通常叶这一列包含数据的最后一位数字,而茎列包含其他位数字。对于非常大的数字,要将数据的值四舍五入到固定的小数位(比如,小数点后两位),将小数位放在叶这一列里,把整数位放在茎列。茎叶图在发现异常值和找出数据规律方面也很有效。这个方法尤其适用于中等规模的EDA数据集合(大约250个数据点),逆时针旋转90°,茎叶图就变成了直方图,星形符号(*)代表叶列的数位。