前言
非参数统计是21世纪统计理论的三大发展方向之一。标准的参数方法强烈地依赖于对数据分布的假设,而非参数统计对模型要求甚少,不假定特定的总体分布,因此更加简单、稳健和适用。随着计算工具的发展,非参数统计模型在许多领域中应用更加广泛。非参数统计不仅是统计类学科的必修课,也是统计应用工作者必须掌握的基本方法和思想。
非参数统计以概率统计这门数学学科为基础,运用了很多现代统计思想和原理,因此它的原理涉及秩统计量的渐近正态、稳定性等复杂的统计学问题,较为抽象,对学生的数学基础要求较高,教学中存在的大量的公式推导、演算,必须借助现代化的计算工具,本书正是基于广泛使用的统计分析软件——R语言进行的。
R语言是GNU系统的一个自由、免费、源代码开放且功能强大的软件,是一个用于统计计算和统计制图的优秀工具,因此开发和使用R语言对我国统计事业的发展大有裨益。笔者根据十多年的教学经验认为,初学者只要了解总体和样本、随机变量及分布、统计量、检验和估计等统计学的最基本的内容,即可看懂本书。本书的重点不在于对公式的推导和演算上,而是在对非参数思想的理解和对实例的应用以及如何读懂结果和评价结果上。一旦掌握了R语言在非参数统计研究中的运用,就会有一种游刃有余的感觉。
本书从问题背景与动机、方法引进、理论基础、计算机R语言实现以及应用实例等诸多方面来介绍非参数方法,其内容包括:基于秩检验的符号检验、Wilcoxon检验、Kendall相关、列联表、Kolmogorov-Smirnov检验、非参数密度估计和回归等。本书在强调实用性的同时,也突出了应用方法与理论相结合。
本书可以作为非参数统计的教科书,同时笔者也希望本书能够成为查询非参数统计中最有用方法的快捷参考书,读者可通过本书了解如何使用最常用的非参数方法,并从中找到清晰的说明。
本书有以下几个特色和创新点:
(1)按问题的背景与动机、原理方法、假定条件、假设、检验统计量、实例分析以及计算机实现这样的顺序来编写,使内容显得条理清晰,适用易懂,便于学生了解该方法的直观意义以及来龙去脉、适用于哪类问题以及如何去解决该类问题。选用的案例具有时代性。
(2)每章都会通过R语言结合具体案例进行统计分析,并且有一定的习题,重要的习题都有相应的解答。
(3)图文并茂,利用R语言可以绘制出高质量的图形,一图胜过千言万语。
(4)本书可以作为非参数统计的实习实践教材,所有的计算结果都是由R语言计算出来的,十分值得信赖。
(5)注重处理那些条件少、数据非正态和总体分布未知的模型,突出非参数的稳定性和效率高的特点。
(6)非参数统计是一门统计科学,同时也是一门技术,只要有一般的数学和统计学基础,只要知道总体和样本、随机变量及分布、统计量、检验和估计等统计学的最基本的内容,学好它就非常容易。
(7)本书不提供任何统计分布表,希望读者能够使用计算机和R语言进行统计分析。强调动手能力和计算机支持,实际上,如果没有计算机支持,很难对一定规模的数据在任何统计方向进行深入的分析。
本书共有7章,讲授60个学时较为合适和有效,建议每周3个学时(其中1个学时为上机实验)。本书的内容是在吸收国内外关于非参数统计的论著的基础上,根据在暨南大学十几年的教学过程中所撰写的讲义修改而成的。笔者还在最后章节尝试阐述了如何应用非参数的方法(包括非参数密度估计和回归、Kolmogorov-Smirnov检验、中位数回归等)写作本科毕业论文。感谢暨南大学经济学院统计学系的韩兆洲教授、刘建平教授、郑少智教授、王斌会教授、尹居良教授、陈平炎教授以及郭海华副教授和陈光慧副教授的大力支持。感谢陈天然、胡小娟、杨飞、钟聂等研究生全程参与了本书的编著工作,也要感谢统计学系的历届学生,特别是王文静、王琦、王思丹、范洋洋等同学,他们的参与使笔者在教学中对设计的内容越来越有体会,享受到了极大的乐趣。
由于笔者的知识和水平有限,书中难免有错误和不足之处,恳请读者批评指正!
柳向东
2014年9月于暨南大学经济学院统计学系