本书内容
本书第1章介绍了R的特点以及结构组成,R的获取、安装和启动,如何用网上的扩展包增强R基本安装的功能,R菜单操作,用户界面,如何以交互方式和批处理方式运行程序,R系统的文件管理。第2章介绍了R编程入门,包括数据集的建立以及各种操作方法等,同时讲解了向R中导入数据的诸多方法。这一章的前半部分介绍了如何用R来存储数据的数据结构,以及如何用键盘输入数据;后半部分介绍了怎样从文本文件、网页、电子表格、统计软件和数据库向R导入数据,涵盖了数据管理中函数(数学函数、统计函数、字符函数)以及常用运算符。第3章探讨了基本的数据管理,包括数据集的排序、合并、取子集,以及变量的转换、重编码和删除。第4章介绍了样本量和检验效能估计。第5章在第3章的基础上介绍了高级数据管理方法,涵盖了控制结构(循环、条件执行)的用法,然后介绍如何编写自己的R函数,以及如何用不同的方法整合数据。第6章概括地总结了定量资料基本统计分析方法的主要内容。从第7章开始逐个介绍了工作实践中常用的一些多元统计分析方法,内容包括各种多元统计分析方法的基本原理、计算方法、分析步骤、实例应用、R函数和使用方法,以及结果解释和结论分析等;介绍了针对一个数值型结果变量与一系列数值型预测变量间的关系进行建模的回归方法,并详细给出了拟合模型的方法、适用性评价和含义解释,包括t检验、方差分析、直线回归和相关、多元线性回归与相关、Logistic回归分析。第12章介绍了相对数的概念、率假设检验方法和R程序。第13章介绍了行×列表分析和交叉表。第14章探讨了非参数分析方法,包括配对及单样本秩和检验、两组样本比较的秩和检验、多组样本比较的秩和检验及两两比较、等级分组资料和随机区组设计资料比较的秩和检验及两两比较。第15章介绍了生存分析,主要涉及生存率的两种估计方法,乘积极限法和寿命表法,以及Cox模型。多元数据分析的一个难点是简化数据。后续章节介绍了如何将大量的相关变量转换成较少的不相关变量(主成分分析),以及如何发现一系列变量中的潜在结构(因子分析)。这些方法涉及许多步骤,每一步都有详细的介绍。第16~20章分别阐述了主成分分析、因子分析、聚类分析、判别分析和典型相关分析。从第21章开始探讨了R软件的拓展应用,包括ROC分析和统计图,所涉及的统计图包括条形图、饼图、散点图、折线图、箱线图、直方图、核密度图和点图。另外,本书每一章都给出了使用R软件进行数据分析的实例,以帮助读者理解和掌握各章的内容。