你遇到过这种情况吗?工作中迫切需要使用R,但是对编程却了解的不多?不要害怕!这正是一本指导你如何将R用于统计和数据分析的简明读本。书中贯穿了许多现实生活中的例子以及循序渐进的练习,你可以学习到如何改造和操作数据、进行计算、实现可视化以及其他更多技能。
主要特色
R入门――获取和安装R,了解R的特性,比较不同的代码编辑器,并写出你的第1个R脚本。
关联其他软件――学习R是如何与Excel以及其他程序交互的,并了解为何R受到统计学家和数据分析人员的青睐。
R基础知识――使你的代码更简洁,并探索R的函数和参数。
计算方法――充分利用R的计算功能来处理数值、无穷数、缺失值、数学函数以及向量。
获取文本――使用特征向量创建并处理文本数据,并学习处理字符串和因子的方法。
探索数据的秘密――使用子集处理数据,运用不同方法合并数据,并用统计分析方法来分析数据。
绘图――借助散点图和点阵图实现数据可视化。
本书特别给出了20条有用的建议,包括如何用 R语言来做本可以使用微软 Excel来做的 10件事,以及10条关于使用非基础 R程序包的建议。
R是一个开源、跨平台的编程语言,用于统计计算和绘图,特别是其社区开发的数以千计的扩展包为R增加了强大的和前瞻性的功能。数据分析与挖掘已经成为大数据时代重要的技能之一,而 R已经成为数据分析领域炙手可热的标志性语言。
本书作为业内外一致好评的 Dummies系列书籍之一,是供 R语言初学者学习的经典力作。本书通俗易懂地讲解了如何利用 R语言基本知识,包括创建、运行以及调试 R脚本,用户自定义 R函数,用 R绘制基本图形, R的循环语句和逻辑控制语句等,逐步引导读者迈入 R语言高手行列。
本书适用于数据分析人员以及对 R语言感兴趣的读者。
Andrie de Vries是RevolutioAnalytics公司的首席R专家和商业服务总监,有超过20年的R使用经验,为客户提供关于R的咨询和培训服务。Joris Meys是一位统计学家、R程序员和R讲师,就职于根特大学生物工程学院。
李毅,韩国岭南大学理学博士,现为山西财经大学统计学院副教授,硕士生导师。研究方向为应用统计,主持国家自然基金、国家统计局重点课题等多项。发表学术论文20余篇,其中被SCI收录10余篇。
第一部分 R语言编程入门 1
第1章 R语言简介:全景图 3
认识到使用R语言的优势 5
免费、开源代码 5
可以在任何环境下运行 5
R语言支持扩展 5
拥有活跃的社区 5
和其他语言的连接 6
R语言的独特之处 7
向量的多项计算 7
不仅仅是统计分析 8
无需编辑直接运行 8
第2章 探索R 9
使用代码编辑器 10
探索RGui 11
用RStudio优化 13
开始**个R会话 15
向世界说你好 15
使用向量 15
存储和计算值 16
回馈用户 18
启动一个脚本 18
响应你的工作 20
导航环境 21
操纵环境中的内容 21
保存你的工作 21
检索你的工作 22
第3章 R基础知识 23
充分利用函数的强大功能 23
向量函数 24
函数参数调用 25
创建历史记录 27
保持代码的可读性 27
遵循命名规则 28
组织代码 30
添加注释 32
R基础功能的扩展 32
查找扩展包 32
安装扩展包 33
加载和卸载扩展包 33
第二部分 开始使用R 35
第4章 算术入门 37
数值、无穷值与缺失值 37
基础运算的操作 38
使用数学函数 40
计算整个向量 43
无穷及其以后 43
使用向量组织数据 45
探索向量属性 45
创建向量 48
向量连接 48
重复向量 49
向量值的存取 49
理解R的索引 50
从向量中提取数值 50
修改向量的值 51
使用逻辑向量 52
值的比较 53
将逻辑向量作为索引 54
逻辑表达式的组合 55
逻辑向量小结 56
增强数学运算 56
使用向量的数学运算 57
参数循环 59
第5章 开始读和写 61
对文本数据使用字符向量 61
为字符向量赋值 62
创建包含多个元素的字符向量 62
获取向量的子集 63
为向量中的值命名 64
文本操作 66
字符串理论:组合和分割字符串 66
文本排序 69
查找文本中包含的内容 70
文本替换 72
使用正则表达式 73
使用因子进行分类 76
创建因子 76
转换因子 77
关注水平 79
区分数据类型 80
使用有序因子 81
第6章 使用R处理时间数据 83
处理日期 83
用不同的格式表示日期 85
添加时间 86
日期和时间的格式 88
操作日期与时间 88
加法和减法 89
日期的比较 89
提取 90
第7章 高维数据的处理 93
添加第二个维度 93
探索新维度 94
将向量组合成矩阵 97
使用索引 98
提取矩阵元素的值 98
降低维度 100
修改矩阵中的值 100
为矩阵行列命名 101
修改行和列的名称 102
将名称作为索引 103
矩阵的计算 103
矩阵的基本运算 103
行列求和 105
矩阵运算 105
添加更多维度 107
创建数组 107
使用维度来提取数据 108
在数据框组合不同类型的值 109
由矩阵创建数据框 109
从零开始创建数据框 111
命名变量和规则 112
操纵数据框中的值 113
提取变量、观察值和元素值 114
向数据框添加观测值 115
向数据框添加变量 117
将不同类型的对象组合到列表中 118
创建列表 119
提取列表中的元素 120
修改列表中的元素 122
理解列表的str()输出结果 124
透过树木看到森林 125
第三部分 编写R代码 127
第8章 探索函数的乐趣 129
从脚本到函数 129
编写脚本 130
转换脚本 130
使用函数 131
简化代码 133
巧妙地使用参数 134
添加更多的参数 135
点参数的魔力 136
将函数作为参数 137
处理作用域 140
穿越边界 140
方法分配 142
隐藏函数背后的方法 142
实现自己的通用函数 144
第9章 控制逻辑流 146
使用“if”语句做出判断选择 147
用“if...else”语句实现另一种选择 149
判断选择的向量化 150
查看问题 150
基于逻辑向量进行判断 151
多种选择 152
嵌套“if ... else ”语句 153
用switch处理多种选择 154
循环遍历 155
构造一个“for”循环 155
通过“for”循环来进行计算 156
无循环的循环:认识“Apply”家族函数 158
“apply”函数的家族特征 159
认识“apply”家族中的三个成员 159
针对行和列使用apply函数 160
将函数应用于与列表类似的对象上 162
第10章 调试代码 165
知道要查找什么 165
阅读错误信息和警告信息 166
阅读错误信息 166
注意警告信息(或者不) 167
查找漏洞 169
logit计算 169
了解错误的来源 169
查找函数内部 170
自定义消息 174
创建错误 174
创建警告 175
一些常见的错误 175
从错误的数据开始 176
格式错误的数据 176
第11章 取得帮助 180
在R帮助文档中查找信息 180
当我们明确地知道到底查找什么时 180
当我们不知道到底要查找什么时 181
在互联网上查找R帮助文档 182
加入R社区 184
在Stack Overflow和Stack Exchange讨论R 184
使用R邮件列表 184
在Twitter讨论R 185
实现*小可复现示例 185
用随机数创建样本数据 186
精简代码 187
提供必要的信息 187
第四部分 让数据说话 189
第12章 导入和导出数据 191
导入数据到R中 191
在R文本编辑器中录入数据 192
使用剪贴板复制和粘贴 193
从CSV文件中读取数据 195
从Excel中读取数据 198
处理其他数据类型 200
R中导出数据 201
使用文件和文件夹 202
了解工作目录 202
文件操作 204
第13章 操作和处理数据 207
确定*合适的数据结构 207
创建数据子集 208
理解三种子集运算符 209
理解取子集的五种方式 209
提取数据框子集 210
在数据中添加计算域 214
数据框的列运算 214
使用with和within提高代码的可读性 215
对数据进行分组 216
组合与合并数据集 217
创建示例数据 218
使用“merge()”函数 220
使用查询表 221
数据排序 223
对向量进行排序 224
对数据框进行排序 224
使用“apply”函数遍历数据 227
使用“apply()”函数汇总数组 228
使用“lapply()”和“sapply()”来遍历列表或数据框 229
使用“tapply()”创建表格汇总数据 230
了解公式接口 232
规范数据的格式 234
理解数据的长格式和宽格式 234
初识reshape2包 235
将数据转换为长格式 236
将数据重塑宽格式 237
第14章 数据汇总 240
从正确的数据开始 241
使用因子或数值 241
**值计数 242
准备数据 242
描述连续变量 243
讨论数据的中心 243
描述变异性 244
计算分位数 244
描述分类 245
计数 246
计算比例 246
查找中心 247
描述分布 248
绘制直方图 248
使用频率和密度 249
描述多元变量 251
完整数据集的汇总 251
绘制子集的分位数 252
记录相关性 254
使用表格 257
创建双向表 257
将表格转换为数据框 258
边际与比例 259
第15章 差异与关联检验 261
仔细研究分布 262
观察海狸 262
正态分布的图形检验 262
使用分位图 263
使用公式法检验正态性 265
比较两个样本 267
差异检验 267
比较成对数据 269
检验频数和比例 270
检验比例 270
表格分析 271
提取检验结果 273
使用模型 273
方差分析 274
计算差异 276
线性关系建模 278
线性模型评估 280
预测新值 282
第五部分 绘制图形 285
第16章 使用基本图型 287
创建不同类型的数据图 287
数据图概览 287
向数据图添加点和线 288
各种类型的数据图 292
控制数据图选项和参数 294
添加标题和坐标轴标签 294
修改数据图选项 295
在单页中绘制多个数据图 298
将数据图保存成图片文件 299
第17章 使用lattice绘制切片图 301
创建lattice数据图 302
加载lattice包 303
制作lattice散点图 303
添加趋势线 304
修改数据图的选项 306
添加标题和标签 306
修改标题和标签的字号 307
使用主题修改数据图选项 308
绘制不同类型的数据图 309
绘制柱状图 309
绘制箱型图 310
绘制分组数据 311
使用高格式数据 311
绘制分组数据 313
添加图例 313
输出和保存lattice数据图 314
将lattice图赋予一个对象 315
在脚本中输出lattice数据图 315
将lattice数据图保存成文件 315
第18章 学习ggplot2制图 317
安装并加载ggplot2 317
认识层 318
使用geom和stat 319
定义数据 319
从数据映射到可视元素 320
获得geom 321
了解stat 324
添加切片、标尺和选项 326
添加切片 326
修改选项 327
获取更多信息 329
第六部分 20条有用建议 331
第19章 10种用R不用Excel的情况 333
添加行和列的总和 333
格式化数据 334
数据排序 336
使用if进行选择 336
计算条件总和 337
列或行转置 337
查找**或重复值 338
使用检索表 339
利用数据透视表 339
使用单变量求解 340
第20章 关于程序包的10个技巧 343
探索CRAN 343
寻找有趣的程序包 344
安装程序包 344
加载程序包 345
阅读程序包的手册和文档 345
更新程序包 346
使用R-Forge 347
从github获取程序包 347
从Bioconductor进行安装 348
阅读R手册 348
附录A 安装R和RStudio 349
附录B rfordummies包 355
译后记 357
¥699.00
¥50.00
¥9.00
¥199.00
¥99.00