R语言数据分析项目精解:理论.方法.实战

综合评级:
★★★★★

定价:
¥53.10

作者:
罗荣锦

出版社:
电子工业

出版日期:
2017/08/01

页数:
16

ISBN:
9787121315732

书籍介绍

  适读人群 :科研机构和大数据工作从业人员

  《R 语言数据分析项目精解:理论、方法、实战》适合人群:

  互联网行业数据分析人员:通过阅读《R 语言数据分析项目精解:理论、方法、实战》,可以把学到的知识直接运用到生产实践中。

  互联网产品运营人员:通过阅读《R 语言数据分析项目精解:理论、方法、实战》,可以了解数据分析团队一般是如何支持产品运营人员的,以及数据分析团队能帮助产品运营人员干什么,产品运营人员将来可以更好地给数据分析团队提出分析需求。

  统计专业高校生:《R 语言数据分析项目精解:理论、方法、实战》可以作为行业实践案例教材,在学习书本知识的同时更好地了解实际情况,亲自动手进行实践,提高实战能力。

  其他行业数据分析人员:可以了解互联网行业是如何进行数据分析和模型开发的,相互交流和学习。

  致力于数据分析工作的爱好者:《R 语言数据分析项目精解:理论、方法、实战》可以作为数据分析从业人员相互交流、沟通的桥梁。

  R语言爱好者:R语言的应用渗透到生产实践的方方面面,《R 语言数据分析项目精解:理论、方法、实战》既讲解互联网电商实际项目,又是R语言交流的平台。

n

本书以互联网电商企业为背景,抽象出工作中常见的数据分析问题,利用 R 语言和统计学列出了详细的解决方案和过程。本书共 9 章,前两章分别为总论和 R 语言入门知识,之后各章分别介绍了运营指标的建立、指标监控系统、假设检验及 AB 测试、变量筛选技术、用户画像系统、寻找优质用户和文本挖掘等内容。本书涉及到的统计方法有:指标增长幅度量化方法、层次分析法、时间序列模型、基于正态分布的一元离群点检验、傅里叶谱分析、假设检验、主成分分析、因子分析、模糊聚类、无监督下连续型变量离散化、逻辑回归模型和文本挖掘等。另外,本书提供了所有实例的 R 语言实现代码,总计 33 个自定义函数和数千行代码。本书适合数据分析从业人员、产品运营人员、统计专业学生和 R 语言爱好者阅读。

【作者简介】

罗荣锦,应用统计学硕士、应用数学和国际经济与贸易双学士。有8年数据分析工作经验,先后从事过金融数据分析、网络游戏数据分析、B2B数据库营销以及互联网用户行为数据分析。现就职于携程旅行网担任资深数据分析师,主要从事用户行为分析研究、统计学与数据挖掘应用等工作,擅长统计建模,熟悉R语言、SAS、SPSS等数据挖掘工具。从事数据研究工作,一定要“耐得住寂寞,忍受得了孤独”。

目录

第 1 章 互联网+统计学+R 语言1

1.1 互联网中的统计学1

1.1.1 “互联网+”的发展1

1.1.2 统计学的发展2

1.1.3 大数据时代的统计学2

1.2 R 语言??互联网与统计学的桥梁3

1.3 本书结构 5

第 2 章 R 语言基础 7

2.1 安装 R 语言 7

2.1.1 获取和安装 R 语言 7

2.1.2 安装 RStudio 9

2.1.3 R 包 10

2.1.4 帮助12

2.2 R 语言基本对象12

2.2.1 数据类型12

2.2.2 向量12

2.2.3 矩阵和数组19

2.2.4 列表27

2.2.5 数据框29

2.2.6 因子32

2.2.7 数据类型的辨别和转换39

2.2.8 数据类型和对象关系 39

2.3 工作空间和查看对象 40

2.3.1 工作空间和工作目录 40

2.3.2 遍历、创建、删除文件夹 41

2.3.3 查看对象的方法 42

2.4 数据导入和导出43

2.4.1 数据导入43

2.4.2 数据导出49

2.5 操作符和函数51

2.5.1 操作符51

2.5.2 函数54

2.6 数据集操作59

2.6.1 变量操作60

2.6.2 数据集操作63

2.6.3 数据集连接67

2.6.4 数据汇总68

2.7 控制流71

2.7.1 重复和循环71

2.7.2 条件执行73

2.7.3 next 和 break 74

2.8 自定义函数75

第 3 章 互联网运营指标的建立77

3.1 项目背景、目标及方案78

3.1.1 项目背景78

3.1.2 项目目标78

3.1.3 项目方案78

3.2 项目技术理论简介78

3.2.1 骨灰级流量指标 78

3.2.2 登录和激活80

2.2.3 访问深度和吸引力 81

3.2.4 订单指标85

3.2.5 网站或 app 性能指标86

3.2.6 转化率87

3.2.7 层次分析法87

3.3 项目实践 92

3.3.1 搭建运营指标系统 92

3.3.2 制作对比型指标及趋势线 97

3.3.3 创建用户价值和活跃度指标 101

第 4 章 指标监控系统111

4.1 项目背景、目标及方案 111

4.1.1 项目背景111

4.1.2 项目目标111

4.1.3 项目方案112

4.2 项目技术理论简介112

4.2.1 时间序列基本统计量 112

4.2.2 数据观测与描述性统计 113

4.2.3 随机性115

4.2.4 周期性115

4.2.5 节假日模式识别 115

4.2.6 建模数据集的建立 118

4.2.7 指标监控方法(不含节假日)125

4.2.8 节假日指标监控方法 134

4.2.9 R 语言实例代码 135

4.3 项目实践 141

4.3.1 数据概览142

4.3.2 节假日模式识别 145

4.3.3 模型数据集的建立 155

4.3.4 指标监控(非节假日)160

4.3.5 节假日指标监控 176

4.3.6 总结181

第 5 章 用数据驱动业务??AB 测试 182

5.1 项目背景、目标和方案 182

5.1.1 项目背景182

5.1.2 项目目标183

5.1.3 项目方案183

5.2 项目技术理论简介183

5.2.1 自动化分流策略 183

5.2.2 整体评估指标185

5.2.3 概率论预备知识 186

5.2.4 假设检验191

5.2.5 三个问题197

5.3 项目实践 197

第 6 章 变量筛选技术204

6.1 项目背景、目标和方案 204

6.1.1 项目背景204

6.1.2 项目目标205

6.1.3 项目方案205

6.2 项目技术理论简介205

6.2.1 变量相关性206

6.2.2 变量筛选209

6.2.3 变量降维215

6.2.4 R 语言实例代码 225

6.3 项目实践 237

6.3.1 变量筛选238

6.3.2 变量降维243

第 7 章 构建用户画像系统 247

7.1 项目背景、目标和方案 247

7.1.1 项目背景247

7.1.2 项目目标248

7.1.3 项目方案248

7.2 项目技术理论简介248

7.2.1 用户画像的基本概念 248

7.2.2 用户画像应用领域 249

7.2.3 用户画像分类250

7.2.4 用户画像构建250

7.2.5 用户画像标签的数值处理方法 254

7.3 项目实践 256

第 8 章 从数据中寻找优质用户 261

8.1 项目背景、目标和方案 261

8.1.1 项目背景261

8.1.2 项目目标262

8.1.3 项目方案262

8.2 项目技术理论简介262

8.2.1 逻辑回归的基本概念 262

8.2.2 建模流程266

8.2.3 模型开发阶段269

8.2.4 模型验证阶段279

8.2.5 模型测试阶段285

8.2.6 商业应用流程288

8.2.7 R 语言实例代码 288

8.3 项目实践 295

8.3.1 数据探索295

8.3.2 数据处理297

8.3.3 建立模型302

8.3.4 模型验证304

8.3.5 总结308

第 9 章 文本挖掘??点评数据展示策略 309

9.1 项目背景、目标和方案 310

9.1.1 项目背景310

9.1.2 项目目标311

9.1.3 项目方案311

9.2 项目技术理论简介312

9.2.1 评论文本质量量化指标模型 312

9.2.2 用户相似度模型 313

9.2.3 情感性分析316

9.2.4 R 语言实例代码 321

9.3 项目实践 326

9.3.1 若干自定义函数 326

9.3.2 文本质量量化指标模型 329

9.3.3 用户相似度模型 334

9.3.4 情感性分析335

9.3.5 总结340

课课家教育

未登录