高等学校大数据技术与应用规划教材:R语言数据分析与挖掘 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
高等学校大数据技术与应用规划教材:R语言数据分析与挖掘电子书下载地址
- 文件名
- [epub 下载] 高等学校大数据技术与应用规划教材:R语言数据分析与挖掘 epub格式电子书
- [azw3 下载] 高等学校大数据技术与应用规划教材:R语言数据分析与挖掘 azw3格式电子书
- [pdf 下载] 高等学校大数据技术与应用规划教材:R语言数据分析与挖掘 pdf格式电子书
- [txt 下载] 高等学校大数据技术与应用规划教材:R语言数据分析与挖掘 txt格式电子书
- [mobi 下载] 高等学校大数据技术与应用规划教材:R语言数据分析与挖掘 mobi格式电子书
- [word 下载] 高等学校大数据技术与应用规划教材:R语言数据分析与挖掘 word格式电子书
- [kindle 下载] 高等学校大数据技术与应用规划教材:R语言数据分析与挖掘 kindle格式电子书
寄语:
R语言数据分析与挖掘
内容简介:
本书从R语言的使用出发,在重点介绍R语言编程基础、操作、可视化、统计、高性能计算和机器学习的同时,注重实践能力的培养和数据分析与挖掘素质的全面提高。本书分为统计分析基础和机器学习实践两部分,共12章,内容包括R语言概述、数据访问、数据操作、数据可视化、概率与分布、基本统计分析、回归分析、方差分析、大数据高性能计算、机器学习流程、有监督学习模型、无监督学习模型。本书的重点是让学生了解R语言数据分析与挖掘的基本技能和操作方法,并与数据分析与挖掘的典型方法、算法和应用场景结合。本书内容丰富、体系新颖、结构合理、文字精练,适合作为普通高等院校信息类、管理类和数学统计类专业的R语言数据分析与挖掘课程的教材,也可作为数据科学行业相关从业人员的自学用书。
书籍目录:
部分
统计分析基础
第1章
概述1
1.1 为什么使用R语言2
1.2 R的安装 3
1.3 RStudio集成环境 4
1.4 R的基础操作 4
1.5包 9
1.6 结果的重用性 10
1.7 综合示例 11
1.8 大数据处理 11
1.9 数据挖掘 13
小结 16
习题 16
第2章
数据访问 17
2.1数据集合 17
2.2数据结构 18
2.3数据的输入 27
2.4数据的输出 35
2.5数据集的标注 36
2.6处理数据对象的实用函数36
小结 37
习题 37
第3章
数据操作 39
3.1一个示例 39
3.2创建新变量 41
3.3变量的重编码 42
3.4变量的重命名 43
3.5缺失值 44
3.6日期型数据 46
3.7类型转换 48
3.8数据排序 49
3.9数据集的合并 49
3.10数据集取子集 50
3.11使用SQL 语句操作数据框53
3.12一个数据处理难题 53
3.13数值和字符处理函数 54
3.14数据处理难题的一套解决方案61
3.15控制语句 66
3.16自定义函数 68
3.17重构与整合 70
小结 73
习题 73
第4章
数据可视化 75
4.1创建图形 75
4.2简单示例 77
4.3图形参数 78
4.4添加文本、自定义坐标轴和图例83
4.5图形的组合 89
4.6条形图 93
4.7饼图 97
4.8直方图 99
4.9核密度图 100
4.10点图 105
4.11 ggplot2包 107
小结 116
习题 116
第5章
概率与分布 117
5.1随机抽样 117
5.2概率分布 118
5.3R的概率分布 122
5.4常用分布的概率函数图124
5.5中心极限定理及应用 127
小结 132
习题 132
第6章
基本统计分析 133
6.1描述性统计分析 133
6.2频数表和列联表 139
6.3相关系数 148
6.4检验 152
6.5组间差异的非参数检验154
小结 157
习题 157
第7章
回归分析 159
7.1概论 160
7.2 OLS 回归 161
7.3回归诊断 170
7.4异常观测值 179
7.5改进方法 182
7.6选择“”的回归模型184
7.7深度分析 188
小结 192
习题 192
第8章
方差分析 195
8.1 基本概念 195
8.2 ANOVA 模型拟合 196
8.3 单因素方差分析 198
8.4单因素协方差分析 202
8.5双因素方差分析 206
8.6重复测量方差分析 208
8.7多元方差分析 210
8.8回归实现ANOVA 214
小结 216
习题 216
第二部分
机器学习实践
第9章
大数据高性能计算 218
9.1数据选择 219
9.2数据聚合 223
9.3数据引用 225
9.4键与快速筛选 228
9.5数据连接 231
9.6数据变形 236
小结 238
习题 238
第10章
机器学习流程 239
10.1数据探索 240
10.2数据划分 241
10.3数据填充 242
10.4特征选择 246
10.5建模与调优 251
10.6测试与评估 257
小结 260
习题 260
第11章
有监督学习模型 261
11.1线性回归模型 263
11.2逻辑回归模型 269
11.3线性判别分析模型 275
11.4朴素贝叶斯模型 275
11.5k近邻模型 275
11.6决策树模型 284
11.7随机森林模型 299
11.8神经网络模型 309
11.9支持向量机模型 319
小结 330
习题 330
第12章
无监督学习模型 331
12.1 k均值聚类模型 333
12.2 DBSCAN聚类模型 341
12.3 AGNES层次聚类模型 346
12.4关联分析模型 351
小结 357
习题 357
参考文献 358
作者介绍:
杜宾,男,教授,就职于江西财经大学。管理科学与工程专业博士,1971年10月出生,江西吉安人。主要从事信息系统、机器学习、管理决策、数据分析等领域的研究,主讲课程包括R语言数据分析基础、计算机应用技术、运营管理等。钱亮宏,男,毕业于上海交通大学电子信息与电气工程学院,1989年8月出生,拥有10年R语言使用经验,一直奋战在数据分析与挖掘领域的线,作为金融和互联网行业资深数据挖掘专家。黄勃:博士,讲师,2014年12月武汉大学博士毕业入职上海工程技术大学,主讲了8门本科课程。研究方向为软件工程,机器学习,人工智能。发表学术论文30多篇,其中SCI,EI、ISTP三大检索20篇;获发明专利和软件著作权5项,省部级科技进步奖2项;2016年获批国家自然科学基金一项。高永彬:博士、讲师,就职于上海工程技术大学,博士毕业于韩国全北国立大学,在模式识别、机器学习领域积累了大量的研究与实战经验。特别地,在基于深度学习技术的人脸识别以及车型检测技术进行了深入地研究,发表了近30篇期刊/会议论文,取得了丰厚的研究成果,发表在包括Information Sciences, Pattern Recognition Letters等高水平期刊中,其中SCI收录5篇,EI收录4篇。
出版社信息:
暂无出版社相关信息,正在全力查找中!
书籍摘录:
暂无相关书籍摘录,正在全力查找中!
在线阅读/听书/购买/PDF下载地址:
原文赏析:
暂无原文赏析,正在全力查找中!
其它内容:
编辑推荐
本书适合应用型本数据科学与大数据教学的R语言核心课,内容安排合理,适合零基础要求,理论与案例相结合。
前言
随着信息技术的普及和应用,各行各业产生了大量的数据,人们持续不断地探索处理这些数据的方法,以期大
限度地从中挖掘有用信息。面对如潮水般不断增加的数据,人们不再满足于数据的查询和统计分析,而是期望从数据中提取信息或者知识为决策服务。数据挖掘技术突破数据分析技术的种种局限,结合统计学、数据库、机器学习等技术解决从数据中发现新的信息并辅助决策这一难题,是正在飞速发展的前沿学科。近年来,随着*“新工科”建设的不断推进,大数据技术受到广泛的关注,数据挖掘作为大数据技术的重要实现手段,能够挖掘数据的关联规则、实现数据的分类、聚类、异常检测和时间序列分析等,解决商务管理、生产控制、市场分析、工程设计和科学探索等各行各业中的数据分析与信息挖掘问题。
R语言是一种通用的统计计算和数据可视化开源软件环境和编程语言,具有高度可扩展性。R语言同时支持Linux、Windows和Mac操作系统。R语言的前身为贝尔实验室研发的S语言。1992年由新西兰奥克兰大学的Ross Ihaka和Robert Gentleman创建,并以他们的名字首字母作为项目名称。2007年Revolution Analytics公司成立,对R语言做商用支持,2015年1月被Microsoft收购。
1997年,R语言正式开源,吸引了世界范围内各行业的代码贡献者,实现各种各样的数据分析方法。截至2018年11月,CRAN(the Comprehensive R Archive Network)官方收录了13 328个算法库,常用的包括:
数据加载:RODBC、RMySQL、RSQLite、XLConnect、xlsx、foreign;
数据处理:dplyr、tidyr、stringr、lubridate;
数据可视化:ggplot2、ggvis、rgl、htmlwidgets、googleVis;
数据建模:car、mgcv、nlme、randomForest、multcomp、glmnet、survival、caret、mlr;
数据报告:shiny、xtable;
空间数据:sp、maptools、maps、ggmap;
时间序列和金融数据:zoo、xts、quantmod;
高性能计算:Rcpp、data.table、parallel;
网页数据:XML、jsonlite、httr。
截至本书出版,共有283所高校获批“数据科学与大数据技术”专业,其中985及211高校占比达13%。目前,国内数据人才缺口更是达到百万级。由于其开源性、易用性和强大的数据分析能力,R语言已成为世界范围内应用广泛的数据科学工具和语言之一。目前,R语言数据分析与挖掘逐渐成为高校信息类、管理类和数学统计类专业的必修课程内容,同时,作为面向各专业的通识课也广受欢迎。
本书作为立足于应用型本科数据科学与大数据教学的R语言核心课教材,具有如下特色:
(1)内容安排合理且全面,从R语言的基本编程、数据处理、数据可视化、统计分析到高性能计算和机器学习,循序渐进,深入浅出。
(2)难度适中,适合作为本科中高年级的核心课教材,零基础要求,对编程及数学知识不作为必要基础。
(3)理论与案例相结合,理论与实践相结合,包含了泰坦尼克号乘客生存分析、航班准点数据处理、鸢尾花数据建模等实践案例。
本书全面介绍了R语言的基本编程、数据处理、数据可视化、统计分析到高性能计算和机器学习,主要内容分为以下两部分:
部分:统计分析基础。第1章为R语言概述,包括R语言的相关背景、基本概念和基本操作等。第2章为数据访问,包括基本数据类型、数据的输入和输出等。第3章为数据操作,包括数据的缺失值处理、转换、合并和取子集等。第4章为数据可视化,包括各种图形元素的绘制和各种图表的绘制。第5章为概率与分布,包括常用概率和中心极限定理。第6章为基本统计分析,包括描述性统计分析、相关性和常用检验等。第7章为回归分析,包括OLS回归和回归诊断等。第8章为方差分析,包括ANOVA模型、单因素和多元方差分析等。
第二部分:机器学习实践。第9章为大数据高性能计算,包括大数据的选择、聚合、引用、筛选、连接和变形等。第10章为机器学习流程,包括数据探索、划分、填充、特征选择、建模调优和测试评估等。第11章主要介绍常用的有监督学习模型,包括线性、朴素贝叶斯、k近邻、决策树、随机森林、神经网络、支持向量机等。第12章主要介绍常用的无监督学习模型,包括k均值聚类、DBSCAN聚类、AGNES层次聚类和关联分析模型等。
本书由杜宾、钱亮宏、黄勃和高永彬编著。具体分工如下:杜宾编写第1章到第8章,黄勃编写第9章,钱亮宏编写第10章和第11章,高永彬编写第12章。全书由方志军、范磊和许华根主审。感谢孙冉、沈烨和周恒对本书的贡献。
由于编者水平有限,加之时间仓促,书中难免存在疏漏和不足之处,敬请老师和同学批评指正。
编者
2018年11月
网站评分
书籍多样性:4分
书籍信息完全性:7分
网站更新速度:7分
使用便利性:9分
书籍清晰度:6分
书籍格式兼容性:7分
是否包含广告:9分
加载速度:9分
安全性:4分
稳定性:3分
搜索功能:5分
下载便捷性:5分
下载点评
- 一星好评(559+)
- 内容完整(77+)
- 五星好评(292+)
- 快捷(225+)
- 傻瓜式服务(309+)
- 可以购买(530+)
下载评价
- 网友 菱***兰: ( 2025-01-05 03:26:04 )
特好。有好多书
- 网友 马***偲: ( 2024-12-31 21:58:17 )
好 很好 非常好 无比的好 史上最好的
- 网友 戈***玉: ( 2025-01-02 20:28:57 )
特别棒
- 网友 辛***玮: ( 2024-12-19 19:35:30 )
页面不错 整体风格喜欢
- 网友 丁***菱: ( 2024-12-22 04:20:32 )
好好好好好好好好好好好好好好好好好好好好好好好好好
- 网友 谭***然: ( 2024-12-26 23:47:05 )
如果不要钱就好了
- 网友 融***华: ( 2024-12-31 06:58:39 )
下载速度还可以
- 网友 养***秋: ( 2025-01-14 17:11:25 )
我是新来的考古学家
- 网友 堵***格: ( 2024-12-25 13:43:44 )
OK,还可以
- 网友 苍***如: ( 2024-12-31 03:04:14 )
什么格式都有的呀。
喜欢"高等学校大数据技术与应用规划教材:R语言数据分析与挖掘"的人也看了
汉语拼音拼读拼写训练全2册 一年级汉语拼音学习教材声母单复韵母整体认读拼音基础专项训练教材同步训练幼小衔接一日一练练习册 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
国际象棋初级:从第一步到checkmate 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
数据库应用基础学习指导 基于Visual FoxPro 9.0(第3版) 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
心理咨询师 人力资源和社会保障部教材办公室 等 组织编写 中国劳动社会保障出版社 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
湖州有意思(“浙江有意思”系列) 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- 数学(中班下)/新编幼儿园综合教育儿童用书 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- 2021新版聚能闯关100分期末复习冲刺卷 七年级上下册历史2本人教版 7年级上下册历史同步课本卷子试卷 七年级上下册历史辅导练习题 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- 9787111436539 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- 分子生物学 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- 53天天练 小学数学 二年级上册 RJ(人教版)2018年秋 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- 莳花弄草 我的园艺慢生活 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- 野外生存指南 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- 借鉴与超越:世界政党制度的类型与特征 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- PCR最新技术原理、方法及应用 第3版 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- 清代扬州学派经学研究(精)/江苏文库 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
书籍真实打分
故事情节:8分
人物塑造:7分
主题深度:5分
文字风格:6分
语言运用:4分
文笔流畅:7分
思想传递:9分
知识深度:5分
知识广度:9分
实用性:8分
章节划分:4分
结构布局:5分
新颖与独特:5分
情感共鸣:3分
引人入胜:8分
现实相关:6分
沉浸感:4分
事实准确性:6分
文化贡献:7分