北京中科资环信息技术研究院(Beijing Institute of Zhongke Resources, Environment and Information Technology)
北京中科资环信息技术
研究院文件
中科资环发(2018)52 号
基于 R 语言的回归分析与机器学习实践
技术应用研修班
各企事业单位:
统计学关心的是数据的收集、分析及其解释。 随着计算机的普及和人们采集数据能力的提升,
很多行业对充分认识数据、从数据中挖掘有用信息的需求,变得越来越为迫切。本课程将基于开源统
计软件 R 语言,结合丰富的实际案例数据,详细地介绍如何使用 R 语言进行回归及其拓展统计建模分
析。通过本课程的学习,学员们将会初步掌握基于 R 语言的回归分析及其拓展应用。
R是功能强大、免费、开源的编程语言,具有强大的统计建模和画图功能,能够运行在 Linux、
Windows、Macintosh操作系统上。R具有丰富和强大的包,几乎在各个领域都有可免费下载安装的 R
包供使用者参考,是统计领域乃至整个科学计算领域的主流程序设计语言。
本课程将从 R的基本安装操作开始,逐步介绍如何使用 R 语言拟合和解释线性回归模型和方差
分析模型;将详细介绍 R 基础包 stats 中线性回归分析函数 lm 的具体应用。针对二项数据和多项数据,
我们分别介绍二项回归模型和多项回归模型的基本原理及其 R 语言实现。针对计数数据,我们详细介
绍泊松回归模型、拟泊松回归模型、负二项回归模型的统计原理及其 R 语言实现。对上述两类数据,
我们重点介绍 R 基础包 stats 中广义线性模型拟合函数 glm 的具体应用。此外,我们介绍一般混合效
应模型的建模原理及其 R 语言实现,并结合不同类型数据特点介绍常用的混合效应模型。我们重点介
绍 lme4包中的 lmer 函数的语法规则。最后,我们结合具体案例,简要介绍回归和分类树、随机森林、
集成学习(AdaBoost,Bagging)、神经网络的算法原理及其 R 语言实现。
本课程将从 R的基本操作开始,一步步讲解,从数据可视化到常见数据分析方法的使用,并结合
相关学科具体实例,让学员能从中借鉴学习。现将有关事宜通知如下:
一、主办单位:北京中科资环信息技术研究院 会议指定协办单位:北京中科硕博
数据/语言/回归/介绍/模型/分析/技术/统计/学习/课程/
数据/语言/回归/介绍/模型/分析/技术/统计/学习/课程/
-->