9.1 R语言简介
R语言简介
R语言是一款统计软件,R语言也是一门编程语言,R语言也是一个数据分析平台。R是一个免费自由跨平台通用的统计计算与绘图软件,它有 Windows、Mac、Linux 等版本,均可免费下载使用。
R 项目(The R Project for Statistical Computing)最早由新西兰奥克兰大学(Auckland University)的Robert Gentleman(1959-)和Ross Ihaka(1954-) 开发,故软件取两人名字的首字母命名为 R 。

图 1 Robert Gentleman和Ross Ihaka
该项目始于1993年,2000年发布了首个官方版本 R 1.0.0 ,后期维护由 R 核心团队(R Core Team)负责。截止2022年,已发布到 4.2 版本。凭借其开源、免费、自由等开放式理念,R 迅速获得流行,目前已成为学术研究和商业应用领域最为常用的数据分析软件之一。随着大数据行业的发展,R语言变得越来越流行,R语言发挥了越来越重要的作用。
R语言应用
1、数据计算
用来计算数据
2、统计检验
分组进行检验,例如t检验,卡方检验等;
3、统计建模
文献中公式
4、数据挖掘
聚类,分类
5、数据可视化
科学文献绘图
R语言优缺点
R语言的优点:
开源、免费,具有完整的统计学功能,有大量的扩展包;
有效的数据处理和保存机制;
拥有一整套数组和矩阵的操作运算符;
一系列连贯而又完整的数据分析中间工具;
图形统计可以对数据直接进行分析和显示,可用于多种图形设备;
一种相当完善、简洁和高效的程序设计语言;
R语言是彻底面向对象的统计编程语言;
R语言和其它编程语言、数据库之间有很好的接口;
R语言是自由软件,可以放心大胆地使用,但其功能却不比任何其它同类软件差;
R语言具有丰富的网上资源。
R语言的缺点
开源、免费,具有完整的统计学功能,有大量的扩展包;
学习成本大;
不擅长处理非结构数据;
计算消耗资源较多;
R的扩展包太多了,比较混乱,不容易找到适合的扩展包;
不擅长多线程处理。
R语言与Excel对比
R语言开源免费,Excel收费;
R语言支持Linux版本,Excel只支持windows,macos,ios,Android;
能够计算大数据,Excel默认只能处理100万行数据;
R语言有更好扩展能力,有很多现成的包;
R语言有更好的绘图能力,例如可以很方便绘制热图,基因组圈图等复杂图形;
R语言的Bioconductor项目可以处理生物数据,例如基因表达数据,单细胞测序等;
R语言学习成本较大,不如Excel简单。
R语言与Python对比
数据分析的六个过程包括数据采集、数据存储、统计分析、数据挖掘、数据可视化以及生成报告。
R语言具有更强大的统计学功能;
R语言的Bioconductor项目可以处理生物数据,例如基因表达数据,单细胞测序等;
R语言的绘图能力更强,尤其是ggplot2包;
R不擅长字符串处理;
R更消耗内存;
python功能更强大,可以完成大的编程项目;
python具有更强大的文本处理能力;
python资源管理更好,R不擅长多线程计算,更消耗资源;
python擅长字符串处理;
python擅长深度学习;