![大数据分析:R基础及应用](https://wfqqreader-1252317822.image.myqcloud.com/cover/599/27110599/b_27110599.jpg)
3.3 R的包
3.3.1 包的获取
CRAN上面发布了5000多个软件包,资源在哪?怎么使用呢?现在告诉读者怎么才能找到自己研究需要的包。
(1)在R官网单击CRAN,选择离自己距离近的镜像网,也可以直接单击网址http://cran.rstudio.com/,进入图3.13所示页面。
![](https://epubservercos.yuewen.com/5ACAD3/15477640504530706/epubprivate/OEBPS/Images/00025.jpg?sign=1738850110-c6XBQASYTZgEUM4tNXWQCnM4F5BRyCy6-0-7a6c6f8403737ead933f9206a078a6e8)
图3.13 R的资源获取界面
(2)在左侧导航条第一部分CRAN下可以单击Task Views链接查看任务视图,如图3.14所示。
![](https://epubservercos.yuewen.com/5ACAD3/15477640504530706/epubprivate/OEBPS/Images/00026.jpg?sign=1738850110-cJJYigDhnXQUHaWNNUXTcrxGqG4KBZEp-0-0ae591a4f46224da88e89f95b1ecc62c)
图3.14 R的包界面
Task Views里面按照学科领域分门别类,现有的学科分类如表3.3所示。
表3.3 R应用领域
![](https://epubservercos.yuewen.com/5ACAD3/15477640504530706/epubprivate/OEBPS/Images/00027.jpg?sign=1738850110-Sa7R6jKLK1u0X5yV5GPuxodjCxSCLanq-0-0c48612d42b4ce11952b7dd67026588b)
![](https://epubservercos.yuewen.com/5ACAD3/15477640504530706/epubprivate/OEBPS/Images/00028.jpg?sign=1738850110-uOIsLh68GRuy2sQKJN6fQsvZAMeYfVPJ-0-724b12c71c2116ceb831aa0dba32cfe9)
(3)单击相关学科,进入到该学科类别,以计量经济学(Econometrics)为例,如图3.15所示。
![](https://epubservercos.yuewen.com/5ACAD3/15477640504530706/epubprivate/OEBPS/Images/00029.jpg?sign=1738850110-Z9Ra8mIyG4e8yTbbJR5WHSlvipJF8l1L-0-eaa0f7cc815e94b50433eb3be267f91b)
图3.15 计量经济学的包文件示例
页面给出的这个计量经济学系列的包中大致包括以下几个主题。
●Linear regression models:线性回归模型。
●Micro econometrics:微观经济学。
●Further regression models:其他的回归模型。
●Basic time series infrastructure:基本的时间序列架构。
●Time series modeling:时间序列模型。
每个主题都进行了简单的介绍,包括各个主题下有些什么软件包,以及该软件包的功能。页面按照字母表顺序列出了该学科相关的所有Packages,还给出了相关的CRAN Task View,如果在这个Task View找不到,可以去相关的Task View继续找。有了导航就能轻松地找到需要的软件包了。
3.3.2 包的安装
找到需要的软件包Name以后就开始下载安装软件包。有以下几种方法可以进行安装:
(1)网页软件包名,以plm(Linear Models for Panel Data)面板数据的线性模型软件包为例(如图3.16所示)来进行说明。
![](https://epubservercos.yuewen.com/5ACAD3/15477640504530706/epubprivate/OEBPS/Images/00030.jpg?sign=1738850110-bQXOjlOZFIZyxZscM8AGmjfxFWlseMh5-0-d2bf55bfca9f32a23167680884798d31)
图3.16 包的信息
上面有作者及软件包的一些相关信息,选择Windows进行下载。
如果使用R,选择“程序包”→“从本地zip文件安装程序包”命令,然后选择下载好的压缩包即可进行安装,如图3.17所示。
![](https://epubservercos.yuewen.com/5ACAD3/15477640504530706/epubprivate/OEBPS/Images/00031.jpg?sign=1738850110-v0Zp7LxOMKuFGaRQ7wi4LMv09ywQLuSr-0-811347c118c15059c46a8ca6c0c828cd)
图3.17 本地程序包的安装
如果在RStudio里面进行安装,选择Tools→Install Packages命令,如图3.18所示。
![](https://epubservercos.yuewen.com/5ACAD3/15477640504530706/epubprivate/OEBPS/Images/00032.jpg?sign=1738850110-zrhitQ0bZyNH6SlBmuzIJHbPdTycEIQ7-0-15fa3f3faec582c85450a8a7bb42364c)
图3.18 RStudio包的菜单选择
弹出图3.19所示窗口,在Install from下拉列表中选择Package Archive File选项,然后选取之前下载的压缩包即可完成安装。
![](https://epubservercos.yuewen.com/5ACAD3/15477640504530706/epubprivate/OEBPS/Images/00033.jpg?sign=1738850110-wWoyN8FJRx6dFE0PfQVaEsUwo98CpzHr-0-5df86f0d4913dd22dad0af25f438027a)
图3.19 RStudio包的安装界面
(2)知道自己需要下载安装的Packages的name,可以直接在软件中完成下载安装。
如果使用R,可以选择“程序包”→“安装程序包”命令进行安装,如图3.20所示。
![](https://epubservercos.yuewen.com/5ACAD3/15477640504530706/epubprivate/OEBPS/Images/00034.jpg?sign=1738850110-cdyu2QDtca99v8A7Al6hWSq75Xa8YBU6-0-c0ca18e13693a42d25fc83994ae0b21b)
图3.20 R平台的包安装界面
选择后会弹出清单,清单是按照字母表顺序排列的,选择plm选项,单击“确定”按钮即可完成安装,如图3.21所示。
![](https://epubservercos.yuewen.com/5ACAD3/15477640504530706/epubprivate/OEBPS/Images/00035.jpg?sign=1738850110-KLSrxxhTih5p3lVFYyNSaJlncW4EOmuG-0-aab411b5a03b261700bfd3b77facca05)
图3.21 R平台的包名称选择
如果使用RStudio,可以单击右下方小窗口的Packages,如图3.22所示。
![](https://epubservercos.yuewen.com/5ACAD3/15477640504530706/epubprivate/OEBPS/Images/00036.jpg?sign=1738850110-j7LRQem0CtJeRmuQ5M6rO8Bqgnf9SXZm-0-0998eab568782e4e15521fcb8eaba609)
图3.22 显示RStudio中已经安装好的包
显示的是已经安装好的软件包,单击Update按钮可以实现对已经安装Packages的升级。单击Install按钮会弹出图3.23所示窗口。
![](https://epubservercos.yuewen.com/5ACAD3/15477640504530706/epubprivate/OEBPS/Images/00037.jpg?sign=1738850110-uWgFQ5hZeexLrXENe5iy5zQkszHuhfj6-0-9cfc4750b2d96b918a943b58c8ed89a7)
图3.23 RStudio包的安装界面
在Install from下拉列表中选择Repository(CRAN,CRANextra)选项,表示从网上下载需要安装的软件包,安装路径Library是默认的。在Rackages(separate maltiple with space or comma)文本框中输入需要下载安装的Packages的名称plm,单击Install按钮就可以进行安装了。安装好的Packages会进入软件包库Library里面,并且自动显示在已安装的条目下。
(3)无论R还是RStudio都可以用命令实现安装,语句如下:
install.packages("plm")
建议读者先在官网了解软件包的功能,然后再在软件中直接进行下载安装。
3.3.3 包的加载
Packages安装好以后要加载才能使用,没有加载的话软件包中的函数是无法调用的。R开启后自带的标准包已经加载好,可以直接使用,比如base、datasets、graphics等。不带任何参数的library()打开当前系统中所有包介绍信息
>library()
如果要使用其他软件包,可以使用命令语句library()进行加载,使用以后将它从内存释放,例如:
#加载MASS软件包 >library(MASS) #卸载MASS软件包 >detach("package:MASS", unload=TRUE)
如果使用RStudio,可以用更加快捷的方式进行Packages的加载,如图3.24所示。RStudio右下方小窗口的Packages选项,菜单中显示了已经安装好的软件包,选中该软件包可以实现加载,取消选中可以使软件包从内存中释放。
![](https://epubservercos.yuewen.com/5ACAD3/15477640504530706/epubprivate/OEBPS/Images/00038.jpg?sign=1738850110-1lTE48gfUmnSUnuW2yhbbFaUMP3ZLmo5-0-197fec96303f47c915de1687942ce1ba)
图3.24 通过界面操作加载包
每个library都有许多数据,可以使用data()查看library中的数据。例如,调出数据Titanic。
> data(Titanic) > Titanic
运行结果:
,, Age = Child, Survived = No Sex Class Male Female 1st 0 0 2nd 0 0 3rd 35 17 Crew 0 0 ,, Age = Adult, Survived = No Sex Class Male Female 1st 118 4 2nd 154 13 3rd 387 89 Crew 670 3 ,, Age = Child, Survived = Yes Sex Class Male Female 1st 5 1 2nd 11 13 3rd 13 14 Crew 0 0 ,, Age = Adult, Survived = Yes Sex Class Male Female 1st 57 140 2nd 14 80 3rd 75 76 Crew 192 20
3.3.4 包的使用
成功载入包后便可以调用包中相应的函数及数据集。R包一般都包含了相应的数据集及示例代码,方便用户了解该包的功能及使用。包中函数描述及数据集的信息包含在帮助系统中,可以运用help()查看包的功能及包中函数和数据集的使用等具体细节。