多语言展示
当前在线:302今日阅读:176今日分享:34

R语言基础:ggplot2初识与简易散点图制作

gplot是用来绘制统计图形的R软件包,是由其背后的一套语法支持的。图形的语法告诉我们,一张图形就是从数据(data)到几何对象的图形属性的一个映射(mapping)。图形中还包含数据的统计变换,最终绘制在某个特定的坐标系中。另外,分面可以用来生成数据不同子集的图形。总而言之,一张统计图形就是由上述这些独立的图形部件所组成的。
工具/原料

R

方法/步骤
1

有一些概念需要了解: - 几何对象(Geometric,缩写为geom)代表你在图中实际看到的图形元素,包括点、线、多边形等 - 图形属性(Aesthetic,缩写为aes)是包括颜色、形状等 - 统计变换(Statistical transformation,缩写为stats)指的是对原始数据进行某种计算和汇总,例如二元散点图加上一条回归线 - 图层(Layer)由几何对象和统计变换组成 - 标度(scale)是将数据的取值映射到图形空间,例如颜色、大小和形状表示不同的数值。展现标度的常见做法是绘制图例和坐标轴 - 坐标系(Coordinate,缩写是coord)主要控制坐标轴和网格线,描述的是数据如何映射到图形所在平面。通常使用笛卡尔坐标系 - 分面(facet)也称条件作图,控制分组方法和排列,描述如何将数据分解为各个子集,以及如何对子集作图

2

安装RStudio有网页版和软件版网页版注册后可直接使用;软件版则需要下载安装ggplot2包,运行如下命令:> install.packages('ggplot2')

3

由ggplot2所制得图形有三个重要的组成部分 1. 数据 2. 数据和视觉变量属性之间的映射(aesthetic mappings) 3. 呈现数据结果的图层(一般使用geom()函数)绘制displ和hwy相关性的散点图,脚本如

4

相应的,ggplot2参数中mpg是数据集,映射即x、y坐标轴对应的数据,图层是散点图。注意该函数调用的结构,第一排包括数据集和映射aes(),放在ggplot()中,然后再通过 + 添加图层 geom_point()(散点图)运行脚本后生成图片

5

黑白散点图另外,aes()中的前两个参数默认为x,y轴的映射,因此脚本也可简写为

6

设定图形颜色、大小和形状利用图形属性(颜色和形状)可以来比较不同分组)。图形的颜色、大小和形状等都是给绘图添加的额外变量,即标度(scale),添加在函数aes() 的参数中,如下(注:class、drv、cyl等是数据集中的类别名称): - aes(displ, hwy, colour = class) - aes(displ, hwy, shape = drv) - aes(displ, hwy, size = cyl)因此,增加一个颜色参数,将class变量映射成不同的颜色,并创建图例,脚本如:ggplot(mpg, aes(displ, hwy, colour = class)) +  geom_point()

推荐信息