多语言展示
当前在线:1810今日阅读:27今日分享:41

stata中的_n和_N的简单应用?

如果当大家需要经常使用stata工作,我们就需要掌握stata中的各种小技巧。很多能够使用stata建模的人,都使用excel或者其他数据库软件来管理数据。但实际上stata的数据管理功能非常强大,以本经验的_n和_N为例,我们不仅可以快速地查询stata中有多少数据,熟练掌握这条命令,在我们使用stata编循环程序时也能给我提供很多帮助。现在我们就一起来学习一下吧!
工具/原料
1

stata

2

电脑

方法/步骤
1

问题1:什么是_n?在stata中输入:sysuse nlsw88.dta, clear //打开stata自带数据list idcode age race in 1/10      看下图中最左边的1,2就是n的内容list idcode输入上述命令后,见图2,最左边的数字2246就是idcode样本个数

2

知道了_n的含义之后,我们将_n应用在其他命令中现在假设我们想对数据有一个直观感觉,我想敢看这个数据中age最小的10个样本sort age //从小到大对hours进行排序 gen number = _n list number age in 1/10

3

现在我们想看看,年龄和工资的关系      sort wage      gen number2 = _n             // 第二个 _n 的内容               list number number2 age wage in 1/10

4

接下来我们再来看看_N的概念dis _N 通过这个命令,我们可以看看我们有多少样本scalar obs = _N这个命令的意思是产生一个标量obs,stata中不止能储存向量,还能储存标量。sum wage //对wage这个变量进行基本统计di r(mean)*obsdi r(sum)可以看到两个值相同。_N表示的是样本个数,有时候,我们可以利用_N自己计算一些数值。补充:这个r(),里面包含的都是标量,stata的计算结束后,会保存下来一些值,之后我们会详细讲解这些问题。

5

看看sum中的N值,_N和r(N)的值一样sum idcodedi r(N)di obs这两个值其实是一个值

6

总结一下:通过学习之后,我们理解了_N和_n一个数据集中只有一个N,是一个标量,就是指整个数据集中有多少数据每一行数据都有一个_n,指的就是数据的行数。他实际上是一个向量。观察我手绘的概念和简单应用已经介绍完毕,高级应用我会再下一讲进行介绍。

注意事项
1

介绍完这些,我还会介绍循环和季节效应和一些较复杂的函数的介绍,达到介绍使用这些工具在stata中去除时间趋势。

2

这个经验的内容注重理解,下一讲我会再介绍_n和_N的具体应用方法

推荐信息