cngdf——名义GDP与实际GDP之间的摆渡船

Original 爬虫俱乐部 Stata and Python数据分析 2022-03-15

本文作者：石艳，中南财经政法大学统计与数学学院
本文编辑：王玉洁
技术总编：戴雯

Stata&Python云端课程来啦！

为了平衡团队运营成本，维系公众号的运营，也与国内动辄数千元的Stata课程缩短差距，我们的网课不得不上调价格，我们决定于9月1日起调价，Python课程的价格调整为199.9元，Stata进阶课程调为199.9元，Stata基础课程调整到229.9元，Stata文本分析、正则表达式、网络爬虫、基本字符串课程调整至79.9元。大家可以告知一下身边想要购买的小伙伴，欲购从速哦对报名有任何疑问欢迎在公众号后台和腾讯课堂留言~我们在这篇推文的最后提供了每门课程的课程二维码，大家有需要的话可以直接扫描二维码查看课程详情并进行购买哦～

1 导读

要研究一个经济体的增长情况和波动情况，具体以什么指标来衡量呢？我们最常接触到的指标就是 GDP(Gross Domestic Product)，中文全称是：国内生产总值。

如果想要获取国家的GDP数据，我们往往会直接从政府统计部门公布的数据中下载，统计年鉴中的GDP为名义GDP；这种GDP包含了价格变动对经济的影响，不能很好地反映经济增长的真实情况。

因此，在利用GDP数据进行统计分析时，我们通常使用实际GDP，也称为不变价GDP，即消除价格变动因素后的GDP。

这时大家可能会问“怎么样才能获得实际GDP呢？“，接下来就介绍两种GDP之间的桥梁—GDP平减指数，学会了它，获取实际GDP也就是分分钟的事了！

2 GDP平减指数

GDP平减指数，又称GDP缩减指数，简单来说就是名义GDP与真实GDP之比，GDP平减指数=(名义GDP/实际GDP)×100。GDP平减指数能够更加准确地反映一般物价水平走向，是对价格水平最宏观测量。

举个例子：如果2010年你的收入为每月1万元，2020年你的收入为每月2万元，而以2010年的物价水平计算2020年的收入为每月1.6万元，则平减指数为2/1.6=1.25，说明2010年到2020年平均物价水平上涨了约25%。同时此例中的“2万元”相当于名义GDP，“1.6”万元相当于实际GDP。

3 命令介绍

今天要给大家安利的是一个既简单、又实用的小命令——cngdf，有了它，我们可以快速获取任意基期的GDP平减指数的，包括全国GDP平减指数与各个省份GDP平减指数；同时，可以高效准确地计算出实际GDP。

cngdf是一个外部命令，使用前需要先用 ssc install cngdf 进行安装。语法结构为：cngdf,year()[china] ，有以下两个选项：

year()：必选项，获取某一年为基期的GDP平减指数。例如year(2000)就是获取以2000年为基期的GDP平减指数；
china：可选项，用来区分国家层面和省级层面，使用china即为全国GDP平减指数，不使用即为各省GDP平减指数。

注意：此命令目前只更新到2019年。

4 运用cngdf看全国GDP走势

我们首先获取以2000年为基期的全国GDP平减指数：

cngdf,year(2000) china

数据如下所示：

接下来计算实际GDP。在计算之前，先将每年的名义GDP导入，随后采用相应公式(实际GDP=名义GDP/GDP的平减指数)进行计算，详细过程如下：

clear allcngdf,year(2000) chinagsort -yeargen 实际GDP=名义GDP/gdp_deflator

为了进一步观察名义GDP与实际GDP的不同，我们作图比较：

twoway ///(scatter 名义GDP year, c(l) mcolor(orange) msize(1)) ///(scatter 实际GDP year, c(l) mcolor(orange) msize(1)), ///title("实际GDP与名义GDP对比") xtitle("年份") ytitle("GDP（亿元）") ///ylabel(200000(200000)1000000) xlabel(2000(2)2020) yline(1000000)

语法讲解
c是connect的缩写，表示散点的连接方式；
mcolor为散点的颜色；msize表示散点的大小；
xtitle和ytitle分别用来指定x轴的y轴的轴标题；
xlabel和ylabel分别用来规定x轴和 y轴的刻度呈现方式；
yline(1000000)表示在y=1000000处做一条平行于x轴的直线。

从图中可以看出，名义GDP和实际GDP虽然都呈上升趋势，尤其是近几年的名义GDP，2019年已经达到986515亿元，但是二者还是有所差别，说明价格的变动对GDP增长确实有一定的影响，所以使用GDP数据分析问题时必须考虑这种影响。

5运用cngdf看各省GDP走势

不加 china 选项时，获取到的是各个省的GDP平减指数：

cngdf,year(2010)

上述代码是以2010年为基期，数据部分展示如下：

在了解 cngdf 基本用法的基础上，为了更好的对各省GDP数据进行宏观了解，我们通过以下代码得到了2019年各省GDP的相关数据（以2010年为基期），包括31省市名义GDP（亿元）、实际GDP（亿元）及其增长速度（以不变价计算）对比。

clear allcngdf,year(2010)keep if year==2019merge 1:1 province using "2019年名义GDP",nogenerategen 实际GDP=名义GDP/gdp_deflatorgsort -名义GDPgen 名义GDP排名 =_ngsort -实际GDPgen 实际GDP排名=_ngsort -GDP增速gen GDP增速排名=_ndrop id year gdp_deflator order province 名义GDP 名义GDP排名实际GDP 实际GDP排名 GDP增速 GDP增速排名 districtsave 2019年各省GDP情况一览表,replaceexport excel "2019年各省GDP情况一览表",firstrow(variables)

2019年各省GDP情况一览表

在此表中，把31个省市划分为四个地区，分别为东部地区、西部地区、东北地区和中部地区。从GDP总量来看，东部地区处于领先地位，而从增长速度来看，西部地区却明显领先，中部地区次之，说明国家促进西部发展的政策是有效果的。而东北三省在总量和增长速度方面都处于较低位置也是个值得思考的问题。

为了更加直观，还可以做条形图和饼图，代码及图形如下：

5.1 条形图

clear alluse 2019年各省GDP情况一览表.dta,clear

*给province进行标签操作，便于后续作图sencode province, gene(province1) gsort(实际GDP)drop provinceren province1 provinceorder province,before(名义GDP)

graph hbar 实际GDP,over(district) over(province,label(labsize(vsmall))) ///nofill asyvars ///legend(position(2) ring(0) size(vsmall) symy(1pt) symx(5pt)) ///title(2019年实际GDP) ytitle("GDP（亿元）")

语法讲解
nofill选项将分类变量中缺失值忽略掉；
asyvars使得第一个分组变量（此处为district）变换为相应的若干y变量；
labsize调整“province”作为y轴标签时的大小；
legend中的symy、symx分别用于调整图例的纵向和横向的大小。

从图中仍然可以得到相似的结论，广东、江苏、山东、浙江位居全国前四，四川省在西部地区的GDP总量中排名第一。

5.2 饼图

graph pie 实际GDP, over(district) scheme(sj) ///plabel(_all name, size(*1.5) color(black)) ///

pie(1,color(gold)) pie(2,color(midgreen)) pie(3,color(lavender)) pie(4,explode color(ltblue)) // explode 突出或分离出某一块

选项 plabel 表示饼图中文字的设置方式，包括颜色，尺寸等；
选项 pie 决定了每块“饼”的设置方式，顺时针方向排序，也包括颜色，是否与其他图形分离显示等。

从图中可以看到东部地区以一己之力占据了“半壁江山”，这也是沿海优势的体现。

今天所要介绍的内容就是这些啦，主要包括cngdf的命令以及GDP相关描述分析。如果大家有什么新的想法，欢迎留言交流~需要本文相关数据的朋友，请在公众号后台对话框内回复关键词“cngdf”哦，我们下期再见~

最后，我们为大家揭秘雪球网(https://xueqiu.com/)最新所展示的沪深证券和港股关注人数增长Top10。

腾讯课堂课程二维码

对我们的推文累计打赏超过1000元，我们即可给您开具发票，发票类别为“咨询费”。用心做事，不负您的支持！

往期推文推荐

最近《扫黑风暴》有点火爆！我从豆瓣评论中发现了这些……

随机森林-Random Forest

复原之神--preserve&restore

合并，“纵”享新丝滑：frameappend & xframeappend
什么是全局配置项？|从零开始的Pyecharts（二）帮你拿下数据可视化|从零开始的Pyecharts

Stata助力疫情打卡管理——是谁没有接龙呢？

这十年，《金融研究》的编委和读者偏爱哪些研究话题和文章?

【案例展示】Python与数据库交互

学好这一手，英语词典常在手

玩转Stata中的数学函数

用spmap看中国空气质量

戳穿围城面具：安利&劝退一个专业

走进图文并茂的攻略世界

玩转word文档“大变身”——wordconvert

数据读入|一文读懂用Stata读入不同类型的数据

简述递归

OpenCV库——轻松更换证件照背景色

800万年薪！还有谁？！

千古伤心词人，词伤几何？

去哪儿网攻略爬取——跟我一起去大理吧

"有你才有团"——Stata爬取王者荣耀英雄海报

爬虫实战|嚣张的徽州宴老板娘错在哪？

如何获取衡量股民情绪的指标？|东方财富股吧标题爬虫

利用Python构建马科维茨有效边界

rangestat，让统计量灵活滚动起来！

听说这样做立项成功率更高哦

如何处理缺失值？这一篇搞定！

善用dataex命令，高效沟通你我他

用Markdown制作简历，强力助力你的求职季

大数据下的大学分数线排行榜，快来围观！

《觉醒年代》—带你回到百年前

关于我们

微信公众号“Stata and Python数据分析”分享实用的Stata、Python等软件的数据处理知识，欢迎转载、打赏。我们是由李春涛教授领导下的研究生及本科生组成的大数据处理和分析团队。

此外，欢迎大家踊跃投稿，介绍一些关于Stata和Python的数据处理和分析技巧。

投稿邮箱：statatraining@163.com投稿要求：
1）必须原创，禁止抄袭；
2）必须准确，详细，有例子，有截图；
注意事项：
1）所有投稿都会经过本公众号运营团队成员的审核，审核通过才可录用，一经录用，会在该推文里为

作者署名，并有赏金分成。

2）邮件请注明投稿，邮件名称为“投稿+推文名称”。
3）应广大读者要求，现开通有偿问答服务，如果大家遇到有关数据处理、分析等问题，可以在公众号中提出，只需支付少量赏金，我们会在后期的推文里给予解答。

张庆方律师拟被吊销律师证的处罚告知书

国产光刻机进展太慢？重点不是这个

桐城一派｜突发！湖南省财政厅厅长刘文杰坠楼身亡

联调局开始降息置业者应否入市

光刻机，官宣了！

cngdf——名义GDP与实际GDP之间的摆渡船

5.2 饼图

最近《扫黑风暴》有点火爆！我从豆瓣评论中发现了这些……

随机森林-Random Forest

复原之神--preserve&restore

Stata助力疫情打卡管理——是谁没有接龙呢？

【案例展示】Python与数据库交互

玩转Stata中的数学函数

戳穿围城面具：安利&劝退一个专业

走进图文并茂的攻略世界

玩转word文档“大变身”——wordconvert

简述递归

800万年薪！还有谁？！

千古伤心词人，词伤几何？

去哪儿网攻略爬取——跟我一起去大理吧

"有你才有团"——Stata爬取王者荣耀英雄海报

如何获取衡量股民情绪的指标？|东方财富股吧标题爬虫

利用Python构建马科维茨有效边界

rangestat，让统计量灵活滚动起来！

听说这样做立项成功率更高哦

如何处理缺失值？这一篇搞定！

善用dataex命令，高效沟通你我他

大数据下的大学分数线排行榜，快来围观！

《觉醒年代》—带你回到百年前

关于我们

您可能也对以下帖子感兴趣

张庆方律师拟被吊销律师证的处罚告知书

国产光刻机进展太慢？重点不是这个

桐城一派｜突发！湖南省财政厅厅长刘文杰坠楼身亡

联调局开始降息 置业者应否入市

光刻机，官宣了！

生成图片，分享到微信朋友圈

cngdf——名义GDP与实际GDP之间的摆渡船

5.2 饼图

关于我们

您可能也对以下帖子感兴趣

联调局开始降息置业者应否入市