Peixun.net > 现场班 > 计量实证分析 > Stata全程2020年寒假研讨班

Stata全程2020年寒假研讨班

课时:0 分钟| 549人学习 分享 收藏
Stata寒假初级班:2020年1月8-10日 (三天)
Stata寒假高级班:2020年1月12-14日 (三天)
Stata寒假论文班:2020年1月16-18日 (三天)

上课信息

上课时间: 2020年1月8-10,12-14,16-18日(9天)
上午9:00至12:00; 下午2:00至5:00; 答疑5:00至5:30

上课地点: 北京市海淀区

Stata全程2020年寒假研讨班

Stata初级班:

第1讲 (3小时) Stata简介

数据的导入和导出

执行指令和基本统计分析

do文件和log文件的使用

帮助文件的使用和外部命令的获取

一篇范例文档

第2讲 (3小时) 数据处理

数据的横向合并和纵向追加

重复样本值、缺漏值和离群值的处理

基本统计量的呈现

基本统计分析(组间均值差异和中位数差异检验)

文字变量的处理

大型数据的处理范例(GTA数据库和工业企业数据库)

第3讲 (3小时) Stata程序

局域暂元和全局暂元(local, global)

控制语句(条件语句、循环语句)

Stata中的各类函数

分组回归分析

范例:盈余管理程度的估算、现金持有调整系数的估算

第4讲 (3小时) 普通最小二乘法 (OLS)

线性回归模型估计方法(OLS)

假设检验和统计推断

稳健性标准误:Bootstrap、Jackknife、聚类调整

虚拟变量

第5讲 (3小时) 模型的设定和解释

交乘项和平方项的使用及解释

边际效应:估计和图示

R2分解和贡献度分析

分组回归和组间系数差异检验

估计结果的呈现和分析

范文2篇

第6讲 (3小时) 静态面板数据模型

静态面板模型:固定效应和随机效应

基于Bootstrap的Hausman检验

异方差和序列相关(Bootstrap、Cluster调整标准误)

包含内生变量的固定效应模型

实证分析中的常见问题

Stata高级班:

第1讲 (3小时) 动态面板模型,面板VAR模型

一阶差分GMM估计量(FD-GMM)

序列相关检验、过度识别检验(Sargan检验)

模型设定常见问题(弱工具变量问题)

面板VAR模型简介

允许外生变量的PVAR模型

冲击反应函数 (IRF)、方差分解 (FEVD)

应用实例(介绍2篇论文)

第2讲 (3小时) 截面和面板门槛模型

Bootstrap简介

截面门槛模型(Cross-sectional Threshold Model)

面板门槛模型(Panel Threshold Model)

应用实例(介绍2篇论文)

第3讲 (3小时) 内生性专题 I:Heckman选择模型,处理效应模型

Logit模型简介

模型设定、估计方法和结果的解释

自我选择偏误简介

Heckman选择模型(Heckman Selection Model)

处理效应模型(Treatment Effect Model)

范例:2篇文章

第5讲 (3小时) 内生性专题III:合成控制法 (Synthetic control methods) 合成控制法简介

精讲一篇经典论文(Stata实现过程):Abadie, A., A. Diamond, J. Hainmueller, 2010,

Synthetic control methods for comparative case studies: Estimating the effect of california's tobacco

control program, Journal of the American Statistical Association, 105 (490): 493-505.

第6讲 实证研究如何做?(1)如何作规范的实证研究 (2) 课题标书的撰写 论文的选题、文献综述 (Endnote的使用)

研究贡献的挖掘和陈述

研究设计(模型设定和筛选)、数据和变量

修改报告的撰写 (与审稿人有效沟通)

课题选题和子课题的设定

研究基础、研究目标、研究内容、研究难点

特色和创新点的提炼

标书的结构和标书的修改

经验分享:一份自科基金标书

Stata论文班:

第1讲 顶级期刊上的截面数据研究

精讲:Fisman, Raymond, and Shang-Jin Wei, 2004, “Tax Rates and Tax Evasion: Evidence from

‘Missing Imports’ in China.” Journal of Political Economy 112(2): 471-496.

亮点:

 如何仅通过描述性统计就展示研究结论

 如何讨论系数估计的统计含义和经济含义

 如何正确使用交互项模型

第2讲 工具变量法的必要性与效果

精讲:Nunn, Nathan, and Leonard Wantchekon, 2011, “The Slave Trade and the Origins of Mistrust in Africa.”

American Economic Review 101(7): 3221-52.

亮点:

 如何通过可观测变量的选择性评估不可观测变量的选择性

 如何进行工具变量的证伪检验

 如何讨论因果关系的作用渠道

第3讲 匹配方法原理

精讲:Imbens, Guido W, 2015, “Matching Methods in Practice: Three Examples.”

Journal of Human Resources 50(2): 373-419.

亮点:

 如何从反事实框架理解匹配方法

 匹配方法与OLS方法的异同

逐步讲解匹配方法的操作细节

第4讲 截面数据中匹配与工具变量法的综合运用

精讲:Aidt, Toke S, and Raphael Franck, 2015, “Democratization Under the Threat of Revolution:

Evidence From the Great Reform Act of 1832.” Econometrica 83(2): 505-47.

亮点:

 如何评估系数稳定性

 同时使用多种匹配估计方法

 安慰剂检验与证伪检验

第5讲 连续型处理与多期双重差分

精讲:Nunn, Nathan, and Nancy Qian, 2011, “The Potato's Contribution to Population and Urbanization:

Evidence from a Historical Experiment.” Quarterly Journal of Economics 126(2): 593–650.

亮点:

 灵活的方程设定:平行趋势与动态效应

 作图展示估计结果

 变动处理时点与变动处理组

第6讲 双重差分法与匹配的结合

精讲:

[1] Schmitt, Matt, 2018, “Multimarket Contact in the Hospital Industry.”

American Economic Journal: Economic Policy 10(3): 361-387.

[2] Fowlie, Meredith, Stephen P Holland, and Erin T Mansur, 2012, “What Do Emissions Markets Deliver

and to Whom? Evidence From Southern California's NOx Trading Program.”

American Economic Review 102(2): 965-93.

亮点:

 如何对差分结果进行匹配估计

 如何构造匹配样本进行双重差分估计

 如何对识别假设进行间接检验

*如时间不够,本讲可能从略*


报名时间 2019-08-05 00:00 至 2020-01-07 00:00
培训时间 2020年1月8-10,12-14,16-18日(9天)
培训地点 北京市海淀区
培训费用 11200元 /9800元 (学生价仅限全日制本科生和硕士在读);食宿自理
授课安排 上午9:00至12:00; 下午2:00至5:00; 答疑5:00至5:30


2020年Stata寒假研讨现场课程简介


初级班课程导引    

实证分析中,最伤神和耗时的事情莫过于研究设计和数据处理。在以往的授课中,很多同学和老师都是在听完了高级班的课程以后,又返回头来听初级班的内容。他们有一个共同的感触就是,没有一个扎实的基础,以及对计量经济学和Stata整体架构的认识,后续的学习成本会越来越高。

在初级班中,我力求将三天的课程设置成一个比较完整的体系,目的有二:

其一,希望大家经过三天的学习(尚需另外花费1-2个月的时间演练吸收),能对基本的统计和计量分析方法有所掌握,能读懂多数期刊论文中使用的分析方法;

其二,希望诸位能建立起stata的基本架构,熟知stata能做什么、如何做?以期为后续学习打下宽厚扎实的基础。

翻阅Top期刊上的论文,你会发现多数论文并没有使用非常复杂的方法,关键在于论文的想法或视角比较独特,并使用了恰当的方法来论证。这里的关键在于研究设计,而这在目前的计量教科书中鲜有涉及。为此,本次研讨班突出两个特点:一方面,我会努力把基础知识讲解透彻,进度上不求快;另一方面,我在每个专题中都会提供了2-3篇比较经典的论文,展示这些方法的合理应用。

在内容的安排上,基本上遵循了由浅入深,循序渐进的思路。第1-3讲依序介绍stata的基本用法、数据处理和程序编写,学习这些内容无需太多的计量经济学基础,但对于提高实证分析能力和分析效率,大有裨益,。第4-5讲介绍文献中使用频率最高的线性回归模型,包括OLS的原理、结果的解释,以及虚拟变量和交乘项的使用等。对于这些内容的深刻理解和熟练掌握,构成了后续,多种主流实证模型的基础,例如,目前文献中广泛使用的固定效应模型 (FE),倍分法 (DID),断点回归设计 (RDD) 等方法,本质上就是在传统的线性模型基础上,增加一些虚拟变量或交乘项,配合巧妙的研究设计,来实现对不可观测的个体效应的控制,以及对政策效应的估计。第6讲介绍固定效应模型 (FE) 和倍分法(DID),是第4讲和第4讲内容的延伸和应用,也是目前解决遗漏变量和内生性问题比较常用的方法。

具体说明如下:

在第1-2讲中,笔者会以一篇文章为实例,说明Stata的基本语法结构,并对数据处理过程中的关键问题进行介绍,如离群值的处理、文字变量的处理等。就我个人的经验而言,数据处理能力的高低直接决定实证分析的效率,而对于离群值的处理是否妥善会直接影响全文结果的稳健性,是多数人不够重视但却至关重要的问题。

第3讲中介绍Stata编程的基础知识。但凡提及写程序,很多人都会产生恐惧心理,其实,一旦掌握了最基本的原理和语法格式,Stata中的程序设定并没有想象的那么困难。更为重要的是,对于多数人而言,由于并不需要写完整的ado文档,因此只需要学会最基本的条件语句和循环语句即可,难度又会进一步降低。

第4讲和第5讲介绍实证分析中的模型设定和结果解释问题。很多人会觉得OLS过于简单,但Top期刊中使用最多的仍然是OLS,如何合理的构建模型、解释结果便成为实证分析中必须掌握的。我精选了大家经常面临的几个专题并结合论文进行讲解,包括:虚拟变量的使用、交叉项的使用和解释、分组回归的合理设定和假设检验,还有在经济学和金融学中相对较新的R2贡献度分析。

第6讲介绍了目前广泛应用的面板数据模型和倍分法(Difference in Difference, DID)。由于面板资料的获取越来越方便,目前多数研究中使用的都是面板数据。在讲解这些模型的基本思想和估计方法的过程中,笔者会将重点放在模型含义和应用范围上来。例如,对于同一笔数据而言,何时采用OLS进行估计,何时采用FE估计?不同的方法之间有何差异和关联?结果背后的经济含义如何解读?对于倍分法,其背后的核心思想非常简单,但是在实证分析中有诸多需要解决的问题:共同趋势假设如何检验?多期DID如何估计?政策实施时点不同时如何估计?掌握这些方法有助于大家合理控制内生性问题,以便得到更为可信的结论。



高级班课程导引  

Stata高级班包括6个专题,重点讲述各类面板模型以及一些新近发展的内生性处理方法。主要涉及如下几个方面的内容:

1)面板模型:动态面板模型、面板VAR模型和面板门槛模型(23),前者在刻画变量之间的动态关系,以及政策冲击方面非常有用;而后者则在近年中分析结构变化方面得到了广泛的应用。

2)内生性问题,包括传统的IV估计和GMM估计 (1),这构成了第2(动态面板模型和面板VAR) 的理论基础;处理效应模型和倾向得分匹配分析(5);断点回归分析(RDD, 6)。作为上述模型的分析基础之一,在4中,将介绍Logit模型;

课程的特色和详情介绍如下:

其一,介绍了几个应用日益广泛的面板模型。时至今日,多数领域使用的都是面板数据,也对相关的模型提出了越来越高的要求。在2中,我将介绍专门用来分析变量自身以及多个变量之间动态关系的动态面板数据模型和面板VAR模型。这两类模型在经济增长、公司金融、国际贸易、劳动经济学等领域都得到了广泛应用。此外,在实证分析中,经常要处理结构变化问题,目前主要使用交叉项和分组回归等方式,但这两种设定方法都需要预先知道或假设结构变化点,使其合理性颇受质疑。而3中介绍的面板门槛模型则基于让数据说话的原则,自动搜索结构变化点,从而克服了上述方法的局限。

其二,显然,内生性问题是困扰我们这个时代的学者的一个普遍而棘手的问题。为此,高级班将通过三个专题全面深入地介绍了内生性问题。5介绍两类处理由于自我选择偏误导致的内生性问题的模型。一是处理效应模型,主要应对解释变量中所包含的0/1内生变量;二是倾向得分匹配分析方法,主要通过多维配对的方式来解决自我选择偏误。翻阅最近2年发表于《经济研究》、《管理世界》、《经济学(季刊)》等期刊的文章,这两类模型在处理内生性问题方面得到了日益广泛的应用。

作为上述模型的基础,4介绍Logit模型。一方面,Logit模型是研究很多0/1选择问题的主要方法;另一方面,在诸多解决内生性问题的模型中(如Heckman选择模型、PSMDIDRDD等),Logit都是非常关键的环节。

   相对于初级班,高级班的内容在难度上,虽然难度有所增加,但思路和架构更为清楚。在学习方法上,高级班与初级班有所不同。初级班的主要目的在于打下扎实的基础,建立一个完整的学习架构,而在高级班中,我则建议大家重点学习与自己研究方向密切相关的方法,通过广泛阅读文献来掌握这些方法在不同场景下的应用条件和变通方法。



论文班课程导引

在过去几期的培训结束后,我们都会收集学员的建议。大家都非常迫切地希望能够精讲一些经典论文的实证分析过程,对自己在初级和高级班的所学有一个整体的认知。对于已经开始尝试独立开展研究工作的学员而言,大家明显地感觉到,研究设计是最棘手的问题。在之前有导师指导或带领的情况下,研究主题和研究内容都是预先给定的,事实上,完成一篇论文相当于在做一个命题作文。而一旦开始独立门户,最大的挑战是找到合适的研究题目,做一个可靠的研究设计。这其实也是实证分析工作中最难的部分。

在本次的学术论文班中,我们将挑选一些发表于顶尖期刊上的论文,详细讲解每篇论文的实证分析过程,剖析作者的研究思路、研究设计,以及对结果的解释。我们会提供重现每篇论文所需的所有数据和程序文件,以便保证各位可以在听课后反刍,并将这些论文中的分析方法迁移到你的研究中去。

精讲并重现经典论文,有如下两个方面的好处:

一方面,这些论文的研究设计都非常出色,我们可以借鉴并在博采众长的基础上,不断改进自己的研究设计思路和方法。只有去拆解和重现这些论文,才能够感受到作者的思考过程和写作意图,从而从实质上提高我们自身的分析和研究能力。

另一方面,这些论文涵盖了目前实证分析中的主流方法,更为重要的是,每一篇论文通常会综合使用多种分析方法,这对于我们理解和灵活应用初级班和高级班所学的计量方法大有裨益。

下面对课程中涉及的主要论文作简要介绍,以便各位了解此次课程的重点所在。

第1讲中介绍的Fisman and Wei (2004)是一篇发表在顶级期刊上的截面数据研究,讨论税率变动对逃税行为的影响。文章从数据到结构都看似简单,对于时常感觉数据和技术捉襟见肘的学员而言是一篇非常好的示范之作。我们不但可以学到如何巧妙地利用各种描述性统计手段,让读者在看到回归结果之前就信服文章的结论;而且可以学到如何规范地讨论系数估计值的统计含义和经济含义;还可以学到如何正确地使用交互项模型来识别因果关系的发生机制。

第2讲介绍的Nunn and Wantchekon (2011)是展示工具变量方法各种技巧的洋洋大观之作。该文讨论历史上的非洲奴隶贸易如何型塑了今天人际间的不信任,并用种族到海岸线的距离作为奴隶贸易强度的工具变量。文章先使用了OLS方法,然后评估OLS估计结果在多大程度上受到选择性偏误的威胁;接着使用了工具变量方法,并通过“无第一阶段”证伪检验和“工具变量疑似内生”证伪检验来论证工具变量的合法性;最后还展示了如何通过精妙的控制来讨论因果关系的作用渠道。

第3讲介绍的Imbens (2015)是匹配方法的扛鼎人物所写的关于如何正确使用匹配方法的最新指南。我们知道,匹配方法为数众多,而且可以灵活操纵的空间也很大,匹配变量的选择更是有很多讲究,这使得匹配估计的结果往往不太稳健。我们从匹配方法的工作原理讲起,深入剖析其与OLS方法的异同,向学员传达匹配方法的思想实质。然后根据Imbens的建议,从样本平衡性检验、倾向得分估计、样本删截、估计方法选择等各个环节逐一讲解匹配方法的操作细节。

第4讲介绍的Aidt and Franck (2015)是一篇在截面数据中综合运用OLS方法、匹配方法和工具变量方法的顶刊文献。该文讨论1830年代英国各地区斯温暴动的激烈程度如何形成了可置信的革命威胁,推动了代表新兴阶级的辉格党在议会势力的壮大,最终促成了改革法案的通过。从这篇文章中我们不但能够回顾之前所学内容,而且还能学到如何通过系数估计的稳定性来判断OLS估计的潜在偏误程度,以及安慰剂检验和证伪检验等新的论证技巧。

第5讲介绍的Nunn and Qian (2011)是一篇典型的运用连续型处理与多期双重差分方法的经典文献。该文讨论土豆这一起源于新大陆的农作物在旧大陆的推广如何促进了人口增长和城市化。文章用一国种植土豆的适宜程度作为该国接受“政策干预”的强度,用土豆在旧大陆的大规模推广来确定“政策干预”的时点。这篇文章所运用的方法比离散型处理或两期问题更具一般性,而且基准估计、灵活估计、滚动估计、变动处理时点、变动处理组等实证手段也极具借鉴意义。

第6讲介绍的Schmitt (2018)和Fowlieet al (2012)是双重差分方法与匹配方法相结合的代表作。我们首先介绍双重差分方法与匹配方法相结合的两种模式,其一是将匹配方法视为数据预处理手段,构造匹配样本再进行双重差分估计,其二是将多期问题转换为两期问题,先构造差分结果,然后进行匹配估计。我们分别通过讲解一篇文章来展示这两种方法的应用。此外,两篇文章从不同侧面对各自的识别假设进行间接检验,排除竞争性假说,也是值得反复体味的亮点。

   需要特别强调的是,论文班的学习尤其要求大家要足够努力。最基本的要求是,在开课之前,要认真研读每一篇论文,了解其研究背景、研究思路、计量方法和主要结论。虽然这些论文的研究主题与诸位所在领域可能会有比较大的差异,但是,大道至简,从这些论文中主要是学习计量方法的合理应用和研究设计的思想。



联系方式:

魏老师
QQ:28819897142881989714

Tel:010-68478566

Mail:vip@pinggu.org

课程订阅

讲师介绍


Peixun.net

Stata全程2020年寒假研讨班

请认真填写以下信息,方便为您服务
  • 姓名:
  • 电话:
  • 邮箱:
  • 备注:
  • 邀请码:
  • 您还可以选择 登录 或者 注册 更方便您管理课程。

Peixun.net

您关于:

Stata全程2020年寒假研讨班

的报名信息已经提交成功。

去购物车结算
您可以选择 登录 或者 注册 更方便您管理课程。
回头再说

邮件已发送!

已成功发送邮件到您注册的邮箱 请前往查询并点击链接重置密码

有待解答的问题

3 名学员对您的课程提问,需要您作出回答。 现在就去