大家好我是经管社科数据小助手作为经济学专业毕业的我深切了解经管 类 学生和学者在数据搜集上耗费的巨大精力。基于我们多年对经管社科领域的辅导经验我们帮助大家总结了在实证分析部分选取数据的经验希望对大家有一定的帮助。在确定选题后我们就要着手进行数据样本的确定和搜集了。我们选择数据的原则是根据所研究的问题以及数据可得性确定最合适的样本。经管研究的数据大致分五个层次1、 企业 层上市公司、工业企业、微观经营主体等变量最丰富实证最成熟2、国家/省级层各国或省份层面 宏 观政策或者国际经济研究常用数据规范但颗粒度粗3、地级市层城市层面中观研究的主力兼顾颗粒度和数据可得性4、县域层区县层面数据质量参差不齐但颗粒度最细5、微观调查层CFPS、CHFS等家庭个人调查数据、以及其他以个体行为为对象的微观数据适合研究微观行为机制每个层次的数据来源、常见变量、处理方式都不一样。本文从 省级层面 进行简要介绍其他层面的介绍见下方目录希望对大家有所帮助。目录1、【企业篇】上市公司数据怎么选https://blog.csdn.net/xiaozhuzhu1995/article/details/160482153?spm1001.2014.3001.55022、【省级篇】 省级面板数据 避坑指南https://blog.csdn.net/xiaozhuzhu1995/article/details/160482288?spm1001.2014.3001.55023、【地级市篇】城市数据的选择与处理https://blog.csdn.net/xiaozhuzhu1995/article/details/160482376?spm1001.2014.3001.55014、【县域篇】 县域数据 的使用注意事项https://blog.csdn.net/xiaozhuzhu1995/article/details/160482427?spm1001.2014.3001.55025、【微观篇】CFPS、CHFS等调查数据使用指南即本文。【微观篇】CFPS、CHFS等调查数据使用指南微观调查数据是研究家庭和个人行为的利器。近些年微观实证越来越火就是因为能回答很多宏观数据研究不了的问题。什么时候用微观数据题目里出现家庭个人居民微观行为或者研究的话题涉及个人决策比如消费、投资、教育、健康可以考虑微观数据。四大微观调查数据库数据库全称主持单位特点CFPS中国家庭追踪调查北京大学覆盖广成人库少儿库CHFS中国家庭金融调查西南财经大学金融数据最详细CGSS中国综合社会调查中国人民大学社会态度模块丰富CLDS中国劳动力动态调查中山大学劳动力相关最强还有两个偏企业/农村的特殊数据库数据库特点工业企业数据库规模以上工业企业1998-2015年农村固定观察点农业部主持农村研究首选微观数据的优势可以做家庭资产配置、教育代际传递、消费行为、主观幸福感、风险偏好等宏观数据根本研究不了的话题。这也是为什么近些年微观实证越来越火。常见坑1. 权重问题微观调查采用复杂抽样设计不同家庭被抽中的概率不同。如果不做加权校正样本可能不具代表性。几乎所有微观数据都提供权重变量用之前一定要加载。2. 追踪样本流失同一批人多年追踪数据可以做面板分析。但问题是样本流失严重——有些人不愿意继续接受调查了。流失不是随机的可能会导致估计偏误。3. 变量口径不一致同一个概念不同调查的定义可能不一样。比如家庭收入有的定义为全部收入有的只算工资收入。合并数据前务必仔细核对变量定义。4. 测量误差主观变量幸福感、满意度、风险偏好等受访谈环境、被访者情绪影响较大。建议用多个题项构造综合指标减少测量误差。5. 内生性问题微观数据虽然详细但内生性问题同样存在。工具变量、双重差分、断点回归等方法同样适用别以为微观数据就能绕过因果识别问题。微观调查数据最大的魅力是能回答为什么——为什么有些家庭更愿意投资、为什么教育会代际传递。但要做好微观研究需要对计量经济学方法有更深入的理解不能只会跑回归。