致敬那些年脱的头发:实证类论文怎么写——数据处理
写文目的:这篇文章不是实证类论文指导教程(我没那水平!),只是为中途你我可能遇到的困难提个醒,以及致敬那些年脱的头发。

(一)选择数据报表类型
从国泰安下载下来的数据有可能分属于不同的报表类型,我第一次没有下载报表类型这一信息,然后有些变量在同一时间点有两个不同的数据,简直乱了套,后来才发现是报表类型那出了问题。报表类型分为A、B两种。A代表母公司报表,B代表总公司报表,下载的数据这二者是混在一起的,所以我们一般要对此先进行分类,一般采取母公司报表数据进行问题研究。
(二)数据删除
1.删除金融类企业的数据:金融类杠杆率大,各指标情况同其他企业差距很大,所以研究企业类问题时一般默认删除。
2.删除空白数据:如果该企业此月份的某一数据缺失,那整行数据都需要进行删除
3.删除不合理数据:你需要对各指标的合理区间进行判断,也许该指标的数据不可能出现负值,也许不可能大于一,你需要删除合理区间意外的数据
4.删除乱码:有些数据是通过数据间的运算得到,所以有可能得到乱码,也需要筛选出来一并删除
删除数据时可以巧用Excel中的筛选功能。这是就要佩服2007版本的office,可以之间筛选出某一数据进行局部删除,而WPS就不能。
(三)数据整合
这时候需要把分散在不同Excel表格中的数据整合到一个表中,空白数据的删除一定要在此项工作之前,因为,当你运用vlookup等函数将表格匹配到一起时,空白处还自动填充成0。在运用Excel进行数据处理时。一定记得问度娘,可以是很小白的问题,你会发现原来Excel还可以这样操作!不要傻傻地自己手工操作。(我一开始就是这样,心痛到不能呼吸,度娘比你想象的强大,Excel的骚操作也不是你我可以膜拜的)
(四)数据变换
Stata只会识别数值型数据,只认英文和阿拉伯数字,所以不合格的当你导入stata时通通标红。我遇见的几种情况:
股票代码000001,000002——NO;日期2018/01/01/、20180101——NO;78%——NO;文本类数据——更不可以
至于具体某种情况如何变换成标准样式,请问度娘,千万别直接手动变换啊!我用过vlookup,中间还经常匹配不起来,特别是运用文字信息时,你需要比对进行匹配的ID是否一样,比如广东和广东省就不可以;对日期的处理运用过Excel中“分列”,left等。 小茶杯论文查重经验分享:论文查重怎么查?如何找到论文查重免费系统?每一个系统都有自己独特的优势,在特定时期选择合适的系统才是硬道理,在确定系统安全的情况下、初稿时期选择性价比高的检测系统、像Paperccb论文查重免费版就是不错的选择, paperccb免费查重系统接近知网相似度,站内还有知网、维普、万方等多版本正品查重,还有自助修改、机器降重、在线报告等,更全面更安全的免费查重系统。百度搜索 paperccb
论文查重免费入口: https://www.paperccb.com