中国检察年鉴1997
免费
免费
上市企业违约概率计算stata数据代码结果2000-2019年
首先,本文采用Bharath and Shumway(2008)提出的Naive模型估计违约概率(EDF)作为违约风险的替代变量,我们采取如下步骤计算违约风险:
其中,DD表示违约距离;Equity表示公司总市值,是股票发行总数与年末市场价格的乘积;Debt是公司债务的面值,是公司年末短期负债与年末长期负债的二分之一的加总; 是企业滞后一年的年度收益率;T在公式中被设置为1年;
是公司资产波动率的估计量,通过
计算得出。
是股票收益率的波动率,利用公司上一年度的月度收益率数据取标准差求得。
的计算如下:
在式(1)和式(2)的基础上,我们可以计算出违约风险距离DD。,然后通过标准累计正态分布函数Normal(.)求出企业违约概率,如式(3):
其次,本文还考虑了上市企业的事后违约概率。本文以企业上年度短期借款(包括一年内到期的长期借款)与当期偿还借款额度(对应现金流量表中“偿还债务所支付的现金”)的差额来衡量公司是否按期偿还了借款。我们设置虚拟变量Violate表示企业事后违约概率。当该差额大于零时,表示企业没有按期偿还借款,变量Violate取1,表示企业违约;否则取0,表示企业没有违约1。
参考文献
全国30个省份政府干预程度数据2000-2017
包含:地区,编码,年份,财政收入,财政支出,政府干预程度
跨度:2013年6月-2020年11月(花旗共享单车)、2013-2020年11月(Divvy共享单车)
区域范围:数据附经纬度
指标说明(1)纽约花旗共享单车轨迹数据
花旗自行车是纽约市首位的自行车共享计划,拥有12000辆自行车和750个车站
使用者可以使用花旗自行车1天或3天通行证租赁自行车。该项目除了设计用来方便短途旅行,也是一个四处闲逛时有趣并且较为划算的选择方式。使用者可以在节省时间和享受乐趣的同时游览整个城市的景点。该项目于2013年5月正式运行,虽历经波折,如今仍正常运行、魅力不减。
数据指标:骑行时间,开始时间,结束时间,开始站点名称,终站点名称,站点ID,站点经纬度,自行车ID,是否会员,出生年月,性别。
(2)芝加哥Divvy共享单车
Divvy是芝加哥最大的共享单车系统,拥有6000余辆单车及600余处自行车站点,和纽约的Citi Bike(花旗)以及旧金山的Ford GoBike一样,是本市市内交通的重要方式。目前其业务已拓展至纽约、华盛顿、波士顿等城市。
数据指标:自行车ID,开始时间,结束时间,开始站点名称,终站点名称,站点ID,站点经纬度,是否会员
全国省市县地方官员任期数据1949-2019
数据范围:3034个地区(包括省市县)
样本量:共计2w+
数据年份:1949-2019年
用途:1.衡量官员任期对地方经济和政策影响 2.工具变量
wenxian
[1]周黎安.中国地方官员的晋升锦标赛模式研究[J].经济研究,2007(07):36-50.
[2]张军,高远.官员任期、异地交流与经济增长——来自省级经验的证据[J].经济研究,2007(11):91-103.
[3]钱先航,曹廷求,李维安.晋升压力、官员任期与城市商业银行的贷款行为[J].经济研究,2011,46(12):72-85.
指标
数据指标:官员姓名、官员职位、所在地区、地区类别、任期起始时间、任期结束时间
python爬虫视频包含程序、操作详细步骤
视频讲解清晰,零基础也可以。
主要包括:
【python 语法入门】
1、Python跟英语一样是一种语言
2、数据类型之字符串
3、 数据类型之列表元组集合
4、 数据类型之字典
5、数据类型之布尔值、None
6、逻辑语句(if&for&tryexcept)
7、列表推导式
8、理解函数
9、常用的内置函数
10、文件路径库os库
11、数据清洗re库
12、数据存储csv库
13、初学python常出错误汇总
【数据采集】
1、网络爬虫原理
2、发现网址规律
3、网络访问requests库
4、网页解析pyquery库
5、实战:大众点评
6、如何解析json数据
7、实战: 知乎
8、实战: 微博
9、实战: 批量下载多媒体文件
10、实战: 批量下载上市公司定期报告pdf
11、实战: 各种宏观经济、金融、政治数据下载
12、爬虫知识点总结
【文本处理入门】
1、文本分析概述
2、读取文件中数据(pdf、docx、txt、excel)
3、中文分词及数据清洗
4、实战: 词频统计(词云图制作)
5、实战: 中文情感分析(词典法)
6、实战: 将多文件数据汇总到一个excel
7、数据分析pandas库快速入门
8、实战: 对excel中的文本进行情感分析
9、从pdf中提取表格数据
10、共现法扩展情感词典(领域词典)
11、从非结构化文本数据中提取结构化数据(文本数据清洗re库)
【文本分析进阶】
1、了解机器学习
2、使用机器学习做文本分析的流程
3、scikit-learn机器学习库简介
4、文本特征抽取(特征工程)
5、实战:在线评论情感分析(机器学习法)
6、文本相似性(cos/编辑距离/jaccard)
7、实战: 使用文本相似性自动识别冲击(改变的)时间点
8、Kmeans聚类算法
9、LDA话题模型
10、文本分析在经管研究中的应用
金融机构涉农贷款2009-2018
金融机构:本外币涉农贷款余额:农林牧渔业贷款 |
金融机构:本外币农林牧渔业贷款余额:农业 |
金融机构:本外币农林牧渔业贷款余额:林业贷款 |
金融机构:本外币农林牧渔业贷款余额:畜牧业 |
金融机构:本外币农林牧渔业贷款余额:渔业 |
金融机构:本外币农林牧渔业贷款余额:农林牧渔服务业 |
金融机构:本外币农林牧渔业贷款余额:农户 |
金融机构:本外币农林牧渔业贷款余额:非农户个人 |
金融机构:本外币农林牧渔业贷款余额:农村企业 |
金融机构:本外币农林牧渔业贷款余额:农村各类组织 |
金融机构:本外币农林牧渔业贷款余额:城市企业 |
金融机构:本外币农林牧渔业贷款余额:城市各类组织 |
金融机构:本外币涉农贷款余额:农用物资和农副产品流通贷款 |
金融机构:本外币涉农贷款余额:农村基础设施建设贷款 |
金融机构:本外币涉农贷款余额:农产品加工贷款 |
金融机构:本外币涉农贷款余额:农业生产资料制造贷款 |
金融机构:本外币涉农贷款余额:农田基本建设贷款 |
金融机构:本外币涉农贷款余额:农业科技贷款 |
金融机构:本外币涉农贷款余额:其他 |
金融机构:本外币涉农贷款余额:农村贷款 |
金融机构:本外币涉农贷款余额:农村贷款:农户贷款 |
金融机构:本外币涉农贷款余额:农村贷款:农村企业及各类组织贷款 |
金融机构:本外币农村贷款余额:农村企业及各类组织贷款:农村企业 |
金融机构:本外币农村贷款余额:农村企业及各类组织贷款:农村各类组织 |
金融机构:本外币农村贷款余额:农村农林牧渔业 |
金融机构:本外币农村贷款余额:农田基本建设 |
金融机构:本外币农村贷款余额:农产品加工 |
金融机构:本外币农村贷款余额:农业生产资料制造 |
金融机构:本外币农村贷款余额:农用物资和农副产品流通 |
金融机构:本外币农村贷款余额:农业科技 |
金融机构:本外币农村贷款余额:农村基础设施建设 |
金融机构:本外币农村贷款余额:农户消费 |
金融机构:本外币农村贷款余额:其他 |
金融机构:本外币涉农贷款余额:城市涉农贷款 |
金融机构:本外币涉农贷款余额:非农户个人农林牧渔业贷款 |
金融机构:本外币涉农贷款余额:城市企业及各类组织涉农贷款 |
金融机构:本外币涉农贷款余额:个人涉农贷款 |
金融机构:本外币涉农贷款余额:企业涉农贷款 |
金融机构:本外币涉农贷款余额:企业涉农贷款:农村企业贷款 |
金融机构:本外币涉农贷款余额:企业涉农贷款:城市企业涉农贷款 |
金融机构:本外币涉农贷款余额:各类非企业组织涉农贷款 |
金融机构:本外币涉农贷款余额:各类非企业组织涉农贷款:农村各类组织贷款 |
金融机构:本外币涉农贷款余额:各类非企业组织涉农贷款:城市各类组织涉农贷款 |
金融机构:本外币涉农贷款余额占各项贷款比重:合计 |
金融机构:本外币涉农贷款余额占各项贷款比重:农林牧渔业贷款 |
金融机构:本外币农林牧渔业贷款余额占各项贷款比重:农业 |
金融机构:本外币农林牧渔业贷款余额占各项贷款比重:林业 |
金融机构:本外币农林牧渔业贷款余额占各项贷款比重:畜牧业 |
金融机构:本外币农林牧渔业贷款余额占各项贷款比重:渔业 |
金融机构:本外币农林牧渔业贷款余额占各项贷款比重:农林牧渔服务业 |
金融机构:本外币农林牧渔业贷款余额占各项贷款比重:农户 |
金融机构:本外币农林牧渔业贷款余额占各项贷款比重:非农户个人 |
金融机构:本外币农林牧渔业贷款余额占各项贷款比重:农村企业 |
金融机构:本外币农林牧渔业贷款余额占各项贷款比重:农村各类组织 |
金融机构:本外币农林牧渔业贷款余额占各项贷款比重:城市企业 |
金融机构:本外币农林牧渔业贷款余额占各项贷款比重:城市各类组织 |
金融机构:本外币涉农贷款余额占各项贷款比重:农用物资和农副产品流通贷款 |
金融机构:本外币涉农贷款余额占各项贷款比重:农村基础设施建设贷款 |
金融机构:本外币涉农贷款余额占各项贷款比重:农产品加工贷款 |
金融机构:本外币涉农贷款余额占各项贷款比重:农业生产资料制造贷款 |
金融机构:本外币涉农贷款余额占各项贷款比重:农田基本建设贷款 |
金融机构:本外币涉农贷款余额占各项贷款比重:农业科技贷款 |
金融机构:本外币涉农贷款余额占各项贷款比重:其他 |
金融机构:本外币涉农贷款余额占各项贷款比重:农村贷款 |
金融机构:本外币涉农贷款余额占各项贷款比重:农村贷款:农户贷款 |
金融机构:本外币涉农贷款余额占各项贷款比重:农村贷款:农村企业及各类组织贷款 |
金融机构:本外币农村贷款余额占各项贷款比重:农村企业及各类组织贷款:农村企业 |
金融机构:本外币农村贷款余额占各项贷款比重:农村企业及各类组织贷款:农村各类组织 |
金融机构:本外币农村贷款余额占各项贷款比重:农村农林牧渔业 |
金融机构:本外币农村贷款余额占各项贷款比重:农田基本建设 |
金融机构:本外币农村贷款余额占各项贷款比重:农产品加工 |
金融机构:本外币农村贷款余额占各项贷款比重:农业生产资料制造 |
金融机构:本外币农村贷款余额占各项贷款比重:农用物资和农副产品流通 |
金融机构:本外币农村贷款余额占各项贷款比重:农业科技 |
金融机构:本外币农村贷款余额占各项贷款比重:农村基础设施建设 |
金融机构:本外币农村贷款余额占各项贷款比重:农户消费 |
金融机构:本外币农村贷款余额占各项贷款比重:其他 |
金融机构:本外币涉农贷款余额占各项贷款比重:城市涉农贷款 |
金融机构:本外币涉农贷款余额占各项贷款比重:非农户个人农林牧渔业贷款 |
金融机构:本外币涉农贷款余额占各项贷款比重:城市企业及各类组织涉农贷款 |
金融机构:本外币涉农贷款余额占各项贷款比重:个人涉农贷款 |
金融机构:本外币涉农贷款余额占各项贷款比重:企业涉农贷款 |
金融机构:本外币涉农贷款余额占各项贷款比重:企业涉农贷款:农村企业贷款 |
金融机构:本外币涉农贷款余额占各项贷款比重:企业涉农贷款:城市企业涉农贷款 |
金融机构:本外币涉农贷款余额占各项贷款比重:各类非企业组织涉农贷款 |
金融机构:本外币涉农贷款余额占各项贷款比重:各类非企业组织涉农贷款:农村各类组织贷款 |
金融机构:本外币涉农贷款余额占各项贷款比重:各类非企业组织涉农贷款:城市各类组织涉农贷款 |
金融机构:本外币涉农贷款新增额:合计 |
金融机构:本外币涉农贷款新增额:农林牧渔业贷款 |
金融机构:本外币农林牧渔业贷款新增额:农业 |
金融机构:本外币农林牧渔业贷款新增额:林业 |
金融机构:本外币农林牧渔业贷款新增额:畜牧业 |
金融机构:本外币农林牧渔业贷款新增额:渔业 |
金融机构:本外币农林牧渔业贷款新增额:农林牧渔服务业 |
金融机构:本外币农林牧渔业贷款新增额:农户 |
金融机构:本外币农林牧渔业贷款新增额:非农户个人 |
金融机构:本外币农林牧渔业贷款新增额:农村企业 |
金融机构:本外币农林牧渔业贷款新增额:农村各类组织 |
金融机构:本外币农林牧渔业贷款新增额:城市企业 |
金融机构:本外币农林牧渔业贷款新增额:城市各类组织 |
金融机构:本外币涉农贷款新增额:农用物资和农副产品流通贷款 |
金融机构:本外币涉农贷款新增额:农村基础设施建设贷款 |
金融机构:本外币涉农贷款新增额:农产品加工贷款 |
金融机构:本外币涉农贷款新增额:农业生产资料制造贷款 |
金融机构:本外币涉农贷款新增额:农田基本建设贷款 |
金融机构:本外币涉农贷款新增额:农业科技贷款 |
金融机构:本外币涉农贷款新增额:其他 |
金融机构:本外币涉农贷款新增额:农村贷款 |
金融机构:本外币涉农贷款新增额:农村贷款:农户贷款 |
金融机构:本外币涉农贷款新增额:农村贷款:农村企业及各类组织贷款 |
金融机构:本外币农村贷款新增额:农村企业及各类组织贷款:农村企业 |
金融机构:本外币农村贷款新增额:农村企业及各类组织贷款:农村各类组织 |
金融机构:本外币农村贷款新增额:农村农林牧渔业 |
金融机构:本外币农村贷款新增额:农田基本建设 |
金融机构:本外币农村贷款新增额:农产品加工 |
金融机构:本外币涉农贷款余额:总行 |
金融机构:本外币涉农贷款余额增速:总行 |
金融机构:本外币涉农贷款占各项贷款比重:总行 |
金融机构:本外币农林牧渔业贷款占各项贷款比重:总行 |
金融机构:本外币农村贷款占各项贷款比重:总行 |
金融机构:本外币农户贷款占各项贷款比重:总行 |
部分指标年份缺失
A股价崩盘风险扩展指数Stata代码和数据2000-2020年
中国分省分行业出口月度数据2010-2019年
stata多对多数据合并教程
我们在数据处理时,经常需要对文件进行横向合并,我们知道merge 1:1 varlist using filename [, options]可以进行一对一合并;merge 1:m varlist using filename [, options]可以进行一对多合并;merge m:1 varlist using filename [, options]可以进行多对一合并,然而在使用merge m:m varlist using filename [, options]进行多对多合并是有问题的,那么问题在哪?如何解决?这篇推文将会给大家解释清楚。
1.生成两个dta文件:
clear
input id str3 v1
1 “a”
1 “b”
1 “c”
1 “d”
1 “e”
end
save 1.dta, replace
clear
input id str3 v2
1 “d”
1 “e”
1 “f”
end
save 2.dta, replace
接着,我们将两个文件进行横向合并,可以看到,由于两个文件中id不是唯一识别的,属于多对多合并
2.直接用merge m:m横向合并数据
use 1.dta, clear
merge m:m id using 2.dta
drop _m
可以看到,直接使用merge m:m进行多对多合并时,第一,并不是1.dta的观测值分别对应2.dta的每一条观测值;第二,当某个文件的观测值少时,将会以该文件中的最后一条观测值对另一个文件中的观测值进行合并,如上图第4、5行。那么怎么得到我们想要的结果呢?
3.先扩展,再合并
整体思路是,把多对多合并变为一对多或多对一合并。首先,我们在1.dta中生成变量n,等于所在行行号,然后求出n的最大值,放在局部宏中,并保存为3.dta文件,程序如下:
use 1.dta, clear
bysort id: gen n = _n
sum n
local max = r(max)
save 3.dta, replace
这样,把id和n两个变量作为合并依据就变成唯一的了,可以看到,n最大值为5。接着在2.dta中,对数据进行扩充相应的倍数,即1.dta中变量n的最大值:
use 2.dta,clear
expand `max’
bysort id v2 : gen n = _n
sort n v2
扩充后的数据,id和n作为合并依据的话,每个都为3个,所以可以与3.dta进行多对一合并,程序和结果如下:
merge m:1 id n using 3.dta
order id v1
sort id v1 v2
drop n _m
实例演练
我们在做事件研究时,如果某个事件发生在上市公司停牌期间,我们往往需要把其剔除掉,那么首先,我们需要按照股票代码把事件列表和停复牌时间进行横向合并,由于同一个公司可能对应多个时间,也可能多次停牌,因此应该进行多对多合并,为了方便大家操作,我们手动生成一个事件列表:
clear
set more off
input Stkcd str15 date
000001 “2006-03-01”
000001 “2007-06-05”
000001 “2007-05-05”
000001 “2010-03-01”
000001 “2013-05-06”
000002 “2003-07-25”
000002 “2009-08-16”
000002 “2010-05-09”
end
save 事件列表,replace
我们截取Stkcd为000001和000002公司的停复牌日期
其中,startdate为停牌日期,enddate为复牌日期,合并之后,如果date,即时间发生日在停复牌时间之间,就剔除掉。
接下来,横向合并两个文件,程序如下:
use 事件列表, clear
bysort Stkcd : gen n = _n
sum n
local max = r(max)
save 事件列表1,replace
use停复牌,clear
expand `max’
bysort Stkcd startdate enddate : gen n = _n
merge m:1 Stkcd n using 事件列表1
keep if _m == 3
drop _m n
这样,每一个事件都对应所有的停复牌日期,接着将发生在停复牌的事件删除即可,程序如下:
gen date1 = date(date,”YMD”)
gen num = 1 if date1 >= startdate & date1 <= enddate
keep Stkcd date num
duplicates drop
sort Stkcd date num
bysort Stkcd date :carryforward num,replace
drop if num == 1
drop num