国内优秀的论文数据网站(提供数据代查、代找、代整理服务等)

汤森路透ESG 2022-2007年 上市公司esg争议分歧数据、Refinitiv

yih阅读(290)

汤森路透ESG 2022-2007年 上市公司esg争议分歧数据、Refinitiv

 
 指标:Stkcd        Year        ESGScore         EnvironmentPillarScore        SocialPillarScore         GovernancePillarScore        ESGControversiesScore(争议评分)        ESGCombinedScore(考虑ESG争议后的esg评分)
 
说明:1.5万个样本,非空观测值在4000多个,近上千家企业,面板数据可以直接使用,2007-2010年等早期年份由于有的企业未公布,因此缺失值较多

A股上市公司研发总投入、研发资本化投入、研发费用化投入数据2016-2022年

yih阅读(198)

A股上市公司研发总投入、研发资本化投入、研发费用化投入数据2016-2022年

如下:

代码 名称 year 研发合计 研发费用化 研发资本化 营业收入 资产总计
000063 中兴通讯 2016 12762100000 11314800000 1447300000 101233182000 141640910000
000063 中兴通讯 2017 12962200000 11346600000 1615600000 108815273000 143962215000
000063 中兴通讯 2018 10905600000 2011900000 85513150000 129350749000
000063 中兴通讯 2019 12547900000 2272600000 90736582000 141202135000
000063 中兴通讯 2020 14797000000 2242400000 101450670000 150635000000
000063 中兴通讯 2021 18804000000 1806500000 114521641000 168763000000
000063 中兴通讯 2022 21602300000 1821400000 122954418000 180954000000

上市公司企业探索式创新战略测算数据2001-2022年

yih阅读(167)

上市公司企业探索式创新战略测算数据2001-2022年

参考C刊《研究与发展管理》方鑫(2023) 的研究

第一,根据对探索的定义,从企业年报中提取提取关键词,表征探索式创新战略关键词包括探索、搜索、变化、冒险、试验、灵活性、发掘、革新。

第二,使用 Python3.8 对企业年报进行导入分析,关键词频率次数的总和是对探索式创新战略的衡量。

第三,对词频次数取自然对数。即探索式创新战略=对探索式创新名词出现的总频次取自然对数。

指标:股票代码        统计年度        探索        试验        搜索        变化        冒险        灵活性        发掘        革新        探索式创新战略总词频        探索式创新战略
范围:5156家企业,5.3万个样本,包括原始数据和最终测算结果,原始数据来源于上市公司年报 
参考文献:
方鑫,董静,彭兴越.高管团队能力共享度的维度与组合对企业绩效的影响研究——基于探索式创新的中介作用[J].研究与发展管理

沪深交易所上市公司企业绿色管理创新数据2008-2022年

yih阅读(324)

沪深交易所上市公司企业绿色管理创新数据2008-2022年

参考C刊《经济管理》席龙胜(2022)

将绿色管理创新设计五个指标进行衡量。 考虑到数据可得性,上市公司环境监管与认证
披露情况中列示的是否通过 ISO14001 认证、是否通过 ISO9001 认证,上市公司管理披露情况
中列示的环保管理制度体系、环保教育与培训、环保专项行动,通过加总获得综合得分作为企业绿色管理创新的代理指标。
范围:包括原始数据、计算结果
参考文献:席龙胜,赵辉.高管双元环保认知、绿色创新与企业可持续发展绩效[J].经济管理,2022,

year 证券代码 日期 是否通过ISO14001认证 是否通过ISO9001认证 环保管理制度体系 环保教育与培训 环保专项行动 绿色管理创新X

【更新】Fama-French五因子模型数据stata代码结果2000-2022年

yih阅读(560)

Fama-French五因子模型数据stata代码结果2000-2022年

  • 数据区间:2000-2022年(原始数据区间1990-2022年)
  • 数据格式:dtaStata 14/15/16/17
  • 备注:2023年7月更新到最新到22年年度数据。
  • 无风险利率采用一年期定期存款利率
  • 市值指标选择流通市值(根据需要可以修改)
  • 市场回报率采用流通市值加权平均法计算,考虑现金红利再投资的综合月度市场回报率(数据里有几种可供选择)
    232634zl99rdgsefes9lkg.png
  • 月个股回报率使用考虑现金红利再投资的月个股回报率

 


数据处理说明


 

  • 规范信息披露制度下上市公司年度财务报表一般在次年3、4月份公布,且在一季度财务报表公布之前披露,即4月底为年报披露截止期。财务报表信息披露的滞后性造成金融数据库中财务数据与市场数据的时间不一致,即t年末的财务数据因年报公布的滞后性在t+1年4月份披露财务报表时才得到更新。因此选取t年5月至t+1年4月作为组合构建周期。
  • 市场类型选择:全部A股,包括沪深主板、中小板和创业板
  • 剔除IPO后前六个月的数据(包括上市月)  (以下筛选条件根据自己需求修改)
  • 剔除ST(特别处理)、*ST(退市风险警示)、PT(特别转让)股票
  • 剔除金融行业股票
  • 剔除账面价值为负的股票
  1. * 中国A股市场所有股票, 包括沪深主板、中小板和创业板 科创板
  2. * 市场类型数值含义: 1=上海A,2=上海B,4=深圳A,8=深圳B,  16=创业板, 32=科创板。
  3. keep if inlist(市场类型, 1, 4, 16, 32)
  4. * 选择2000-2021年数据
  5. keep if year>=2000 & year<=2021
  6. * 剔除IPO后前6个月的数据(包括上市月)
  7. gen month_gap=m-上市月份
  8. drop if month_gap<6
  9. * 剔除ST、*ST、PT
  10. drop if 是否ST或PT==1
  11. * 剔除金融类股票
  12. drop if regexm(行业代码C, “J”)
  13. * 删除账面价值为负的股票
  14. drop if 账面价值<0

复制代码



  • 中国股市中市值最小的 30% 的上市公司会受到壳价值污染的严重影响,所以剔除市值最小的30%

 


参考文献


 

  • 李志冰, 杨光艺, 冯永昌,等. Fama-French五因子模型在中国股票市场的实证检验[J]. 金融研究, 2017
  • 赵胜民, 闫红蕾, 张凯. Fama-French五因子模型比三因子模型更胜一筹吗——来自中国A股市场的经验证据[J]. 南开经济研究, 2016
  • Liu J , Stambaugh R F , Yuan Y . Size and Value in China[J]. Journal of Financial Economics

 


分组指标


 

  • 规模指标(Size):第t-1年12月底的流通市值作为规模指标;
  • 账面市值比(BM):第t-1年末的账面价值,除以第t-1年12月底股票i的流通市值
  • 利润(OP): 第t-1年末的营业利润 /股东权益合计
  • 投资风格(Inv):用第t-1年末相对于第t-2年末的总资产增加额,除以第t-2年末的总资产

 


因子构建(2×3分组)




  • 规模的分组点为中位数,前50%为小规模组(S,Small),后50%为大规模组(B,Big)
  • 账面市值比的分组点都为第30个和第70个百分位数,前30%为低账面市值比组(L,Low),中间40%为中账面市值比组(N,neural),后30%为高账面市值比组(H,High)
  • 将市值和账面市值比两个指标交叉, 可把全体股票分成SH、SN、SL、BH、BN、BL 六个组合
  • 分别以营运利润率和投资风格代替账面市值比,重复上述步骤, 可把全体股票分成 SR、SN、SW、BR、BN、BW、SC、SN、SA、BC、BN、BA 这12个组合, 其中营运利润率前30%为盈利疲软组(W,weak),中间40%为盈利中等组(N,neural),后30%为盈利稳健组(R,robust);投资前30%为投资保守组(C,conservative),中间40%为投资中等组(N,neural),后30%为投资激进组(A,aggressive),接下来计算上述各组合每一期的市值加权平均收益率;
  • 最后, 利用不同组合收益率之差构造四个因子。

2333061ml6xhnmhaxlaqlz.png

  • 分25组回归的时候计算组合收益率采用流通市值加权平均法计算的组合收益率

 


表格展示




Fama-French五因子25组投资组合收益率,并用Newey-West t统计量检验市值最小组和最大组的差异


五因子描述性统计  


五因子相关性分析

利用其他四个因子回归解释第五个因子


RMW与SMB的相关系数高达0.580,RMW与CMA的相关系数高达0.607,而且RMW用其他四个因子的解释程度达到0.712,所以正交化利润因子RMWO替代利润因子RMW,进行后续的回归分析。

GRS检验结果
其中A|a|, 为第 i 个股票组合回归截距项的绝对值


分25组回归Stata生成结果表


Fama-French五因子分25组回归结果(Excel已设置好公式,只需要Stata生成的结果复制进去可以自动生成表格,标注星号,方便快捷)

 

上市公司审计关系错配stata代码与数据计算结果2000-2022年

yih阅读(382)

审计关系错配指的是规模较大事务所审计小企业客户,规模较小事务所审计大企业客户。学术界在对审计关系错配进行衡量时,大多将排名前八的会计师事务所作为规模较大事务所,其他则划归为规模较小事务所,然后用大所审计大客户及小所审计大客户进行具体度量。因此,若排名前八的会计师事务所审计小规模客户,则取值为1,否则取值为0;若非八大事务所审计大规模客户,则取值为1,否则取值为0。
公司规模依据营业收入分行业分年度排序,前三分之一为大规模客户,后三分之一为小规模客户。

变量名称 变量符号 变量含义
大规模事务所(审计师声誉) Big8 八大事务所,取值1,否则为0
大所审计小客户 BS 八大事务所审计小规模客户,取值为1,否则为0
小所审计大客户 SB 非八大事务所审计大规模客户,取值为1,否则为0

文献

 



陈娇娇, 方红星. 审计关系错配、盈余质量与整合审计收费[J]. 审计与经济研究

 

 

A股公司独立董事履职行为数据包含独董参会率 投非赞成票数据+do代码2004-2022年

yih阅读(281)

A股公司独立董事履职行为数据包含独董参会率 投非赞成票数据+do代码2004-2022年

变量 变量符号 变量含义
独董亲自参会率 AATT 当年董事会中所有独立董事亲自出席会议次数占会议总数比例的平均值
独董委托参会率 PATT 当年董事会中所有独立董事委托出席会议次数占会议总数比例的平均值
独董最小亲自参会率 MATT 当年董事会中所有独立董事亲自出席会议次数占会议总数比例的最小值
独董最大委托参会率 MPATT 当年董事会中所有独立董事委托出席会议次数占会议总数比例的最大值
独董是否勤勉 ATT 若当年董事会中所有独立董事亲自出席会议次数占会议总数的比例均大于2/3,取值为1,否则取值为0
独董意见字符数 NOW 对当年董事会中所有独立董事发表意见的字符总数/发表意见次数取自然对数
意见中勤勉字符次数 NDILI 当年董事会中所有独立董事发表意见中勤勉字符出现的次数/发表意见次数
投过非赞成票 NEG 若当年董事会中任一独立董事发表过同意以外的其他意见,取值为1,否则取值为0

 

独立董事意见中勤勉字符的范畴

检查 核实 不符合 错误 疑虑 尽快 谨慎 加强
了解 清查 不完整 缺失 隐患 杜绝 必须 调整
审核 调查 不足以 失控 缺陷 审慎 努力 完善
询证 问询 未及时 批评 失效 切实 认真 增强
审查 审议 不详细 瑕疵 严格 积极 彻底 强化
审阅 督促 不作为

 

参考文献


[1]史春玲,孙耀东.董事高管责任保险与独立董事履职行为研究[J].金融监管研究,2021(06):37-52.

[2]史春玲.独立董事出席会议与发表意见:合规性履职还是有效性履职[J].财会月刊,2020(14):122-129.

数据说明


全部A股2004-2022年数据


最后结果包含三个版本:
1、未剔除金融未剔除ST未缩尾处理版本
2、剔除金融剔除ST未缩尾处理版本
3、剔除金融剔除ST缩尾处理版本

解雇
QQ截图20230927182101.jpg

 数据量
QQ截图20230927181828.jpg

缩尾后描述性统计
QQ截图20230927182309.jpg

相关性分析
QQ截图20230927182355.jpg

A股机构交叉持股对企业价值影响实证分析数据和do代码2007-2022年

yih阅读(249)

  • 机构交叉持股指标数据的计算
  • 常用控制变量指标数据计算
  • 基础结果:描述性统计、固定效应模型回归
  • 如何对缺失值和异常值处理(缩尾处理)
  • 输出表格结果
  • 学习到论文实证分析中常用的命令(merge、esttab、winsor2等)
  • 建议先下载文献看看,有需要可以下载系统学习,其他相关主题的论文可速成


实证设计



变量定义

变量符号 变量名称 变量定义
Tobin 企业价值 Tobin=(流通股股数×每股价格+非流通股股数×每股净资产+总负债)/总资产
CrossDum 机构交叉持股哑变量 在季度上,机构投资者持有本企业及同行业企业的股份数量与流通股股数的比例大于等于5%,则取值为1,否则为0
LnNumCon         交叉平均企业数 1加上与该企业共同的机构大股东所持有同行业同季度的平均企业数量的自然对数
LnAvgNum         交叉平均持股比 1加上与该企业共同的机构大股东所持有同行业同季度的企业平均持股比的自然对数
TotalCross         总交叉持股比 所有交叉持股机构在该企业的持股比例之和
Size         企业规模 企业总资产的自然对数
Age         上市年限 企业上市年限的自然对数
Cash 现金比率 现金及现金等价物/总资产
Lev 负债率 总负债/总资产
Roe 净资产收益率 净利润/所有者权益
Capex 资本支出 (经营租赁所支付的现金+购建固定资产、无形资产和其他长期资产支付的现金—处置固定资产、无形资产和其它长期资产而收回的现金净额)/总资产
Growth 成长能力 (期末营业收入—上期营业收入)/上期营业收入
Soe 产权性质 国有企业取值为1,否则取0
Board         董事会规模 董事会人数的自然对数
Indep         独立董事占比 独立董事人数/董事会人数
Dual         是否二职合 如果董事长和总经理同为同一人,取值为1,否则取0
First         第一大股东持股比 第一大股东持股比例
InstOwn 机构投资者持股比 机构投资者持股比例之和
BlockDum 机构大股东哑变量 如果机构投资者持股超过10%,则是企业的大股东,取值为1,否则为0

为了缓解机构交叉持股与企业价值之间可能存在的内生性问题,本文将核心解释变量和所有控制变量滯后一期,并且控制了企业固定效应(Firm)和年份固定效应(Year),同时将估计系数的标准误聚类到企业层面。

165621ww1j9imkk2i3235m.jpg

参考文献

[1]周泰云, 邢斐, 姚刚. 机构交叉持股对企业价值的影响[J]. 证券市场导报, 2021.

数据说明


本文选择2007- 2022年中国A股上市公司作为初始研究样本,。对初始样本进行了如下处理:
剔除金融类上市公
剔除ST、*ST类上市公司
剔除关键变量缺失的样
为了减轻极端值对回归结果的影响,对所有连续型变量在上下1%分位进行了缩尾(winsorize)处理。

数据

QQ截图20230713143916.jpg

描述性统计
QQ截图20230713143659.jpg


回归结果

QQ截图20230713143717.jpg

稳健性检验

QQ截图20230713143737.jpg

QQ截图20230713143947.jpg QQ截图20230713143959.jpg

易获数据 论文数据获取 更专业 更方便

联系我们今日数据