上市公司管理层短视数据2001-2020年 文本分析和机器学习
数据介绍语言能够反映人的认知、 偏好和个性(Webb et al., 1966) , 研究者可通过分析实验对象语言中使用的词语类型和词频来捕捉人的特质(Miller and Ross, 1975; Pennebaker et al.,2003) 。 如一个人的语言中越强调“过去”、 “曾经”等词汇, 反映其越关注过去; 一个人的语言中越强调“将来”、 “可能”、 “要去”等词汇, 反映其越关注未来(Pennebaker et al., 2003) 。基于此研究范式, 我们以中国 A 股上市公司年报的 MD&A 为对象, 在 Brochet 等(2015)的基础上, 通过文本分析(Li, 2010) 和机器学习技术确定中文“短期视域”词集, 然后采用词典法构建出管理者短视主义指标。 通过实际对比法、 内部一致性信度检验、 差异分析法以及经济后果检验法, 我们验证了该指标有效捕捉了管理者内在的短视主义特质。 通过方差分解检验, 我们进一步排除了该指标反映的是受外界压力驱动的短视。 为了促进知识的积累和传播, 我们决定公开原始词集和指标数据, 供大家使用。 本数据囊括了中国沪深两市2001-2020 年所有 A 股上市公司。
参照:“胡楠,薛付婧,王昊楠(2021). 管理者短视主义影响企业长期投资吗?——基于文本分析和机器学习[J].管理世界, 37(05):139-156+11+19-21.”
评论前必须登录!
注册