• 2024-12-01【核心变量】上市公司企业异质机构投资者数据(专注型和临时型机构) 2006-2022年
    一、测算方式:参考《管理世界》王垒(2020)老师研究的做法,首先,考虑到机构投资者的治理能力,以举牌临界值5%为界限,筛选前十大股东中持股5%以上的机构投资者,定义为机构大股东,计算每个企业中机构大股东的持股比例,并按行业、年度中位数大小来确定机构大股东总体持股比例高低,若企业中机
  • 2024-09-28使用数据基础描述进行连续变量的特征提取
    在数据科学与机器学习的过程中,数据的描述性统计和时间特征工程是十分重要的环节。描述性统计有助于快速理解数据的分布情况,而时间特征则能从时间数据中提取出有意义的信息,如趋势和周期性,帮助模型提升预测能力。本教程将围绕如何利用描述性统计量和时间数据来创建特征,旨在帮
  • 2024-09-24Python中,你可以使用`scipy.stats`库中的`entropy`函数来计算两个连续变量之间的KL散度
    在Python中,你可以使用`scipy.stats`库中的`entropy`函数来计算两个连续变量之间的KL散度。这个函数计算的是两个概率分布之间的熵,即KL散度。以下是一个使用`scipy`计算KL散度的示例:首先,你需要安装`scipy`库(如果还未安装的话):```bashpipinstallscipy```然后,你可以使用以下代码