1988-2025年上市公司知识多元化数据
本数据集基于中国创业板上市公司专利数据采用信息熵方法构建企业层面的知识多元化指数。数据涵盖1988—2025年期间使用了1048575条公司-专利观测值。数据集核心指标包括股票代码申请年份公司简称知识多元化指数TD。知识多元化指数基于专利IPC主分类号采用Teachman熵指数法测度原始计算公式为其中 pj 为属于主分类 j 的专利数占企业当年专利总数的比例。由于该原始公式恒为非正值TDraw≤0为符合信息熵的非负性习惯并便于实际应用本数据集将TD定义为原始值的绝对值即其数值范围在0,lnn之间值越大表示企业知识基础越广泛、技术布局越多元。基于本数据集研究者可从以下三方面展开系统分析一是风险投资与知识多元化的交互效应研究将知识多元化指数与CVC、IVC等风险投资变量匹配检验知识多元化在不同类型风险投资与企业韧性之间的调节作用揭示“耐心资本”如何通过知识基础影响企业应对不确定性的能力二是知识多元化对双元创新的差异化影响利用知识多元化指数与探索式创新、利用式创新指标进行交互分析考察知识宽度对CVC和IVC创新促进效应的调节方向与强度验证“知识多元化是一把双刃剑”的理论假设三是知识多元化与企业绩效的关联研究结合全要素生产率、销售收入增长率等韧性指标分析知识多元化对企业抗风险能力与成长韧性的直接效应及间接机制并探究地区、产权性质、环境不确定性等情境因素的异质性影响为创业企业技术战略选择提供实证支撑。本数据集的核心指标“知识多元化指数TD”严格遵循李玉花等2024及田丹等2025的测度方法采用基于IPC主分类的Teachman熵指数法构建。首先从智慧芽全球专利检索数据库获取创业板上市公司的专利数据提取每条专利的IPC主分类号、申请年份并清洗异常值与缺失值。随后利用Python编写程序按股票代码和申请年份分组统计每个IPC主分类下的专利数量Pj以及该企业当年的专利总数P计算占比 pjPj/P。最后根据熵指数公式 TD−∑pjlnpj 计算知识多元化指数并将结果输出为Excel格式的数据表。数据信息数据来源上市公司年度报告时间跨度1998-2025数据范围上市公司数据格式excel形式数据字段股票代码申请年份公司名称公司简称TD数据展示参考文献[1] 李玉花 李丹丹 孙国栋. 企业知识多元化、技术溢出与创新绩效——基于中国制造业上市公司的实证研究[J]. 管理世界 2024, 40(2): 112-128.[2] 田丹 丁宝 刘芙蓉. “耐心资本”赋能新创企业韧性企业风险投资和独立风险投资的差异化作用[J]. 中国工业经济 2025, (7): 156-173.[3] Hoang K, Pham L, Ha O K, et al. Firm-level climate change risk exposure and firm efficiency[J]. International Review of Economics Finance, 2025, 101: 104220.[4] Tong Z, Tan Z. Artificial intelligence and climate risk: Toward sustainable development within a Double Helix framework[J]. Technological Forecasting Social Change, 2026, 226: 124592.下载→方式一推荐主页 *个人* 简介经管数据集-CSDN博客方式二数据下载方式汇总-CSDN博客