)
数据核心速览数据编号2335时间跨度2000–2025覆盖范围全国地级市数据来源地级市政府工作报告全文本测算方法CNN 深度学习文本分类数据格式Excel 标准面板文献对标田子方等《宏观经济研究》2025 指标构建逻辑可直接写入论文文本预处理分句、分词、Word2Vec 向量化样本标注随机抽取 2000 条句子人工标注风险句模型训练按 3:1:1 划分训练 / 验证 / 测试集训练 CNN 分类模型风险测度政府风险感知 风险句子数 / 报告总句子数数值越大代表地方政府对经济与发展风险的关注度与警惕性越高。 核心字段所属省份省份代码城市名称城市代码年份报告总句子数风险句子数政府风险感知 适用研究方向政府风险感知对企业创新、投资、杠杆、现金持有的影响风险态度与财政支出、政策力度、宏观调控的传导机制地区发展水平、产业结构、制度环境下的异质性分析政策不确定性、经济波动、地方治理与微观主体行为固定效应、中介效应、调节效应、空间计量等实证时间跨度2000-2025区域跨度全国地级市数据格式Excel形式数据简介“政府风险感知”是基于文本分析方法构建的量化指标旨在刻画地方政府对宏观经济与发展风险的主观认知程度。该指标以政府工作报告为信息载体通过识别报告文本中与风险相关的表述为研究政府行为、政策取向及其经济后果提供可量化的实证基础。基于此数据集可系统开展以下研究一是检验政府风险感知对企业创新、投资决策等微观行为的影响二是分析政府风险认知通过政策调控、财政支出等渠道影响宏观经济运行的机制三是探讨在不同地区发展水平、产业结构及制度环境下政府风险感知的异质性表现及其经济后果。本数据集参考田子方等2025发表于《宏观经济研究》的论文《风险感知与企业创新——来自政府工作报告的文本分析发现》通过Python建立卷积神经网络对中国地级市的份政府工作报告构建政府风险感知指标。具体步骤如下①将报告文本进行分句、分词同时建立Word2Vec模型将分词转化为数字向量。②从分句数据集中随机抽取2000条分句作为样本数据集并进行人工标注。③将标注样本按照3:1:1的比例随机分为训练集、验证集和测试集使用Python的keras库构建卷积神经网络模型对标注样本进行训练同时不断调整模型超参数选择在测试集上分类精确率precision最高的模型对总体数据集进行文本分类。④用“报告i中表征风险的句子数占报告i句子总数的比值”来衡量政府风险感知程度。数据指标所属省份所属省份代码城市名称城市代码年份报告中句子总数报告中表征风险的句子数政府风险感知数据展示参考文献[1] 田子方, 杨依婷, 付家秀. 风险感知与企业创新——来自政府工作报告的文本分析发现[J]. 宏观经济研究, 2025, (08): 107-124127.