《上市公司年报文本数据标签数据库》项目负责人、中央财经大学经济学院副教授金星晔与中国农业大学经济管理学院方明月等合作撰写论文“企业数字化转型的测度难题:基于大语言模型的新方法与新发现”,该论文主要依托《上市公司年报文本数据标签数据库》等数据资料,在核心期刊“经济研究”发表。金星晔教授是该论文的第一作者,中央财经大学是第一作者单位。
论文主要内容:
社会各界关于企业数字化转型的重要性已经基本达成共识,但对企业数字化转型的效果存在严重分歧.产生这一现象的主要原因是现有研究对企业数字化转型的测度存在问题:一是测度对象不够统一明确,二是测度方法不够科学准确.这导致很多研究结论不可比较、难以复制和相互冲突.为了更好地处理上述难题,本文运用机器学习和大语言模型构造一套新的企业数字化转型指标.本文首先对2006-2020年上市公司年报中的句子进行人工打标签,然后用标记结果训练和微调包括大语言模型在内的多个机器学习模型,选择其中分类效果最好的ERNIE模型作为句子分类模型来预测全部文本中句子的标签,最终构造了企业数字化转型指标.理论分析和数据交叉验证均表明,本文构建的指标相对已有方法更准确.在此基础上,本文实证检验企业数字化转型对财务绩效的影响.研究发现:第一,企业数字化转型能够显著提高财务绩效,其中,大数据、人工智能、移动互联、云计算和物联网均有明显作用,但区块链并没有明显的作用;第二,只有在财务绩效较差的企业中,数字化转型才能够显著提高财务绩效;第三,企业数字化转型提高财务绩效的主要渠道包括改善效率和降低成本.本文研究对于推动企业数字化转型和实现经济高质量发展具有一定现实意义.

《上市公司年报文本数据标签数据库》简介:
包括2006-2023年披露的上市公司年报数据,通过标注句库方法,对上市公司数字化转型情况进行标签,具体包括:1)数字技术标签:分为八类,即大数据、人工智能、云计算、移动互联、物联网、区块链、非六类数字技术和非数字技术。2)数字技术使用现状标签:判断这项技术是否已经在公司落地使用了,而非是计划在未来使用。3)数字技术使用环节标签:判断企业在什么环节使用了数字技术。环节的标签分为生产、供应链、销售、公司治理、研发、其他、无法判断。