您当前所在的位置: 首页 -> 学术研究 -> 研究方向 -> 正文

《财经文本大数据基础数据库》项目

发布日期:2018-10-18   点击量:

《财经文本大数据基础数据库》目前主要基于国内报纸库(1998-2017年),经项目团队过去两年的努力,建成的以报纸为核心的数据库包括国内出版和发行的465份报纸,共约1300万篇文章,是国内最全最大的报纸库。经过两年多的持续投入,项目团队目前已经建成了以“经济政策不确定性指数”为主题的三套大数据搜索系统,在可以实现交互界面下的检索、计算和统计功能,为有监督的机器学习提供了操作上的可能性,在国内同类基础数据库中属领先位置。

项目团队始终秉承着实现数据库建设规范性、长期性和持续性这一发展理念,不断规范、完善、拓展“财经文本大数据”基础数据库。未来将在目前已有报纸库的基础上,尝试扩充“民国报纸文本库”、“政府官网报道和文件库”、“专业部门官网报道和文件库”、“商业网站文章与评论库”和“社交网络及论坛库”等内容,以期将其建设成为国际一流的财经类文本大数据的基础数据库,并以此打造和锻炼学术团队,提升学术研究水平和服务决策的能力。

版权所有: 中央财经大学-电子科技大学联合数据研究中心 地址:北京市海淀区学院南路39号 邮编:100081

京ICP备05004636号 京公网安备110402430071号