2020-07-14 17:12:58
在资本市场里,重磅新闻往往“一石激起千层浪。”但是大部分新闻并不重磅,却也可以从中获取蛛丝马迹的投资线索。
华尔街的金融机构已经引入机器人来观测市场热度和情绪。比如利用人工智能来监控媒体文章和社交网络,不但能够领先对手获得市场资讯,获得社交网络透露出的重要消息,还从定性的研究转向基于大规模数据的量化研究。
如今,中国的金融投资者也拥有了这样的投资武器。通联数据正在用人工智能从海量的新闻里挖掘出宝藏。
每天,通联数据都对大盘、行业、个股的新闻进行分析。来看看沪深300的新闻评分趋势,6月触底之后开始拉升,如果你看到了,在这波急拉的牛市中是否就不会踏空了?这种新闻评分趋势是不是能给市场走势提供一定的指引?
能做出这样分析的基础是依托于庞大的新闻数据库及领先的技术应用能力。
1 新闻库
通联数据新闻库覆盖了市场上的财经媒体、政府网站、微信公众号、大V观点等等,目前已有3000+个站点,日均入库新闻40000+篇,完全可以满足绝大部分客户对于金融资讯的需求。
在庞大数据库的基础上,提供更丰富的标签体系,并进行主体识别和事件识别,提供专门的新闻热度统计以及新闻主题数据。
如此数量级的新闻,用人力来阅读分析已无可能,机器正可以发挥作用。
2 情感识别
通联数据基于新闻文本内容,通过机器学习理解金融业务,判断语义情感。特色的情感算法可以准确识别新闻的情感倾向并给与量化打分,准确率达到84%。
对个股的舆情热度和情感趋势进行量化分析,可以让投资者对新闻舆情跟股价的关系有更清晰的把握。这个因子对于量化投资者也具有很高的参考价值。
这种及时筛选出的利好利空、热门新闻,对有负面舆情的股票和债券也可以起到预警的作用。
是否所有的新闻都可以用于新闻热度和情感的分析,比如同一条新闻,数十家媒体转载,是否需要去重?再比如行情类新闻,是否可以用来算上市公司的热度和情感?
这些细节都需要认真思考。即便是区分这种行情类的新闻,也需要不断迭代机器学习算法才能让分类更准确。这正是通联数据多年来一直在探索和积累的。
在科技的力量下,新闻的价值可以被深度挖掘。不但能辅助投资者进行基本面的研究,还可以构建舆情监控体系做投资风险控制,并基于新闻衍生的情感数据做量化因子。