托木斯克语言学家的神经网络将能够为新闻社撰写新闻
22.12.2020

托木斯克国立大学文学系人类语言学实验室的同事们研发了一种在线服务,用于自动分析和创建新闻文本“ WORLD2NEWS”。 它可以加快信息收集,新闻发布的速度,并解决新闻材料的可靠性问题。

信誉良好的媒体渠道的两个关键属性是响应能力和可信度,尤其是新闻。 众所周知,机器查找,处理,组合和重新检查信息的速度比人快很多倍,同时消除了事实错误。 也就是说,如果人工智能取代新闻的常规工作,那么新闻工作者作为具有分析和解释能力的创新单位的价值将显着增长,并且将有更多的时间来准备受版权保护的资料。

自主硕士课程“计算机与认知语言学”的实验室的同事和大学生共同研发一种在线服务,该服务能够使用神经网络和基于正式语法的语法解析器来创建和检查新闻。在对文本的结构特征进行语言学预分析,创建主题词典和形式语法的基础上,自动分析程序从非结构化文本中提取事实(谁,什么,什么地方,什么时候)并合成新闻标题。如果一个人至少花费5分钟来完成此操作,那么神经网络将花费几秒钟。

Выделение фактов

与大多数类似的程序不同,所创建服务的功能在托国立的青年学者的发展中要广泛得多。 例如,用户可以选择标题选项,该选项既可以由神经网络完全生成,也可以使用形式语法创建,这也可以形成新闻文本的样式。 WORLD2NEWS的优势在于其《BLEU-score》的准确性很高,因此生成的文本与新闻文本很相似。

《BLEU-score》是一种文本质量评估算法,已自动从一种自然语言转换为另一种自然语言。 翻译质量取决于机器与人类绩效之间的对应关系,机器翻译与专业人类翻译的意思越近越佳。

正如团队成员先前所说的那样,刚开始的在应用程序运作这一项目就像一个普通的大学生项目,但在其实施过程中,创建了很多的功能服务,该服务能够有效解决自动处理文本信息。

托国立文学系人类语言学实验室的同事安德烈·斯捷潘年科补充说:“到目前为止,“ WORLD2NEWS”是具有最小功能集的有效原型。在语法的优化和基于神经网络的新解决方案的开发,能够非常有效率的进行工作。”