华芳教育网

当前位置: 首页 > 热点 >

AAAI,2020,清华大学,少次学习关系抽取,视频解读

时间:2020-01-26 20:42来源:互联网 作者:小狐

本文对清华大学孙茂松、刘知远团队完成、被 AAAI-20 录用的论文《Neural Snowball for Few-Shot Relation Learning》进行解读。 目前的关系抽取,面临着开放式的关系增长问题,目前已有有、半、少次学习和自启动关系抽取,这些方法涉及到了三种类型的数据:在已有关系类型上的大规模数据,对于新关系的少量标注数据,以及大规模的无数据。高天宇等人提出Neural Snowball,充分利用了这三种数据,进行关系抽取。

AAAI,2020,清华大学,少次学习关系抽取,视频解读(图1)

论文简介:

关系抽取(Relation Extraction)是自然语言处理当中的一个重要研究课题,其探究如何从文本中抽取结构化的关系事实。例如,从句子“比尔盖茨是微软的创始人”中,我们可以抽取出(比尔盖茨,创始人,微软)这样一个关系三元组,并用于知识图谱补全等下游任务中。

与关系抽取相关的工作有很多,但他们大多针对预定义的关系类型,即给定一个人为定义好的关系集合,在抽取时仅考虑集合内的关系类型。然而,我们面临着开放式的关系增长,随着新领域、新知识的出现,关系类型也在不断增多。因此,我们需要能够应对关系增长的关系抽取模型。

目前的研究当中,主要有以下几种关系抽取的场景,他们所针对的关系类型和利用的数据都有所不同:

有的关系抽取(Supervised Relation Extraction):其针对预定义的关系集合,使用大规模的数据。

半的关系抽取(Semi-Supervised Relation Extraction):其针对的也是预定义的关系集合,希望使用相对较少的数据,在大量无数据的帮助下,能够取得与有关系抽取类似的效果。

少次学习关系抽取(Few-Shot Relation Extraction):其针对的新的(没见过的)关系类型,通过在已有关系类型上的大规模数据预先训练,再快速迁移到新关系类型的少量数据上,达到少次学习的目的。

从上面的分析中可以看出,这些方法涉及到了三种类型的数据:在已有关系类型上的大规模数据,对于新关系的少量标注数据,以及大规模的无数据。我们希望能够充分的利用这三种数据:

AAAI,2020,清华大学,少次学习关系抽取,视频解读(图2)

如上图所示,Neural Snowball通过在已有关系上的大规模数据上训练距离度量(下文中会有详细阐述)迁移到新的关系类型上,利用新关系的少量数据作为启动种子,从大规模的无数据中挖掘有用信息,挖掘越多的有用信息,我们就能得到越好的关系抽取模型。

AAAI,2020,清华大学,少次学习关系抽取,视频解读(图3)

高天宇,清华大学本科四年级学生,清华大学自然语言处理实验室成员,导师刘知远。其主要研究方向为自然语言处理当中的关系抽取问题,在人工智能和自然语言处理领域的国际会议AAAI、EMNLP上发表过多篇文章。同时他也是开源工具包OpenNRE的主要。

本文相关词条概念解析:

关系

关系是指人与人之间,人与事物之间,事物与事物之间的相互联系。市场营销中的关系是指精明的市场营销者为了促使企业交易成功而与其顾客、分销商、经销商、供应商等建立起长期的互利互信关系。它促使市场营销者以公平的价格,优质的产品,良好的服务与对方交易,同时,双方的成员之间还需加强经济,技术及社会等各方面的联系与交易。人际关系是人与人之间在活动过程中直接的心理上的关系或心理上的距离。人际关系反映了个人或群体寻求满足其社会需要的心理状态,因此,人际关系的变化与发展决定于双方社会需要满足的程度。人在社会中不是孤立的,人的存在是各种关系发生作用的结果,人正是通过和别人发生作用而发展自己,实现自己的价值。关系可分为正式关系和非正式关系,非正式关系较正式关系更为古老和普遍。现代管理理论的奠基人巴纳德指出,即使在正式的组织中,个体仍然是社会人。自20世纪30年代以来,在包括政治学、社会学、经济学及管理学等众多学科中,关系的非正式性受到了越来越多的重视。关系的内涵在中西方有所不同,西方特意用Guanxi(relationship)一词来描述中国式的关系。

网友评论

相关文章