基于场景与对话结构的摘要生成研究
【摘要】:任务是从复杂的对话中提取关键信息来转化成简短的文本,以供用户快速浏览对话内容。相比于传统文本摘要,对话摘要数据一般具有篇幅较长、结构复杂等特点。传统的摘要模型很难充分的利用数据的长文本信息,并且无法考虑到对话的结构信息。对此,该文提出一种基于场景与对话结构的摘要生成方法。该方法是一种结合抽取和生成的摘要模型,以对话中的场景、角色和对话内容为主要信息生成对话摘要。首先通过对话解析,构建以角色、动作说明和会话为要素的对话结构图,并使用序列标注任务微调BERT预训练模型生成以对话句子为单位的向量表示,然后使用图神经网络建模对话结构,筛选出包含关键信息的句子。接下来将得到的抽取结果作为生成模型的输入,利用BART预训练模型作为基础框架,在编码端额外加入角色和场景信息,来丰富生成模型的语义特征。最后使用配备多头注意力机制的解码器生成摘要。实验结果表明,该方法与各基线模型相比,在ROUGE-1指标上最高可以提升5.3个百分点。
【相似文献】 | ||
|
|||||||||||||||||||||||||||||
|
|
|||||||
|
|
|||||||||||||||||
|
|
|||||||||||||||||||||||||||||||||||||||||
|