收藏本站
收藏 | 投稿 | 论文排版

文档智能:数据集、模型和应用

崔磊  徐毅恒  吕腾超  韦福如  
【摘要】:文档智能是指通过计算机进行自动阅读、理解以及分析商业文档的过程,是自然语言处理和计算机视觉交叉领域的一个重要研究方向。近年来,深度学习技术的普及极大地推动了文档智能领域的发展,以文档版面分析、文档信息抽取、文档视觉问答以及文档图像分类等为代表的文档智能任务均有显著的性能提升。该文对于早期基于启发式规则的文档分析技术、基于统计机器学习的算法以及近年来基于深度学习和预训练的方法进行简要介绍,并展望了文档智能技术的未来发展方向。

知网文化
【相似文献】
中国期刊全文数据库 前19条
1 朱俊杰;;让演示文档自动动起来——PowerPoint文档自动播放两法[J];电脑应用文萃;2003年03期
2 日月光;;文档打印预览也编辑[J];电脑迷;2005年15期
3 高秀霞;;Office 2007实用新技[J];电脑迷;2007年08期
4 宋连党;;文档只打印部分内容[J];电脑爱好者(普及版);2007年02期
5 贾培武;;文档起死回生术[J];电脑爱好者(普及版);2007年12期
6 北运河畔;;漂亮封面Word来做[J];电脑爱好者(普及版);2008年12期
7 相逢一笑;;嘘,偷偷使用“最近打开的文档”功能[J];电脑迷;2008年07期
8 宋连党;;打印多份 不必每次设定[J];电脑爱好者(普及版);2008年04期
9 鱼腥草;;换个思路解决小问题[J];电脑迷;2008年18期
10 王志军;;简单解决文档保护的限制问题[J];电脑迷;2008年20期
11 曹春华;;机密文档 看完就消失[J];电脑爱好者;2009年01期
12 贾培武;;有选择删除Word最近文档记录[J];电脑爱好者;2009年15期
13 白云;;新建文档方法多[J];电脑爱好者(普及版);2010年02期
14 高密;张莉;;U盘装不下 PPT瘦瘦身[J];电脑爱好者(普及版);2010年08期
15 赵毅仙;;图片插入文档不走弯路新解[J];电脑爱好者;2012年04期
16 王昌红;;二招搞定文档的重复内容[J];电脑爱好者;2013年14期
17 GJZ;;用好新版WPS Office iOS版文档漫游[J];电脑迷;2014年02期
18 饭饭;;Word锁定最常用的文档[J];电脑迷;2015年10期
19 老万;;如何自动纠正文档里面字母的大小写[J];电脑爱好者;2017年02期
中国重要会议论文全文数据库 前20条
1 王洪俊;施水才;俞士汶;肖诗斌;;跨语言文档对齐[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
2 李旭;余靖;;一种基于提取指纹方法的数字文档拷贝检测模型[A];2005年全国理论计算机科学学术年会论文集[C];2005年
3 黄海源;郑德权;赵铁军;;面向特定领域的多文档文摘技术研究[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
4 贺振;;文档安全加密技术研究[A];电力行业信息化优秀论文集2014——2014年全国电力行业两化融合推进会暨全国电力企业信息化大会获奖论文[C];2014年
5 马庆;;基于安卓系统的文档预览功能的设计与实现[A];《采油工程文集》2016年第1辑[C];2016年
6 何婷婷;许婷;瞿国忠;涂新辉;;基于主题词对的文档重排方法[A];第三届学生计算语言学研讨会论文集[C];2006年
7 赵培翔;张铭;杨冬青;唐世渭;;数字化文档元数据的自动提取[A];第二十届全国数据库学术会议论文集(研究报告篇)[C];2003年
8 王鹏飞;洪晓光;;基于XML大文档的动态索引[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
9 李伟;;文档的标准化在MIS系统建设中的重要意义[A];中国烟草行业信息化研讨会论文集[C];2004年
10 李岷;胥正川;宫学庆;周傲英;;XML文档的更新[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
11 韩哲;王宏志;高宏;李建中;骆吉洲;;基于聚簇的XML文档近似连接方法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
12 秦兵;刘挺;李生;;基于子主题的多文档文摘[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
13 余军;杨建武;陈晓鸥;;一种与TDT结合的增量多文档摘要方法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
14 李玲晓;伍淳华;;基于结构特征的恶意PDF文档检测[A];第十届中国通信学会学术年会论文集[C];2014年
15 岳昆;胥正川;周傲英;宫学庆;;用以更新XML文档的注释技术[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
16 曹慧;;一种xml文档相似性距离的计算方法[A];山东省计算机学会2005年信息技术与信息化研讨会论文集(一)[C];2005年
17 陈峰;张欣;乐嘉锦;;EKS:XML文档上的关键字查询[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
18 周博;岑荣伟;刘奕群;张敏;马少平;;相关反馈任务中一种基于文档相似度的检索结果重排序方法[A];第五届全国信息检索学术会议论文集[C];2009年
19 张硕;李建中;王宏志;何震瀛;;基于扩展编码的在线XML文档加载机制[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
20 白鹏;胡影;戴方芳;;基于shellcode检测的恶意文档检测[A];第十九届全国青年通信学术年会论文集[C];2014年
中国博士学位论文全文数据库 前20条
1 姚志强;普适计算模式下的文档组合与安全研究[D];西安电子科技大学;2014年
2 李斓;面向XML文档的访问控制研究[D];中国科学院研究生院(软件研究所);2004年
3 李旭;基于指纹和语义知识表示的中文文档复制检测方法[D];燕山大学;2010年
4 姚原岗;异质工程文档语义检索的若干问题研究[D];浙江大学;2012年
5 王海林;面向文本数据的关系抽取关键技术研究[D];电子科技大学;2022年
6 马飞;复杂场景下的行人重识别关键技术研究[D];武汉大学;2019年
7 刘皓;基于深度学习的行人再识别问题研究[D];合肥工业大学;2017年
8 王建培;聚类有效性分析及其在电学层析成像中的应用[D];天津大学;2017年
9 杨勋;跨视域行人再识别若干问题研究[D];合肥工业大学;2017年
10 刘健;实体检索的理论与关键技术研究[D];国防科学技术大学;2014年
11 马海涛;Active XML数据管理基础问题研究[D];哈尔滨工业大学;2009年
12 申彦;大规模数据集高效数据挖掘算法研究[D];江苏大学;2013年
13 李炳龙;文档碎片取证关键技术研究[D];解放军信息工程大学;2007年
14 袁鑫攀;基于minwise哈希的文档复制检测的研究及应用[D];中南大学;2012年
15 闫茜宇;基于有缺陷数据集的深度语义分割与目标跟踪算法研究[D];清华大学;2021年
16 吴迪;软件知识与数据联合驱动的API文档挖掘研究[D];武汉大学;2021年
17 宁博;XML查询模式匹配及文档过滤技术研究[D];东北大学;2009年
18 钱鹏江;大规模数据集聚类方法研究及应用[D];江南大学;2011年
19 吴昊;基于合成数据集的图像处理深度学习方法研究[D];兰州大学;2021年
20 吴国清;科学计算时变数据集的数据挖掘算法研究[D];中国工程物理研究院;2009年
中国硕士学位论文全文数据库 前20条
1 常小萌;复合文档辅助生成方法的研究与开发[D];清华大学;2005年
2 张晨;基于角点检测的自然场景文档定位算法研究[D];武汉理工大学;2020年
3 袁佳彬;文档语义表示方法研究及应用[D];杭州电子科技大学;2019年
4 郭江林;文档链接网络的词语义表示学习和主题发现研究[D];河北地质大学;2022年
5 苏亚维;基于知识的文档相似性分析技术研究[D];中国电子科技集团公司电子科学研究院;2020年
6 张锋;文档分享系统的优化与实现[D];华南理工大学;2013年
7 袁险峰;用于机器翻译文本输入的文档分析系统的设计与实现[D];中国科学院研究生院(计算技术研究所);1997年
8 闫小龙;文档复制计算机辅助检测系统的研究与实现[D];太原理工大学;2008年
9 张志涛;基于参考文档的信息检索模型的研究[D];哈尔滨工业大学;2010年
10 沙丽华;面向领域文档的语义标注方法研究[D];吉林大学;2009年
11 李旭;基于串匹配方法的文档复制检测系统研究[D];燕山大学;2006年
12 赖海明;互联网文档分享平台设计与实现[D];厦门大学;2013年
13 李雪飞;文档安全系统的设计与实现[D];西安电子科技大学;2012年
14 王艳春;程序理解中文档生成技术的研究[D];浙江工业大学;2007年
15 冯帅;基于组合特征的文档图片检索技术研究[D];上海交通大学;2019年
16 陈文标;文档分享平台的研究与实现[D];华南理工大学;2012年
17 廖联军;基于内容的商务文档存储管理技术研究[D];北方工业大学;2009年
18 张小丽;面向基础教育的多端文档分享平台设计与实现[D];山东大学;2020年
19 孙瑞瑞;面向科研协作的文档协同编辑平台设计与实现[D];山西大学;2016年
20 何婕;人机协同场景下的文档生成研究[D];华东师范大学;2021年
中国重要报纸全文数据库 前20条
1 ;用好腾讯文档,协作办公无难事[N];电脑报;2021年
2 本报记者 邱燕娜;慧点科技五大技术为重要文档筑起安全防线[N];中国计算机报;2014年
3 ;快速将Word文档变为图片[N];电脑报;2005年
4 ;用Word 2003助你轻松看文档[N];中国电脑教育报;2005年
5 ;WORD中保存和关闭文档的几个小问题[N];科技日报;2001年
6 ;清除Windows XP记录文档[N];计算机世界;2004年
7 ;编辑HTML文档的利器[N];中国电脑教育报;2002年
8 ;文档的智能化未来[N];网络世界;2005年
9 本报记者 赖名芳;福昕软件:深耕版式文档,拓展民生领域应用[N];中国新闻出版广电报;2022年
10 ;利用Google公开发布PDF文档[N];中国电脑教育报;2009年
11 本报记者 那罡;汇智互联:WiseDoc文档系统简化Web应用[N];中国计算机报;2009年
12 本报记者 宋乐永;在复印机上传输、存储文档[N];计算机世界;2003年
13 博物;自动化文档及物品存取系统通过鉴定[N];中国档案报;2003年
14 ;给Word文档盖个章[N];中国电脑教育报;2004年
15 本报记者 邱燕娜;为重要文档提供全生命周期安全防护[N];中国计算机报;2014年
16 ;DOS下EXE文档的制作[N];中国电脑教育报;2002年
17 ;HLP文档轻松做[N];中国电脑教育报;2002年
18 IT时报记者 潘少颖;将微信文章存到WPS 被删也不怕[N];IT时报;2020年
19 ;文档透明加密路在何方?[N];网络世界;2010年
20 ;Word文档转存为网页的问题[N];电脑报;2002年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978