收藏本站
《东北大学学报》 1998年01期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

中文信息自动抽取

朱靖波  姚天顺  
【摘要】:论述了信息抽取与信息检索的区别,信息抽取与深入的自然语言处理的区别,中文信息自动抽取的目的、任务和基本模型;然后介绍了一些国外的IE系统;讨论了关于中文信息自动抽取的一些问题和正在开展的中文信息抽取研究工作.
【作者单位】东北大学信息科学与工程学院
【关键词】中文信息自动抽取 信息检索 信息处理 自然语言理解
【基金】:国家自然科学基金
【分类号】:TP391.2,
【正文快照】:
中文信息自动抽取朱靖波①姚天顺②(东北大学信息科学与工程学院,沈阳110006)摘要论述了信息抽取与信息检索的区别,信息抽取与深入的自然语言处理的区别,中文信息自动抽取的目的、任务和基本模型;然后介绍了一些国外的IE系统;讨论了关于中文信息自动抽取的

【引证文献】
中国期刊全文数据库 前9条
1 胡睿,张冬茉,杜蓬;基于结点语义关系的信息抽取技术[J];计算机工程;2001年04期
2 李跃进;赵晶;林鸿飞;;基于Internet的军事演习信息抽取系统[J];计算机工程与应用;2006年14期
3 王靖,肖明君,蔡庆生;一种基于Web的智能搜索方法[J];计算机应用研究;2001年11期
4 吴文花;一种新的信息提取技术与内容管理[J];情报杂志;2002年08期
5 贺胜;信息抽取技术内涵及应用[J];南京师范大学文学院学报;2004年02期
6 吴平博;陈群秀;马亮;;基于时空分析的线索性事件的抽取与集成系统研究[J];中文信息学报;2006年01期
7 梁晗;陈群秀;吴平博;;基于事件框架的信息抽取系统[J];中文信息学报;2006年02期
8 张丙奇,姜吉发;企业相关信息抽取技术研究与系统实现[J];微电子学与计算机;2004年01期
9 章成志,侯汉清;面向概念挖掘的文本层次模型研究[J];中国图书馆学报;2005年02期
中国重要会议论文全文数据库 前1条
1 吴平博;陈群秀;马亮;;基于时空分析的线索性事件的抽取与集成系统研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
中国博士学位论文全文数据库 前5条
1 张春霞;领域文本知识获取方法研究及其在考古领域中的应用[D];中国科学院研究生院(计算技术研究所);2005年
2 谢学敏;基于动态流通语料库(DCC)的流行语释义信息自动提取研究[D];北京语言大学;2006年
3 张素香;信息抽取中关键技术的研究[D];北京邮电大学;2007年
4 徐建锁;知识管理和文本挖掘的若干问题研究[D];天津大学;2004年
5 张蕾;概念结构及其应用[D];西北工业大学;2001年
中国硕士学位论文全文数据库 前10条
1 王彬;通讯终端上名片识别系统的实现[D];武汉理工大学;2005年
2 杜民;应用神经网络的Internet智能代理的实现[D];暨南大学;2001年
3 吴思;聚类分析及其在农业物种信息自动提取中的应用[D];湘潭大学;2001年
4 章成志;基于文本层次模型的Web概念挖掘研究[D];南京农业大学;2002年
5 刘旭彤;基于语义的Web信息抽取系统的研究与设计[D];暨南大学;2006年
6 刘洋;Web教学资源抽取技术及其应用研究[D];东北师范大学;2007年
7 李辉;基于语义关系的摘要提取[D];南京理工大学;2004年
8 罗云飞;中文人称代词指代消解系统的研究与实现[D];山西大学;2005年
9 方莹;基于句子聚类的信息抽取方法研究[D];山西大学;2005年
10 吴平博;基于事件框架的主题相关文档智能检索的初步研究[D];清华大学;2004年
【共引文献】
中国期刊全文数据库 前10条
1 孙茂松,邹嘉彦;汉语自动分词研究评述[J];当代语言学;2001年01期
2 王秀坤,李政,简幼良,刘剑;基于Hash方法的机器翻译词典的组织与构造[J];大连理工大学学报;1996年03期
3 亢临生,张永奎;利用分词属性解决歧义切分[J];电脑开发与应用;1994年04期
4 刘利东;基于组合度的汉语分词决策算法研究[J];德州学院学报;2003年02期
5 苏芳仲,林世平;Web文本挖掘中的一种中文分词算法研究及其实现[J];福州大学学报(自然科学版);2004年S1期
6 陈桂林,王永成,韩客松,王刚;一种改进的快速分词算法[J];计算机研究与发展;2000年04期
7 路永刚;赵伟;;一种改进的MM分词方法的研究与实现[J];长春工业大学学报(自然科学版);2006年04期
8 应志伟,柴佩琪,陈其晖;文语转换系统中基于语料的汉语自动分词研究[J];计算机应用;2000年02期
9 赵伟,戴新宇,尹存燕,陈家骏;一种规则与统计相结合的汉语分词方法[J];计算机应用研究;2004年03期
10 张江;基于规则的分词方法[J];计算机与现代化;2005年04期
中国重要会议论文全文数据库 前1条
1 隋岩;张普;;基于“动态流通语料库”进行“有效字符串”提取的初步研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
中国博士学位论文全文数据库 前2条
1 吴应良;网络计算中的智能信息处理方法研究[D];华南理工大学;2000年
2 刘涛;现代信息检索中的文本分类及图像恢复研究[D];北京邮电大学;2006年
中国硕士学位论文全文数据库 前10条
1 李朝阳;经济文献数据库计算机标引研究[D];南京农业大学;2000年
2 唐志文;搜索引擎中数据对象研究[D];湖南大学;2001年
3 朱毅华;智能搜索引擎中的同义词识别算法研究[D];南京农业大学;2001年
4 马东坡;Internet中文智能搜索引擎汉语自动分词系统设计[D];广西师范大学;2002年
5 许林杰;中文文本分词研究[D];山东师范大学;2003年
6 王丁;基于中文文本分类的自动诊病系统[D];哈尔滨理工大学;2003年
7 袁宏;基于移动Agent的中文信息搜索引擎系统模型的研究[D];沈阳工业大学;2003年
8 李海林;自然语言理解及其在机务信息规范化中的应用[D];南京航空航天大学;2004年
9 吴福英;面向用户的信息过滤研究与实现[D];江西师范大学;2004年
10 陈鑫;中文智能搜索引擎[D];四川大学;2004年
【同被引文献】
中国期刊全文数据库 前10条
1 刘刚,张洪刚,郭军;基于变帧率训练的HMM汉语人名识别[J];中文信息学报;2001年01期
2 李元祥,刘长松,丁晓青;一种利用校对信息的汉字识别自适应后处理方法[J];中文信息学报;2001年01期
3 王梦云,曹素青;基于字频向量的中文文本自动分类系统[J];情报学报;2000年06期
4 李元祥,丁晓青,刘长松;一种基于噪声信道模型的汉字识别后处理新方法[J];清华大学学报(自然科学版);2001年01期
5 曾黄麟;基于粗集方法的一种文字识别[J];四川轻化工学院学报;1998年Z1期
6 林鸿飞,姚天顺;基于概念的中文文本可视化表示机制[J];小型微型计算机系统;2000年10期
7 崔荣一,林景浩,朴勇军;基于人工神经网络的手写体朝鲜文字识别系统的设计[J];延边大学学报(自然科学版);1999年02期
8 夏莹,马少平,孙茂松,朱小燕,金奕江,常新功;汉字文本识别的自动后处理[J];语言文字应用;1997年02期
9 李建华,王晓龙;中文人名自动识别的一种有效方法[J];高技术通讯;2000年02期
10 周强,孙茂松,黄昌宁;汉语句子的组块分析体系[J];计算机学报;1999年11期
中国重要会议论文全文数据库 前10条
1 张普;;流通度在IT术语识别中的应用分析——关于术语、术语学、术语数据库的研究[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
2 王洋;秦兵;郑实福;;句子相似度计算在FAQ中的应用[A];第一届学生计算语言学研讨会论文集[C];2002年
3 黄昌宁;高剑峰;李沐;;对自动分词的反思[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
4 朱靖波;陈文亮;姚天顺;;面向TDT的主题相似性计算模型[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
5 骆卫华;刘群;程学旗;;话题检测与跟踪技术的发展与研究[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
6 乔林;黄维通;孟威;;一种改进的知网系统词语相似度计算方法[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
7 刘怀军;车万翔;刘挺;;中文语义角色标注的特征工程[A];第三届学生计算语言学研讨会论文集[C];2006年
8 余超;蔡东风;张桂平;;词汇语义相似度计算中相关技术的分析[A];第三届学生计算语言学研讨会论文集[C];2006年
9 赵妍妍;王啸吟;秦兵;车万翔;刘挺;;中文事件抽取中事件类别的自动识别[A];第三届学生计算语言学研讨会论文集[C];2006年
10 吴晓;李丹宁;林洁;冀肖榆;李丹;;个性化搜索引擎中用户兴趣模型的研究[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 邓爱林;电子商务推荐系统关键技术研究[D];复旦大学;2003年
2 任佳;分类关联规则挖掘及其在复杂工业过程中的应用研究[D];浙江大学;2006年
3 范九伦;模糊聚类新算法与聚类有效性问题研究[D];西安电子科技大学;1998年
4 李芸;信息科学和信息技术术语概念体系研究[D];北京语言文化大学;2003年
5 王强军;基于动态流通语料库(DCC)的信息技术领域新术语自动提取研究[D];北京语言文化大学;2003年
6 马红妹;汉英机器翻译中汉语上下文语境的表示与应用研究[D];中国人民解放军国防科学技术大学;2002年
7 郑义;多媒体信息自动摘要及其相关技术研究[D];复旦大学;2003年
8 隋岩;基于“动态流通语料库”的“有效字符串”提取研究[D];北京语言大学;2004年
9 杨尔弘;突发事件信息提取研究[D];北京语言大学;2005年
10 邓绪斌;面向复杂数据源的数据抽取模型和算法研究[D];复旦大学;2005年
中国硕士学位论文全文数据库 前10条
1 陈海波;基于自动分词的企业文档搜索引擎设计与实现[D];西北工业大学;2007年
2 张绍华;基于实例的Web信息抽取[D];河北大学;2001年
3 贾爱平;科技文献中术语定义的语言模式研究[D];北京语言文化大学;2002年
4 余媛芳;面向产品创新设计的知识获取研究[D];西北工业大学;2004年
5 吴曾;文本主题切分技术和ROCCHIO模型在信息检索中应用的研究[D];中国科学院研究生院(软件研究所);2004年
6 狄慧;基于Agent的Web信息抽取研究[D];大连理工大学;2004年
7 刘卓;基于KNN算法的中文文本自动分类[D];吉林大学;2004年
8 梅胜;基于SVM的多层次大类别数文本分类系统(HJ-TCM)的设计与实现[D];南京理工大学;2004年
9 陈兰;基于ontology的信息抽取系统的研究与实现[D];电子科技大学;2004年
10 董树明;半结构化Web信息抽取技术及其应用研究[D];东南大学;2004年
【二级引证文献】
中国期刊全文数据库 前8条
1 郭庆琳;樊孝忠;柳长安;;基于文本聚类的自动文摘系统的研究与实现[J];计算机工程;2006年04期
2 王少宇,杜娟,秦前清;基于内容的网页信息处理方法[J];计算机应用;2005年04期
3 郭庆琳,樊孝忠,柳长安;文本聚类在自动文摘中的应用研究[J];计算机应用;2005年05期
4 董静;孙乐;冯元勇;黄瑞红;;中文实体关系抽取中的特征选择研究[J];中文信息学报;2007年04期
5 陆勇,侯汉清;用于信息检索的同义词自动识别及其进展[J];南京农业大学学报(社会科学版);2004年03期
6 罗宇辉,侯汉清;因特网经济学未登录词计算机辅助挖掘试验[J];情报理论与实践;2005年05期
7 潘卫东;WEB的数据挖掘[J];图书馆论坛;2004年01期
8 郭庆琳,樊孝忠;基于文本聚类和NLU的自动文摘系统的研究与实现[J];现代电力;2004年04期
中国重要会议论文全文数据库 前6条
1 杨尔弘;方莹;;突发事件信息提取中模式的自动获取[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
2 张阔;李涓子;吴刚;;基于关键词元的话题内事件检测[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
3 钟涛;陈群秀;;基于层式有限状态自动机的灾难事件抽取系统[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
4 王强军;张莉;张普;;面向术语提取和定义识别的评测语料库建设[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
5 钟涛;陈群秀;;基于Web主题性信息检索的灾难性事件信息抽取系统[A];中国计算技术与语言问题研究——第七届中文信息处理国际会议论文集[C];2007年
6 韩冰;林鸿飞;;基于支撑向量机的人物关系抽取[A];中国计算技术与语言问题研究——第七届中文信息处理国际会议论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 刘华;基于关键短语的文本内容标引研究[D];北京语言大学;2005年
2 杨尔弘;突发事件信息提取研究[D];北京语言大学;2005年
3 杜亚军;搜索引擎智能行为的研究及实现[D];西南交通大学;2005年
4 谢学敏;基于动态流通语料库(DCC)的流行语释义信息自动提取研究[D];北京语言大学;2006年
5 熊文新;信息检索Query语言分析[D];北京语言大学;2006年
6 姜韶华;科研项目管理中的文本挖掘方法研究及应用[D];大连理工大学;2006年
7 吴江;基于本体的知识管理系统关键技术研究[D];西北大学;2007年
8 张素香;信息抽取中关键技术的研究[D];北京邮电大学;2007年
9 秦忠宝;基于混合知识表示的设计创新及知识获取研究[D];西北工业大学;2006年
10 周文;基于概念的若干知识表示模型及相关方法研究[D];上海大学;2007年
中国硕士学位论文全文数据库 前10条
1 李钊;中英文混排文字识别系统的设计与实现[D];电子科技大学;2007年
2 胡景锋;手机拍摄名片图像的识别和信息提取[D];华东师范大学;2008年
3 陈霄;基于支持向量机的中文组织机构名识别[D];上海交通大学;2007年
4 石宇;基于XML的Web信息抽取与集成技术的研究[D];大连海事大学;2006年
5 郭峰;面向行业搜索引擎的WEB文本挖掘技术研究[D];兰州大学;2006年
6 何莉;基于Web信息抽取的个性化信息服务研究与实现[D];华东师范大学;2007年
7 程书红;基于XML的Web信息抽取设计与实现[D];重庆大学;2007年
8 丁邦旭;基于P2P的分布式中文搜索引擎的应用研究[D];南昌大学;2006年
9 闻博;基于Google Desktop的教育资源库全文检索系统研究[D];东北师范大学;2007年
10 杨明莉;基于语义网的智能搜索模型的研究[D];东北师范大学;2007年
【相似文献】
中国期刊全文数据库 前10条
1 卢德友;陈红中;付强;;易学实用的绘图软件——GAXA电子图版[J];河南水利;2001年05期
2 王文豪;周弘;;基于拼音的汉字模糊查询技术的探讨[J];计算机与信息技术;2011年Z2期
3 周拴龙;;Lucene.net中文分词算法分析[J];郑州大学学报(理学版);2011年03期
4 杨振宇;;中英文混合字符串切分技术[J];电脑知识与技术;2011年14期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
中国重要会议论文全文数据库 前10条
1 ;前言[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
2 ;第十届全国计算语言学学术会议组织情况[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
3 ;第五届全国信息检索学术会议(CCIR 2009)[A];第五届全国信息检索学术会议论文集[C];2009年
4 ;前言[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
5 ;中文信息的智能处理[A];中国中文信息学会第六次全国会员代表大会暨成立二十五周年学术会议中文信息处理重大成果汇报展资料汇编[C];2006年
6 嘎日迪;吾守尔.斯拉木;德熙嘉措;;代序[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
7 ;前言[A];第五届全国信息检索学术会议论文集[C];2009年
8 嘎日迪;;起步奋斗的二十年——庆祝中国中文信息学会民族语言文字信息专业委员会成立20周年暨第十届民族语言文字信息处理研讨会召开[A];第十届全国少数民族语言文字信息处理学术研讨会论文集[C];2005年
9 吴立德;黄萱菁;;前言[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
10 ;大会组织机构[A];第十届全国少数民族语言文字信息处理学术研讨会论文集[C];2005年
中国重要报纸全文数据库 前10条
1 林岗;自制中文数字证书[N];计算机世界;2007年
2 侯雪林;自主创新 迎接拼字文明时代到来[N];大众科技报;2007年
3 通讯员 林卫菁记者 黄永礼;我省专家首创二键汉字输入法[N];安徽日报;2007年
4 安徽 张来东;在JAVA开发中的中文处理问题及解决办法[N];中国计算机报;2001年
5 ;专利文献的数字化快车[N];计算机世界;2002年
6 ;倪光南:中国软件业既要学印度,更要学美国[N];21世纪经济报道;2006年
7 ;融合世界我和你[N];科技日报;2001年
8 陈健;手机汉字输入力推“中国标准”[N];人民日报;2006年
9 记者 刘敬智;我国开发成功中国标准术语数据库[N];光明日报;2000年
10 裴高才;钱伟长与电脑汉字输入法研究[N];中华读书报;2010年
中国博士学位论文全文数据库 前10条
1 李荣军;中文商品评论倾向性分析研究[D];北京邮电大学;2011年
2 刘兴林;中文词汇知识获取算法和语义计算研究及应用[D];华南理工大学;2012年
3 孙晓;中文词法分析的研究及其应用[D];大连理工大学;2010年
4 邸书灵;Agent联盟和流形学习在中文问答系统中的应用研究[D];天津大学;2010年
5 朱振方;基于微粒群和遗传优化的文本过滤关键技术研究[D];山东师范大学;2012年
6 彭菲菲;网络热点话题发现的关键技术研究[D];中国矿业大学(北京);2012年
7 陈毅恒;文本检索结果聚类及类别标签抽取技术研究[D];哈尔滨工业大学;2010年
8 张毅波;史文结构化信息检索系统的研究与实现[D];中国科学院研究生院(软件研究所);2001年
9 王兰成;基于XMARC信息描述的知识标引与概念检索研究[D];东华大学;2004年
10 周浪;中文术语抽取若干问题研究[D];南京理工大学;2010年
中国硕士学位论文全文数据库 前10条
1 朱世猛;中文分词算法的研究与实现[D];电子科技大学;2011年
2 李明;针对特定领域的中文新词发现技术研究[D];南京航空航天大学;2012年
3 严孙荣;中文产品评论的意见挖掘研究[D];北京交通大学;2010年
4 张鹏;中文意见挖掘的特征层次构建和抽取算法[D];重庆大学;2010年
5 屠卫;基于上下文感知的中文新词识别技术研究[D];郑州大学;2012年
6 李超;基于用户查询日志的中文互联网问句自动生成和查询压缩研究[D];哈尔滨工业大学;2011年
7 刁毓;基于本体的中文分词算法的研究与实现[D];曲阜师范大学;2012年
8 于光;中文分词系统的设计与实现[D];电子科技大学;2012年
9 竹勇;基于知识库的中文关键词top-N关系查询处理[D];河北大学;2011年
10 王凯;中文分词算法在工程建设材料搜索中的研究与应用[D];大连交通大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026