收藏本站
《哈尔滨工业大学学报》 1998年06期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

最大概率分词问题及其解法

刘挺  吴岩  王开铸  
【摘要】:提出了一种新的汉语自动分词算法,该算法运用人工智能中的问题求解技术,先将汉语句子的切分问题归约为若干字段的切分问题,再用启发式状态空间搜索技术将每个字段分别转换为概率最大的词序列.

【引证文献】
中国期刊全文数据库 前6条
1 曾华琳,李堂秋,史晓东;一种基于提取上下文信息的分词算法[J];计算机应用;2005年09期
2 马玉春,宋瀚涛;Web中文文本分词技术研究[J];计算机应用;2004年04期
3 金瑜,陆启明,高峰;基于上下文相关的最大概率汉语自动分词算法[J];计算机工程;2004年16期
4 马晓娜,杨承磊;基于面向对象的受限自然语言查询系统的设计与实现[J];计算机工程与应用;2005年10期
5 梁刚;基于机械分词与统计学的新词识别研究[J];情报理论与实践;2005年05期
6 蒋发群,周经野,曹娟;隐式分词的中文输入法及其实现[J];湘潭大学自然科学学报;2003年03期
中国重要会议论文全文数据库 前1条
1 曾华琳;史晓东;李堂秋;;基于上下文信息提取的概率分词算法[A];第六届汉语词汇语义学研讨会论文集[C];2005年
中国博士学位论文全文数据库 前2条
1 彭强;复杂系统远程智能故障诊断技术研究[D];南京理工大学;2004年
2 杨传耀;中文信息检索索引模型及相关技术研究[D];复旦大学;2007年
中国硕士学位论文全文数据库 前10条
1 马东坡;Internet中文智能搜索引擎汉语自动分词系统设计[D];广西师范大学;2002年
2 陆文彦;概念网的建模、实现与应用[D];中南大学;2002年
3 李海林;自然语言理解及其在机务信息规范化中的应用[D];南京航空航天大学;2004年
4 杨超;基于最大匹配的书面汉语自动分词研究[D];湖南大学;2004年
5 罗小虎;基于蚁群算法的汉语自动分词的研究与实现[D];苏州大学;2004年
6 金瑜;基于Web的光学专业数据库的信息检索[D];合肥工业大学;2004年
7 贾丽洁;基于最大熵模型的分词技术研究[D];山东师范大学;2007年
8 张晓淼;基于神经网络的中文分词算法的研究[D];大连理工大学;2006年
9 李文;公安执法监督管理中的文本理解技术的研究及其应用[D];南昌大学;2005年
10 熊冬明;汉语自动分词和中文人名识别技术研究[D];浙江大学;2006年
【参考文献】
中国期刊全文数据库 前4条
1 王轩,李巍,王晓龙,赵淑香;大标记集汉语字(词)Markov 语言模型的建立[J];哈尔滨工业大学学报;1997年05期
2 何克抗,徐辉,孙波;书面汉语自动分词专家系统设计原理[J];中文信息学报;1991年02期
3 王晓龙,王开铸,白小华;自然语言理解中的音字流自动分词[J];中文信息学报;1991年03期
4 王晓龙,王开铸,李仲荣,白小华;最少分词问题及其解法[J];科学通报;1989年13期
【共引文献】
中国期刊全文数据库 前10条
1 邓勇,刘军,周长荣;通信侦察情报分析专家系统的设计[J];兵工自动化;2004年02期
2 李军,阮晓钢;一种基于神经网络的专家系统设计[J];北京工业大学学报;2003年02期
3 夏洁,高金源;满足战场需求的实时飞行路径规划[J];北京航空航天大学学报;2004年02期
4 李宏光;基于实时推理的工业聚酯粘度智能控制系统[J];北京化工大学学报;1999年03期
5 夏巍,陈锦娣;一种自学习专家控制器[J];北京理工大学学报;1993年03期
6 马燕华;论海外华裔儿童汉字教学的特殊性[J];北京师范大学学报(社会科学版);2003年06期
7 李怀诚,刘中逢;印刷电路板图的计算机识别[J];北京邮电大学学报;1994年03期
8 杨启平,薛五德,蓝之达;变压器故障诊断技术的研究[J];变压器;2002年10期
9 张炎华,刘思行,鲍其莲;船舶操舵系统的鲁棒自适应控制[J];船舶工程;1995年04期
10 李昌春,左为恒;专家系统与专家控制系统[J];重庆工业管理学院学报;1996年04期
中国重要会议论文全文数据库 前1条
1 马燕华;;论汉字教学的性质、类型、特征对不同类型语言教材中的汉字选择[A];第八届国际汉语教学讨论会论文选[C];2005年
中国博士学位论文全文数据库 前10条
1 徐建新;灌区水资源评价及节水高效灌溉专家系统[D];西安理工大学;2000年
2 杨选辉;非稳态非线性信号处理理论和方法在地震资料分析中的应用研究[D];中国地震局地球物理研究所;2000年
3 梁伟平;球磨机制粉系统智能控制算法的研究及应用[D];华北电力大学;2000年
4 程良伦;微管道机器人及其智能控制系统的研究[D];中国科学院长春光学精密机械与物理研究所;2000年
5 肖明;WWW科技信息资源自动标引的理论与实践研究[D];中国科学院文献情报中心;2001年
6 李开生;通用擦窗机器人控制系统体系结构的研究和实现[D];北京工业大学;2001年
7 柴毅;智能化汽车主动安全系统研究[D];重庆大学;2001年
8 陆能枝;核应急决策支持系统的框架结构及模糊决策方法在评估子系统的应用[D];中国原子能科学研究院;2001年
9 卢学军;汽轮发电机组故障诊断系统中几个关键技术的研究[D];浙江大学;2001年
10 昝飞;聋生汉字加工中语音编码作用的实验研究[D];华东师范大学;2002年
中国硕士学位论文全文数据库 前10条
1 程越;基于统计的中文姓名识别的研究与实现[D];吉林大学;2005年
2 付曙光;合作伙伴的Web挖掘系统研究[D];辽宁工程技术大学;2005年
3 朱珣;中文自动分词系统的研究[D];华中师范大学;2004年
4 买强;青霉素发酵过程故障检测与故障诊断的研究[D];河北工业大学;2000年
5 宋立波;飞行器运控模式仿真研究[D];中国科学院空间科学与应用研究中心;2000年
6 娄(王廷);现代汉语分词系统通用性设计及切分歧义处理[D];北京工业大学;2000年
7 张蔚蔚;基于模糊神经网络的智能火灾自动探测技术[D];北京工业大学;2000年
8 李朝阳;经济文献数据库计算机标引研究[D];南京农业大学;2000年
9 夏敏;农地适宜性评价专家系统研究[D];南京农业大学;2000年
10 高莉;高速公路沥青路面病害诊治专家系统研究[D];长安大学;2001年
【同被引文献】
中国期刊全文数据库 前10条
1 陈拥军,孟晓明,庞磊;ASP的安全漏洞与网络信息安全防护策略研究[J];计算机应用研究;2004年07期
2 徐林昊,杨文柱,张绍华,薛文玲,李天柱;Web信息查询研究进展[J];河北大学学报(自然科学版);2001年03期
3 王纯;Internet与信息检索[J];图书情报知识;1996年01期
4 张长利,赫枫龄,左万利;一种基于后缀数组的无词典分词方法[J];吉林大学学报(理学版);2004年04期
5 戴汝为;;从工程控制论到综合集成研讨厅体系——纪念钱学森先生归国50周年[J];自然杂志;2005年06期
6 吴建胜,战学刚,迟呈英;一种基于自动机的分词方法[J];计算机工程与应用;2005年08期
7 梁刚;基于机械分词与统计学的新词识别研究[J];情报理论与实践;2005年05期
8 赵荣娟;王丹;;一种从关系数据库提取本体的方法[J];微电子学与计算机;2006年S1期
9 丁丰,董娜,林碧琴,袁保宗;自然语言处理系统中自动分词的研究[J];北方交通大学学报;1999年06期
10 龚汉明,周长胜;汉语分词技术综述[J];北京机械工业学院学报;2004年03期
中国博士学位论文全文数据库 前9条
1 杨梅;现代汉语合成词构词研究[D];南京师范大学;2006年
2 王晓东;基于Ontology知识库系统建模与应用研究[D];华东师范大学;2003年
3 郝兴伟;基于知识本体的E-learning系统研究[D];山东大学;2007年
4 郑逢斌;关于计算机理解自然查询语言的研究[D];西南交通大学;2004年
5 王建会;中文信息处理中若干关键技术的研究[D];复旦大学;2004年
6 薛德军;中文文本自动分类中的关键问题研究[D];清华大学;2004年
7 李荣陆;文本分类及其相关技术研究[D];复旦大学;2005年
8 尚文倩;文本分类及其相关技术研究[D];北京交通大学;2007年
9 胡燕;基于Web信息抽取的专业知识获取方法研究[D];武汉理工大学;2007年
中国硕士学位论文全文数据库 前10条
1 刘阳;“隐性小词表+专业小词库”的自动分词技术研究[D];湖南师范大学;2007年
2 白慧;基于产品设计领域的名词短语语义分析[D];西安电子科技大学;2004年
3 张小林;机械产品设计领域的自然语言理解中名词性短语的语义分析[D];西安电子科技大学;2005年
4 屈喜龙;基于Web的智能查询系统的研究[D];昆明理工大学;2003年
5 李宁;用知识挖掘技术实现网络信息的学科知识分类与智能查询[D];四川大学;2003年
6 黄海;异构数据集成系统中的智能查询研究及实现[D];大连海事大学;2004年
7 李美子;智能查询技术的研究与应用[D];山东科技大学;2005年
8 郑任儿;基于本体的语义检索技术研究[D];华东师范大学;2007年
9 娄(王廷);现代汉语分词系统通用性设计及切分歧义处理[D];北京工业大学;2000年
10 易靖;基于信息粒度原理的文本分类方法的研究[D];北京工业大学;2001年
【二级引证文献】
中国期刊全文数据库 前9条
1 化柏林;赵亮;;知识抽取中的嵌套向量分词技术[J];现代图书情报技术;2007年07期
2 张利;张立勇;张晓淼;耿铁锁;岳宗阁;;基于改进BP网络的中文歧义字段分词方法研究[J];大连理工大学学报;2007年01期
3 冯素琴;陈惠明;;利用上下文信息解决汉语组合型歧义[J];电脑开发与应用;2007年01期
4 翟凤文;赫枫龄;左万利;;基于统计规则的交集型歧义处理方法[J];吉林大学学报(理学版);2006年02期
5 路永刚;赵伟;;一种改进的MM分词方法的研究与实现[J];长春工业大学学报(自然科学版);2006年04期
6 费胜巍;孙宇;张登峰;王胜红;;由产品设计知识生成故障诊断与维护知识的方法[J];机械设计;2006年02期
7 冯素琴;陈惠明;;一种自组织的汉语组合型歧义消歧方法[J];计算机工程与设计;2007年03期
8 黄倩;基于概念网的智能信息服务实现[J];现代情报;2005年04期
9 翟凤文;赫枫龄;左万利;;字典与统计相结合的中文分词方法[J];小型微型计算机系统;2006年09期
中国博士学位论文全文数据库 前2条
1 孙红岩;大型旋转机械智能诊断多Agent系统的研究[D];重庆大学;2007年
2 陈伟;制造企业分布式远程服务系统及其关键技术的研究[D];同济大学;2007年
中国硕士学位论文全文数据库 前10条
1 张真;基于语义相似度的中文文本分类系统的研究与实现[D];大连海事大学;2007年
2 瞿继合;基于Web的数据挖掘技术研究[D];东北财经大学;2005年
3 蒋发群;基于受限汉语描述的需求规约生成系统的研究[D];湘潭大学;2003年
4 张海龙;Web挖掘技术在东亚植物遗传资源管理系统中的应用研究[D];中国农业大学;2005年
5 张晓淼;基于神经网络的中文分词算法的研究[D];大连理工大学;2006年
6 罗巍;面向知识检索的领域知识模型研究[D];中南大学;2005年
7 邹丹;基于Web的中文文本分类的研究与实现[D];中国地质大学(北京);2006年
8 沈斌;基于分词的中文文本相似度计算研究[D];天津财经大学;2006年
9 朱祥玉;基于向量空间模型的自适应文本过滤系统研究[D];山东师范大学;2006年
10 刘宽;现代汉语自动分词歧义分析及其消歧处理研究[D];兰州理工大学;2006年
【二级参考文献】
中国期刊全文数据库 前3条
1 关英春;秦蓓;;汉字自动统计系统CWSS[J];计算机研究与发展;1985年12期
2 王晓龙,王开铸,李仲荣,白小华;最少分词问题及其解法[J];科学通报;1989年13期
3 揭春雨 ,刘源 ,梁南元;论汉语自动分词方法[J];中文信息学报;1989年01期
【相似文献】
中国期刊全文数据库 前10条
1 刘哲;;数据清洗技术在网络教学评价体系中的应用[J];网络与信息;2011年08期
2 王俊生;施运梅;张仰森;;基于Hadoop的分布式搜索引擎关键技术[J];北京信息科技大学学报(自然科学版);2011年04期
3 贾丙静;吴长勤;葛华;;Web文本聚类的研究与实现[J];长春师范学院学报;2011年06期
4 蒋艳荣;刘习文;陈耿涛;;基于Viterbi改进算法的高棉语分词研究[J];计算机工程;2011年15期
5 齐全;董晶;;基于描述能力的视频标题分类[J];华南理工大学学报(自然科学版);2011年07期
6 吴戈;;基于混沌加密和连词替换的文本水印算法[J];长春大学学报;2011年06期
7 龙志祎;程葳;;基于词聚类的热点话题检测算法[J];计算机工程与设计;2011年06期
8 姜文志;顾佼佼;丛林虎;;CRF与规则相结合的军事命名实体识别研究[J];指挥控制与仿真;2011年04期
9 艾丹祥;左晖;杨君;;网络信息检索中相关反馈技术的Java实现[J];电脑知识与技术;2011年16期
10 刘里;刘小明;;基于分隔符和上下文术语的领域现象术语抽取[J];华南理工大学学报(自然科学版);2011年07期
中国重要会议论文全文数据库 前10条
1 孙茂松;;汉语自动分词研究的若干最新进展——清华大学相关工作简介[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
2 徐润华;陈小荷;;一种利用注疏的《左传》分词新方法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
3 孙茂松;;汉语自动分词研究及其应用:回顾与展望[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年
4 李怡平;吴飞;;多语言环境下的分布式互联网分词平台[A];第十六届全国数据库学术会议论文集[C];1999年
5 杨尔弘;方莹;乔羽;;汉语自动分词和词性标注评测[A];第二届全国学生计算语言学研讨会论文集[C];2004年
6 赵伟;路永刚;吴琼;;一种新的基于BMM和RMM分词方法的研究与实现[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
7 通拉嘎;;汉、蒙、藏、维分词与词性标注技术发展现状研究[A];第五届全国青年计算语言学研讨会论文集[C];2010年
8 徐冰;姚建民;杨沐昀;赵铁军;;汉语分词在机器翻译评价中的影响[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
9 陈晓;;中文文本自动分词研究述要[A];第四届全国语言文字应用学术研讨会论文集[C];2005年
10 庄丽;包塔;朱小燕;;盲人用计算机软件系统中的语音和自然语言处理技术[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
中国重要报纸全文数据库 前10条
1 陆元婕;聪明的搜索引擎[N];中国计算机报;2001年
2 本报记者 侯闯;让企业不再“眼花”[N];计算机世界;2003年
3 ;大恒FTR全文检索软硬件解决方案[N];计算机世界;2001年
4 朱艳;术语解释[N];中国电脑教育报;2000年
5 郑昊;数据挖掘加工海量数据[N];中国计算机报;2007年
6 郑依华;搜索引擎也开源[N];计算机世界;2006年
7 清华大学计算机系人机交互与媒体集成研究所 陶建华 蔡莲红;语音合成的应用系统设计[N];计算机世界;2001年
8 杨宝昌;让MySQL支持中文全文检索[N];计算机世界;2006年
9 ;特殊符号在搜索引擎中的妙用[N];电脑报;2004年
10 晓梦;“面对面”的智能电子词典[N];计算机世界;2004年
中国博士学位论文全文数据库 前10条
1 贺前华;汉语自动分词及机器翻译研究[D];华南理工大学;1993年
2 侯锋;中文报业出版的文字质量智能辅助控制技术研究[D];国防科学技术大学;2010年
3 孙晓;中文词法分析的研究及其应用[D];大连理工大学;2010年
4 刘兴林;中文词汇知识获取算法和语义计算研究及应用[D];华南理工大学;2012年
5 蒋昌金;基于关键词提取的中文网页自动文摘方法研究[D];华南理工大学;2010年
6 刘磊;概念内涵属性计算研究[D];上海交通大学;2011年
7 屠晓;英文地址图像识别与翻译研究[D];华东师范大学;2011年
8 李军辉;中文句法语义分析及其联合学习机制研究[D];苏州大学;2010年
9 张海军;基于大规模语料的中文新词识别技术研究[D];中国科学技术大学;2011年
10 朱振方;基于微粒群和遗传优化的文本过滤关键技术研究[D];山东师范大学;2012年
中国硕士学位论文全文数据库 前10条
1 张海燕;基于分词的中文文本自动分类研究与实现[D];湖南大学;2002年
2 陈思;中文文本投诉信息自动分类系统研究[D];东北师范大学;2010年
3 赵春红;外包数据库模型中文本数据完整性检测方案的研究[D];燕山大学;2010年
4 卢育红;半结构化药物数据智能分类技术研究与系统实现(全日制专业学位)[D];北京交通大学;2011年
5 卢忠良;基于多类的汉语文本自动分类研究[D];中国人民解放军国防科学技术大学;2002年
6 苗玺;中文语料库切分不一致字串分类校验方法研究[D];山西大学;2006年
7 都菁;基于论坛语料的未登录词自动识别新方法[D];西南大学;2010年
8 陈焱劼;搜索引擎系统的设计与实现[D];北京交通大学;2011年
9 林渌;基于新闻主题模型的热点工作挖掘系统[D];浙江大学;2011年
10 张俊英;基于谱聚类的图书目录重构[D];浙江大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026