一种规则与统计相结合的汉语分词方法
【摘要】:汉语自动分词是中文信息处理领域的一项基础性课题,对现有的汉语分词方法作了简单的概述和分析,然后提出了一种新的分词方法,该方法基于一个标注好了的语料库,并且结合了规则和语料库统计两种分词方法。
|
|
|
|
| 1 |
黄德根,朱和合,王昆仑,杨元生,钟万勰;基于最长次长匹配的汉语自动分词[J];大连理工大学学报;1999年06期 |
| 2 |
王锡江;王启祥;陈家骏;;基于邻接知识的汉语自动分词系统[J];计算机研究与发展;1992年11期 |
| 3 |
沈达阳,孙茂松,黄昌宁;汉语分词系统中的信息集成和最佳路径搜索方法[J];中文信息学报;1997年02期 |
| 4 |
王伟,钟义信,孙建,杨力;一种基于EM非监督训练的自组织分词歧义解决方案[J];中文信息学报;2001年02期 |
| 5 |
李蓉,刘少辉,叶世伟,史忠植;基于SVM和k-NN结合的汉语交集型歧义切分方法[J];中文信息学报;2001年06期 |
|
|
|
|
|
| 1 |
张锋,樊孝忠;基于最大熵模型的交集型切分歧义消解[J];北京理工大学学报;2005年07期 |
| 2 |
朱靖波,姚天顺;中文信息自动抽取[J];东北大学学报(自然科学版);1998年01期 |
| 3 |
冯志伟;汉字和汉语的计算机处理[J];当代语言学;2001年01期 |
| 4 |
孙茂松,邹嘉彦;汉语自动分词研究评述[J];当代语言学;2001年01期 |
| 5 |
黄德根,马玉霞,杨元生;基于互信息的中文姓名识别方法[J];大连理工大学学报;2004年05期 |
| 6 |
高红;黄德根;杨元生;;汉语自动分词中中文地名识别[J];大连理工大学学报;2006年04期 |
| 7 |
王秀坤,李政,简幼良,刘剑;基于Hash方法的机器翻译词典的组织与构造[J];大连理工大学学报;1996年03期 |
| 8 |
杜永萍,郑家恒;分词及词性标注一致性校对系统的设计与实现[J];电脑开发与应用;2001年10期 |
| 9 |
张辉,徐健;中国组织机构名自动识别系统的设计与实现[J];电脑开发与应用;2002年01期 |
| 10 |
亢临生,张永奎;利用分词属性解决歧义切分[J];电脑开发与应用;1994年04期 |
|
|
|
|
|
| 1 |
王娟琴;超维检索模式研究[J];大学图书馆学报;1999年01期 |
| 2 |
孙及园,林锦贤;对Web网页的查询及信息提取[J];福州大学学报(自然科学版);2000年03期 |
| 3 |
涂承胜,鲁明羽,陆玉昌;Web内容挖掘技术研究[J];计算机应用研究;2003年11期 |
| 4 |
陈亮,李雪梅,陈世福;个性化元搜索引擎AIP MSE的设计与实现[J];计算机应用研究;2003年12期 |
| 5 |
王娟琴;三种检索模型的比较分析研究——布尔、概率、向量空间模型[J];情报科学;1998年03期 |
| 6 |
吕津,赵明生;对因特网上自动信息提取的研究[J];数据通信;2000年01期 |
| 7 |
吴应良,韦岗,李海洲;一种基于N-gram模型和机器学习的汉语分词算法[J];电子与信息学报;2001年11期 |
| 8 |
陆玉昌,鲁明羽,李凡,周立柱;向量空间法中单词权重函数的分析和构造[J];计算机研究与发展;2002年10期 |
| 9 |
李振星,徐泽平,唐卫清,唐荣锡;全二分最大匹配快速分词算法[J];计算机工程与应用;2002年11期 |
| 10 |
谭琼,史忠植;分词中的歧义处理[J];计算机工程与应用;2002年11期 |
|
|
|
|
|
| 1 |
维尼拉·木沙江;吴俊森;吐尔根·依布拉音;;维吾尔文搜索引擎的倒排索引设计与实现[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年 |
|
|
|
|
|
| 1 |
孙茂松,黄昌宁,邹嘉彦,陆方,沈达阳;利用汉字二元语法关系解决汉语自动分词中的交集型歧义[J];计算机研究与发展;1997年05期 |
| 2 |
李蓉,刘少辉,叶世伟,史忠植;基于SVM和k-NN结合的汉语交集型歧义切分方法[J];中文信息学报;2001年06期 |
| 3 |
谭琼,史忠植;分词中的歧义处理[J];计算机工程与应用;2002年11期 |
| 4 |
赵伟,戴新宇,尹存燕,陈家骏;一种规则与统计相结合的汉语分词方法[J];计算机应用研究;2004年03期 |
| 5 |
杨芳,杨振山;一种消除中文匹配中交集型歧义的方法[J];计算机辅助工程;2005年02期 |
| 6 |
张培颖;李村合;;一种改进的上下文相关的歧义字段切分算法[J];计算机系统应用;2006年05期 |
| 7 |
谈文蓉;杨宪泽;谈进;刘莉;;MIS智能接口中汉语分词系统的设计与应用[J];计算机科学;2006年07期 |
| 8 |
韦向峰;谭露;张全;;MFC编程技术在汉语切分歧义研究中的应用[J];微计算机应用;2007年05期 |
| 9 |
张辉;武亚红;黄润才;;基于规则和统计的汉语多输出切分系统[J];微电子学与计算机;2007年07期 |
| 10 |
邓凡;鱼滨;;基于语义计算的中文歧义字段消歧算法[J];计算机技术与发展;2008年06期 |
|