收藏本站
《山西大学学报(自然科学版)》 2001年01期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于BP网络的汉语文本词类标注方法

支天云  张仰森  
【摘要】:提出了利用 BP网络解决汉语文本词类标注 ,这种网络具有充分利用上下文词类信息的处理能力。文章以人工标注过的句子作训练集和测试集 ,分别给出了样本为 3、5和 7个词的测试结果 ,结果表明 :经过训练收敛后的网络对测试集的词类标注正确率大于 90 % ,排歧率大于 87% ,优于基于统计的词类标注结果。

手机知网App
【引证文献】
中国期刊全文数据库 前1条
1 支天云,张仰森;基于Rough Sets和模糊神经网络的汉语兼类词词性标注规则的获取方法[J];计算机工程与应用;2002年12期
中国重要会议论文全文数据库 前1条
1 李小明;孙金城;;数据挖掘在汉语语音合成中的应用[A];图像 仿真 信息技术——第二届联合学术会议论文集[C];2002年
中国硕士学位论文全文数据库 前1条
1 王广正;基于知网语义相关度计算的汉语自动分词方法的研究[D];云南师范大学;2006年
【参考文献】
中国期刊全文数据库 前2条
1 朱凤石;基于人工神经网络的汉语兼类处理方法的研究[J];计算机研究与发展;1998年04期
2 孙茂松,黄昌宁;汉语中的兼类词、同形词类组及其处理策略[J];中文信息学报;1989年04期
【共引文献】
中国期刊全文数据库 前10条
1 张锋,樊孝忠;基于最大熵模型的交集型切分歧义消解[J];北京理工大学学报;2005年07期
2 詹卫东;80年代以来汉语信息处理研究述评──作为现代汉语语法研究的应用背景之一[J];当代语言学;2000年02期
3 杜永萍,郑家恒;分词及词性标注一致性校对系统的设计与实现[J];电脑开发与应用;2001年10期
4 张辉,徐健;中国组织机构名自动识别系统的设计与实现[J];电脑开发与应用;2002年01期
5 王显芳,杜利民;一种能够检测所有交叉歧义的汉语分词算法[J];电子学报;2004年01期
6 王显芳,杜利民;利用覆盖歧义检测法和统计语言模型进行汉语自动分词[J];电子与信息学报;2003年09期
7 冯丽萍;;基于统计的中文组织机构名识别[J];福建电脑;2006年01期
8 谢春发;中文信息处理在智能答疑系统中的应用研究[J];福建广播电视大学学报;2005年02期
9 王海峰,李生,赵铁军;BT863-II汉英机器翻译系统中的兼类处理方法[J];高技术通讯;2000年01期
10 李朝虹,陆建湖;现代汉语自动分析研究现状综述[J];广西教育学院学报;2003年01期
中国重要会议论文全文数据库 前10条
1 曾华琳;史晓东;李堂秋;;基于上下文信息提取的概率分词算法[A];第六届汉语词汇语义学研讨会论文集[C];2005年
2 靳光瑾;郭曙纶;肖航;章云帆;;语料库加工中的规范问题——谈《信息处理用现代汉语词类标记集规范》[A];语言文字应用研究论文集(Ⅱ)[C];2004年
3 侯敏;;汉语自动分析中的若干问题与对策[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
4 程月;季娜;洪鹿平;;基于语料统计的以“不”开头双字分词不一致研究[A];第三届学生计算语言学研讨会论文集[C];2006年
5 杜超华;沈威;姚双云;;基于复句语料库的分词系统的研究[A];第三届学生计算语言学研讨会论文集[C];2006年
6 朱丽丽;郑家恒;;一种基于实例学习的人名识别方法[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
7 吐尔根·依不拉音;阿里甫·库尔班;阿不都热依木;;基于词典的现代维吾尔语词性自动标注系统的研究[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
8 张霄军;董宇;陈小荷;;基于语料考察的“组合型歧义”与“切分变异”辨析[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
9 周俏丽;蔡东风;张桂平;季铎;林晓庆;;基于最大熵的“vp np的np”句法结构排歧[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
10 赫琳;;论“X 从小 Y”的词切分——“从小”语义指向计算机识别的再思考[A];中国计算技术与语言问题研究——第七届中文信息处理国际会议论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 张蕾;概念结构及其应用[D];西北工业大学;2001年
2 刘忠;性质语意理论的提出与自然语言理解及其实现的研究[D];华东师范大学;2004年
3 隋岩;基于“动态流通语料库”的“有效字符串”提取研究[D];北京语言大学;2004年
4 郑逢斌;关于计算机理解自然查询语言的研究[D];西南交通大学;2004年
5 郑泽芝;基于动态流通语料库(DCC)的汉语字母词语识别及考察研究[D];北京语言大学;2005年
6 刘伟;现代汉语代词隐现的动态研究[D];北京语言大学;2005年
7 杨尔弘;突发事件信息提取研究[D];北京语言大学;2005年
8 易勇;计算机辅助诗词创作中的风格辨析及联语应对研究[D];重庆大学;2005年
9 詹卫东;面向中文信息处理的现代汉语短语结构规则研究[D];北京大学;1999年
10 曹海龙;基于词汇化统计模型的汉语句法分析研究[D];哈尔滨工业大学;2006年
中国硕士学位论文全文数据库 前10条
1 陈宣荣;[D];电子科技大学;2003年
2 吴思;聚类分析及其在农业物种信息自动提取中的应用[D];湘潭大学;2001年
3 罗智勇;现代汉语通用分词系统的技术与实现[D];北京工业大学;2002年
4 廉竹钧;汉语组合型切分歧义字段消歧方法研究[D];北京语言文化大学;2002年
5 张丽静;规则与统计相结合的兼类词处理机制[D];大连理工大学;2002年
6 郑旭玲;面向机器翻译的汉语短语语义模式规则研究[D];厦门大学;2002年
7 张艳丽;中文机构名称的自动识别[D];大连理工大学;2003年
8 许林杰;中文文本分词研究[D];山东师范大学;2003年
9 由丽萍;动词与动词搭配自动获取方法研究[D];上海师范大学;2003年
10 岑咏华;科技信息门户网站的技术研究[D];南京理工大学;2003年
【同被引文献】
中国期刊全文数据库 前10条
1 许云,樊孝忠,张锋;基于知网的语义相关度计算[J];北京理工大学学报;2005年05期
2 孙茂松,邹嘉彦;汉语自动分词研究评述[J];当代语言学;2001年01期
3 黄德根,朱和合,王昆仑,杨元生,钟万勰;基于最长次长匹配的汉语自动分词[J];大连理工大学学报;1999年06期
4 黄德根,马玉霞,杨元生;基于互信息的中文姓名识别方法[J];大连理工大学学报;2004年05期
5 刘亚军,徐易;一种基于加权语义相似度模型的自动问答系统[J];东南大学学报(自然科学版);2004年05期
6 张辉,徐健;中国组织机构名自动识别系统的设计与实现[J];电脑开发与应用;2002年01期
7 王显芳,杜利民;一种能够检测所有交叉歧义的汉语分词算法[J];电子学报;2004年01期
8 吴应良,韦岗,李海洲;一种基于N-gram模型和机器学习的汉语分词算法[J];电子与信息学报;2001年11期
9 王显芳,杜利民;利用覆盖歧义检测法和统计语言模型进行汉语自动分词[J];电子与信息学报;2003年09期
10 蔡勇智;基于最大匹配分词算法的中文词语粗分模型[J];福建电脑;2005年09期
中国重要会议论文全文数据库 前1条
1 王仁华;胡郁;李威;凌震华;;基于决策树的汉语大语料库合成系统[A];第六届全国人机语音通讯学术会议论文集[C];2001年
中国硕士学位论文全文数据库 前3条
1 何燕;任意类型的未登录词的识别研究[D];北京语言文化大学;2000年
2 朱珣;中文自动分词系统的研究[D];华中师范大学;2004年
3 罗小虎;基于蚁群算法的汉语自动分词的研究与实现[D];苏州大学;2004年
【二级引证文献】
中国期刊全文数据库 前1条
1 王朝静,郑庆华;面向答疑文本的词类标注方法的研究与实现[J];计算机工程与应用;2004年16期
中国博士学位论文全文数据库 前1条
1 刘启和;基于Rough集的知识发现及其在汉语处理中的应用[D];电子科技大学;2005年
中国硕士学位论文全文数据库 前1条
1 王莹;基于错误驱动的汉语词性标注研究[D];北京邮电大学;2007年
【二级参考文献】
中国期刊全文数据库 前1条
1 孙茂松,黄昌宁;汉语中的兼类词、同形词类组及其处理策略[J];中文信息学报;1989年04期
【相似文献】
中国重要会议论文全文数据库 前3条
1 才让加;吉太加;;藏语语料库中词性分类代码的确定[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
2 王萌;;现代汉语综合型语言知识库[A];中国中文信息学会第六次全国会员代表大会暨成立二十五周年学术会议中文信息处理重大成果汇报展资料汇编[C];2006年
3 吐尔根·依不拉音;阿里甫·库尔班;阿不都热依木;;基于词典的现代维吾尔语词性自动标注系统的研究[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
中国博士学位论文全文数据库 前1条
1 刘启和;基于Rough集的知识发现及其在汉语处理中的应用[D];电子科技大学;2005年
中国硕士学位论文全文数据库 前2条
1 李楠;基于遗传算法的汉语文本主题词提取研究[D];吉林大学;2007年
2 孟迎;基于统计的机器学习的中文命名实体识别[D];昆明理工大学;2004年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026