收藏本站
《中文信息学报》 2011年04期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于栏目的藏文网页文本自动分类方法

胥桂仙  向春丞  翁彧  赵小兵  杨国胜  
【摘要】:该文提出了一种简单、快速的藏文网页文本分类方法。该方法利用网页栏目中词条的类别特征,结合网页文本提取技术,实现了快速、精确地将藏文网页文本归于预定义类别中。实验表明,该方法具有很高的网页文本分类正确率,对构建高质量多类别藏文语料库有重要作用。

知网文化
【相似文献】
中国期刊全文数据库 前10条
1 黄昌宁;中文信息处理中的分词问题[J];语言文字应用;1997年01期
2 杨清,杨岳湘,瞿国平;智能文本分类系统的研究与设计[J];计算机应用研究;1999年10期
3 邹涛,王继成,黄源,张福炎;中文文档自动分类系统的设计与实现[J];中文信息学报;1999年03期
4 李国臣;文本分类中基于对数似然比测试的特征词选择方法[J];中文信息学报;1999年04期
5 陶兰,申军霞;文本信息自动分类系统ITC98(Ⅰ)──ITC98总体结构与编码子系统[J];中国农业大学学报;1999年04期
6 陶兰,申军霞;文本信息自动分类系统ITC98(Ⅱ)──基于BP网络的文本分类子系统[J];中国农业大学学报;1999年04期
7 卢增祥,李衍达;交互支持向量机学习算法及其应用[J];清华大学学报(自然科学版);1999年07期
8 邹涛,孙赛;文档自动分类技术及其实现[J];计算机系统应用;1999年04期
9 王小华,张国煊;基于多元统计分析的电子文本自动分类[J];杭州电子工业学院学报;1999年03期
10 陈勤!信息工程分院,张国煊!信息工程分院,王小华!信息工程分院;文本自动模糊分类方法的研究[J];杭州电子工业学院学报;1999年04期
中国重要会议论文全文数据库 前10条
1 陈荃芳;;我局分类检索文档的现状及几点建议[A];专利法研究(1991)[C];1991年
2 王继成;孙颖;张福炎;;文本挖掘-数据挖掘研究的新课题[A];第十六届全国数据库学术会议论文集[C];1999年
3 王慧玲;宋柔;戴伟长;;汉语文本按语体分类的研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
4 王小华;陆蓓;张国煊;;文本自动分类的模糊方法[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
5 秦兵;郑实福;刘挺;张刚;李生;;基于改进的贝叶斯模型的中文网页分类器[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
6 庞剑锋;程学旗;;反馈方法在文本分类系统中的应用[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
7 孙晓明;马少平;;基于写作风格的作者识别[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
8 房一飞;张冬茉;;基于boosting的文本分类在股市领域信息抽取系统中的应用[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
9 苏毅;吴文虎;郑方;方棣棠;;基于支持向量机的语音识别研究[A];第六届全国人机语音通讯学术会议论文集[C];2001年
10 高楚舒;丁于思;;因特网中文文本信息分析[A];计算机模拟与信息技术会议论文集[C];2001年
中国重要报纸全文数据库 前6条
1 希安;微软试水信息检索[N];经济日报;2004年
2 王培森;从Web挖到竞争情报[N];中国计算机报;2003年
3 中国科学院计算技术研究所 王 斌;内容为王[N];计算机世界;2004年
4 高利华;传承陆游风骨 推进国际交流[N];人民日报海外版;2005年
5 应晓敏 窦文华;技术架构[N];计算机世界;2003年
6 林木树;反垃圾邮件有待新突破[N];人民邮电;2004年
中国博士学位论文全文数据库 前10条
1 程军;基于统计的文本分类技术研究[D];中国科学院研究生院(文献情报中心);2003年
2 宋枫溪;自动文本分类若干基本问题研究[D];南京理工大学;2004年
3 徐建锁;知识管理和文本挖掘的若干问题研究[D];天津大学;2004年
4 薛德军;中文文本自动分类中的关键问题研究[D];清华大学;2004年
5 刘华;基于关键短语的文本内容标引研究[D];北京语言大学;2005年
6 李荣陆;文本分类及其相关技术研究[D];复旦大学;2005年
7 赵晖;支持向量机分类方法及其在文本分类中的应用研究[D];大连理工大学;2006年
8 孙越恒;基于统计的NLP技术在中文信息检索中的应用研究[D];天津大学;2005年
9 孙建涛;Web挖掘中的降维和分类方法研究[D];清华大学;2005年
10 王秀娟;文本检索中若干问题研究[D];北京邮电大学;2006年
中国硕士学位论文全文数据库 前10条
1 易靖;基于信息粒度原理的文本分类方法的研究[D];北京工业大学;2001年
2 孙良;一种分布式智能信息检索系统的研究与实现[D];浙江大学;2002年
3 都云琪;中文文本自动分类的研究与实现[D];西安电子科技大学;2002年
4 郭琰;元搜索引擎的关键技术研究及系统实现[D];南京理工大学;2002年
5 杨昂;文本分类算法研究[D];湖南大学;2002年
6 杨斌;中文文本数据挖掘研究[D];湘潭大学;2002年
7 石霞军;邮件信息过滤算法研究与实现[D];湖南大学;2002年
8 苏伟峰;基于概念的文本自动分类研究[D];厦门大学;2002年
9 陈乐;基于智能文本分类技术的素材管理软件的设计与开发[D];南京师范大学;2003年
10 卢忠良;基于多类的汉语文本自动分类研究[D];中国人民解放军国防科学技术大学;2002年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978