收藏本站
《电子学报》 2004年11期
收藏 | 投稿 | 手机打开
二维码
手机客户端打开本文

基于竞争分类的Web信息抽取

李向阳  陆建江  张亚非  
【摘要】:提出一种基于竞争分类的Web信息抽取方法 ,以信息片段与样本之间的相似度作为竞争力 ,通过信息片段对信息模板槽的竞争实现对信息片段的分类和噪声信息的过滤 ,直接从分类的角度抽取Web信息 .较之基于规则的信息抽取方法 ,竞争分类法只需用户提供少量的标记样本 .测试表明 ,该方法在没有用户提供特征提示信息的情况下 ,抽取信息仍能保持较高的准确率 ,适应性强 ;对数据项缺失和顺序变化较大的数据源 ,竞争分类法也具有较好的健壮性

知网文化
【相似文献】
中国期刊全文数据库 前5条
1 周春光,张冰,梁艳春,胡成全,常迪;模糊神经网络及其在时间序列分析中的应用[J];软件学报;1999年12期
2 李向阳,张亚非;一种网上图书信息抽取方法[J];情报学报;2004年06期
3 李向阳,陆建江,张亚非;基于竞争分类的Web信息抽取[J];电子学报;2004年11期
4 尚晋;施成湘;;小波多尺度模糊竞争边缘检测[J];计算机科学;2005年07期
5 施成湘;杨丹;尚晋;张小洪;;扩展的多尺度模糊边缘检测[J];计算机工程与应用;2006年07期
中国重要会议论文全文数据库 前1条
1 蒲宇达;关毅;王强;;基于数据挖掘思想的网页正文抽取方法的研究[A];第三届学生计算语言学研讨会论文集[C];2006年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978