《语言文字应用》1994年02期 加入收藏    获取最新 
 词频统计的新概念和新方法
 尹斌庸,方世增
   提出“通用度”新概念及其计算方法,把词语统计中的频度标准和分布率标准有机地结合起来,是目前国内外采用客观标准选词中最为简明有效的一种方法。“报刊新闻词语的统计与分析”从实践的角度进一步证实了通用度公式的合理性和实用性。把频度的概念加以扩展,提出了t阶频度的概念,把传统的频度称为一阶频度,通用度称为二阶频度,等等。t阶频度的理论,是统计学的一个重要发展。
【作者单位】:语言文字应用研究所
【分类号】:H087
【DOI】:cnki:ISSN:10035397.0.1994-02-012
【正文快照】:
  词频统计的新概念和新方法尹斌庸,方世增提要提出“通用度”新概念及其计算方法,把词语统计中的频度标准和分布率标准有机地结合起来,是目前国内外采用客观标准选词中最为简明有效的一种方法。“报刊新闻词语的统计与分析”从实践的角度进一步证实了通用度公式的合理性和实
 
 推荐 下载CAJ全文           下载PDF全文
 CAJViewer7.0阅读器支持所有CNKI文件格式,AdobeReader仅支持PDF格式
 【引证文献】 共(38)篇 
 中国优秀硕士学位论文全文数据库找到 10 条
 
1陈佳璇; 我国新闻语言中字母词的易读性研究 [D];华东师范大学; 2003年
2柯丹; 认知语用歧义及其在广告语中的应用 [D];武汉科技大学; 2007年
3岑泽丽; 义项词及其教学状态的调查研究 [D];武汉大学; 2005年
4樊小玲; 基于“时间”、“频率”概念和“新词语发现软件”的报刊新词语研究 [D];华东师范大学; 2005年
5刘新英; 当前小学识字教学的误区及对策 [D];河北大学; 2006年
6刘健; 普通话音系与PSC试题音子比率研究 [D];南京师范大学; 2005年
7丁立军; 几何学习在病毒分类与肿瘤分型中的应用 [D];浙江工业大学; 2007年
8史蕊; 语篇连贯的认知语境新视角 [D];黑龙江大学; 2007年
9张伟; 输入频率对二语词汇习得的影响 [D];南京师范大学; 2007年
10王蕾; 基于动态流通语料库的信息技术领域术语通用化研究 [D];北京语言文化大学; 2003年
 中国博士学位论文全文数据库找到 7 条
 
1韩同兰; 战国楚文字用字调查 [D];华东师范大学; 2003年
2韩秀娟; 基于动态流通语料库的通用词语用字研究及字词语关系考察 [D];北京语言大学; 2007年
3何婷婷; 语料库研究 [D];华中师范大学; 2003年
4杨治平; 面向个体的教科书设计 [D];华东师范大学; 2006年
5方欣欣; 语言接触问题三段两合论 [D];华中师范大学; 2004年
6胡霞; 认知语境研究 [D];浙江大学; 2005年
7王强军; 基于动态流通语料库(DCC)的信息技术领域新术语自动提取研究 [D];北京语言文化大学; 2003年
 中国期刊全文数据库找到 10 条
 
1卢亚军,罗广; 藏文词汇通用度统计研究 [J]; 图书与情报; 2006年03期
2苏新春; 计量方法在词汇研究中的作用及频级统计法 [J]; 长江学术; 2007年02期
3邹玉华,瞿国忠,董春萍; 字母词在当代汉语中使用状况的分析 [J]; 佛山科学技术学院学报(社会科学版); 2007年02期
4邹玉华,瞿国忠,董春平; 术语字母词在当代汉语中的使用状况考察 [J]; 科技术语研究; 2006年02期
5邹玉华,瞿国忠; 术语字母词在当代汉语中的使用状况考察 [J]; 术语标准化与信息技术; 2006年03期
6马清华; 唯频率标准的不自足性——论面向汉语国际教育的词汇大纲设计标准 [J]; 世界汉语教学; 2008年02期
7邹玉华,马广斌,马叔骏,刘哲,马宇菁; 字母词知晓度的调查报告 [J]; 语言文字应用; 2006年02期
8孙茂松; 关于词汇使用度的初步研究 [J]; 语言文字应用; 2000年01期
9刘晓梅; 《现代汉语词典》所收方言词的考察 [J]; 语言文字应用; 2003年02期
10卢亚军,马少平,张敏,罗广; 基于大型藏文语料库的藏文字符、部件、音节、词汇频度与通用度统计及其应用研究 [J]; 西北民族大学学报(自然科学版); 2003年02期
 中国重要会议论文全文数据库找到 5 条
 
1李宇明; 促进语言生活健康发展(代序) [A];语言文字应用研究论文集(Ⅱ) [C]; 2004年
2史中琦,张普; 基于DCC动态流通报纸语料库的流通度词表和使用度词表的对比分析 [A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集 [C]; 2005年
3郑泽之,王强军,张普; 流通度—字词使用情况测定的新方法 [A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集 [C]; 2003年
4侯敏; 语言监测与词语的计量研究 [A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集 [C]; 2006年
5郑泽之,王强军,张普,陈双新; 基于大规模DCC语料库的《现代汉语常用字表》、《现代汉语通用字表》收字情况统计分析 [A];Advances in Computation of Oriental Languages--Proceedings of the 20th International Conference on Computer Processing of Oriental Languages [C]; 2003年
 【同被引文献】 共(681)篇 
 中国优秀硕士学位论文全文数据库找到 7 条
 
1陈少全; 基因表达谱芯片在筛选胃腺癌相关基因中的应用 [D];第二军医大学; 2001年
2张利娟; 当代中国大陆、香港、台湾地区中学历史教科书结构研究 [D];上海师范大学; 2004年
3史中琦; 基于DCC动态流通报纸语料库的流通度词表和使用度词表的对比分析 [D];北京语言大学; 2005年
4施云峰; 语境的认知和语用研究 [D];西南师范大学; 2004年
5岳炳词; 面向语言学研究的大规模汉语生语料库检索工具CCRLT [D];北京工业大学; 2001年
6王世伟; 小学德育教科书功能性模块设计研究 [D];华东师范大学; 2005年
7孙艳艳; 基于图式的交互模式对非英语专业学生阅读教学的影响 [D];安徽师范大学; 2004年
 中国博士学位论文全文数据库找到 4 条
 
1杨建国; 基于动态流通语料库(DCC)的汉语熟语单位研究 [D];北京语言大学; 2005年
2郑泽芝; 基于动态流通语料库(DCC)的汉语字母词语识别及考察研究 [D];北京语言大学; 2005年
3彭兵; 基于学习对象的教学设计模型研究 [D];华东师范大学; 2003年
4史艳岚; 基于中国主流报纸动态流通语料库的对外汉语报刊新闻主题词群及相关研究 [D];北京语言大学; 2006年
 中国期刊全文数据库找到 10 条
 
1夏惠贤; 论自然观察者智力及其课程开发 [J]; 比较教育研究; 2004年01期
2史树青; 信阳长台关出土竹书考 [J]; 北京师范大学学报(社会科学版); 1963年04期
3黄碧; 浅谈幼儿语言教育 [J]; 重庆师专学报; 2000年03期
4李兆麟; 汉语计量研究初探——兼评《现代汉语频率词典》 [J]; 辞书研究; 1989年01期
5李兆麟; 汉语计量研究与语文辞书编纂 [J]; 辞书研究; 1991年03期
6符淮青; 词义单位的划分和义项 [J]; 辞书研究; 1995年01期
7胡华; 语法词:功能视点上的结构角色 [J]; 东北师大学报(哲学社会科学版); 1994年04期
8苏杰; 释包山楚简中的“对”字 [J]; 古汉语研究; 2000年03期
9厐光华; “司败”解 [J]; 古汉语研究; 2001年03期
10肖群英; 科技词语在社会生活领域中运用的方式及其词义变化 [J]; 赣南师范学院学报; 1993年02期
 中国重要会议论文全文数据库找到 5 条
 
1李宇明; 信息时代的语言问题(代序) [A];第一届学生计算语言学研讨会论文集 [C]; 2002年
2张普; 流通度在IT术语识别中的应用分析——关于术语、术语学、术语数据库的研究 [A];辉煌二十年——中国中文信息学会二十周年学术会议论文集 [C]; 2001年
3李芸,王强军,张普; 信息技术领域术语自动提取和动态更新研究 [A];辉煌二十年——中国中文信息学会二十周年学术会议论文集 [C]; 2001年
4王强军,李芸,张普; 信息技术领域术语提取的初步研究 [A];第一届学生计算语言学研讨会论文集 [C]; 2002年
5刘桐菊,于浩,杨沐昀; 基于TFIDF的专业领域词汇获取的研究 [A];第一届学生计算语言学研讨会论文集 [C]; 2002年
 西文参考文献找到 10 条
 
1Hai Zhao, Changning Huang, and Mu Li; An Improved Chinese Word Segmentation System with Conditional Random Fied [M];Proceedings of the Fifth SIGHAN Workshop on Chinese Language Processing; July 2006年
2 Nation Teaching and Learning Vocabulary [M];; 1990年
3Hai Zhao, Changning Huang, and Mu Li; An Improved Chinese Word Segmentation System with Conditional Random Fied [M];Proceedings of the Fifth SIGHAN Workshop on Chinese Language Processing; July 2006年
4Freedle, R.O; Discourse Production and Comprehension [M];; 1979年
5Kelly; Guessing No Substitute for Systematic Learning of Lexis [M];System; 1990年
6Murdock, B. B; The Serial Position Effect of Free Recall [M];Journal of Experimental Psychology; 1962年
7 Nation Vocabulary Size Growth and Use [M];The Bilineual Lexicon; 1993年
8Osgood, C.E, and R. Hoosain; Salience of the word as a unit in the perception of language [M];Perception and Psychophysics; 1974年
9West, M; Speaking-vocabulary [M];foreign language‘s Modern Language Journal; 1930年
10Seal S,Komarina S,Aluru S; An opti mal hierarchical cluste-ring algorithmfor gene expression data [M];Information Process-ing Letters; 2005年
 【二级引证文献】 共(63)篇 
 中国优秀硕士学位论文全文数据库找到 10 条
 
1菊花; 基于语料的初中蒙语文生词分析软件的设计 [D];内蒙古师范大学; 2006年
2李琳; 科技语体词的跨体使用研究 [D];暨南大学; 2006年
3刘小花; 现代汉语子尾词系统研究 [D];暨南大学; 2006年
4宋余亮; 俄语现代标注语料库的理论与实践 [D];中国人民解放军外国语学院; 2007年
5黄鹂; 汉语中英语借词的新趋势及规范化 [D];西南大学; 2006年
6徐婷婷; 积极型单语汉语学习词典例证分析 [D];北京大学; 2007年
7陈瑾; 新时期汉语语境下的英语外来词研究 [D];汕头大学; 2006年
8戴姗; 基于DCC三年经济日报语料的面向国际大企业商务领域词语统计方法研究 [D];北京语言大学; 2007年
9李军辉; 中文邮件语料库建设 [D];苏州大学; 2006年
10朱薏; 流行词语计算机获取模型研究 [D];华中师范大学; 2006年
 中国博士学位论文全文数据库找到 8 条
 
1李培峰; 基于语义的多文种信息处理平台SMIPP的研究 [D];苏州大学; 2006年
2韩秀娟; 基于动态流通语料库的通用词语用字研究及字词语关系考察 [D];北京语言大学; 2007年
3于满泉; 面向人物追踪的知识挖掘研究 [D];中国科学院研究生院(计算技术研究所); 2006年
4赵小兵; 基于动态流通语料库的现代汉语基本词汇自动识别与提取方法研究 [D];北京语言大学; 2007年
5李彦洁; 现代汉语外来词发展研究 [D];山东大学; 2006年
6徐慈华; 选择与适应 [D];浙江大学; 2007年
7史艳岚; 基于中国主流报纸动态流通语料库的对外汉语报刊新闻主题词群及相关研究 [D];北京语言大学; 2006年
8谢学敏; 基于动态流通语料库(DCC)的流行语释义信息自动提取研究 [D];北京语言大学; 2006年
 中国期刊全文数据库找到 10 条
 
1卢亚军,罗广; 藏文词汇通用度统计研究 [J]; 图书与情报; 2006年03期
2苏新春; 计量方法在词汇研究中的作用及频级统计法 [J]; 长江学术; 2007年02期
3贺胜,卢亚军; 基于藏文编码(基本集)国家暨国际标准的藏文输入法研究 [J]; 图书与情报; 2007年06期
4邹玉华,瞿国忠,董春萍; 字母词在当代汉语中使用状况的分析 [J]; 佛山科学技术学院学报(社会科学版); 2007年02期
5薛笑丛; 现代汉语中字母词研究综述 [J]; 汉语学习; 2007年02期
6邹玉华,瞿国忠,董春平; 术语字母词在当代汉语中的使用状况考察 [J]; 科技术语研究; 2006年02期
7陈德三; 字母词语的范围及其规范使用 [J]; 厦门理工学院学报; 2006年04期
8何婷婷,朱薏,张勇,任函; 基于词语属性的计算机辅助获取流行词语研究 [J]; 中文信息学报; 2006年06期
9俞士汶,段慧明,朱学锋,张化瑞; 综合型语言知识库的建设与利用 [J]; 中文信息学报; 2004年05期
10张仰奋; 字母词在汉语中流行的根据及存在的问题 [J]; 嘉应学院学报; 2008年02期
 中国重要会议论文全文数据库找到 4 条
 
1满正行,高璐; 藏语单语料库分析及标注探讨 [A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集 [C]; 2007年
2郭慧志,刘华,谢学敏,张普; 《人民日报》标注语料的初步统计分析 [A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集 [C]; 2005年
3郭慧志,王强军,刘华,张普; 大规模动态流通语料库的构建 [A];第二届全国学生计算语言学研讨会论文集 [C]; 2004年
4江荻; 藏语文本信息处理的历程与进展 [A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集 [C]; 2006年
 【相似文献】 
 中国期刊全文数据库
 
1尹斌庸,方世增; 词频统计的新概念和新方法 [J];语言文字应用; 1994年02期; 69-75+113
2 现代汉语通用词研究的若干原则和方法 [J];语文建设; 1994年04期; 36-38
3尹斌庸; 常用度和通用度 [J];语文建设; 1990年01期; 55-56
4卢亚军,罗广; 藏文词汇通用度统计研究 [J];图书与情报; 2006年03期; 80-83
5卢亚军,马少平,张敏,罗广; 基于大型藏文语料库的藏文字符、部件、音节、词汇频度与通用度统计及其应用研究 [J];西北民族大学学报(自然科学版); 2003年02期; 33-43
6 “报刊新闻词语统计与分析”成果评议会在京举行 [J];语文建设; 1992年11期; 44
7姚丽萍; 新词的流通对语体间排拒交叉关系的证明 [J];修辞学习; 1999年06期; 25-26
8苏新春; 计量方法在词汇研究中的作用及频级统计法 [J];长江学术; 2007年02期; 126-132
9杨奔; 20世纪的现代汉语词汇统计研究 [J];玉林师范学院学报; 2002年01期; 88-91+104
10厉兵; 《现代汉语通用词》选词原则 [J];语言文字应用; 1998年02期; 4-11+3
 中国重要会议论文全文数据库
 
1尹斌庸,方世增; 词频统计的新概念和新方法 [A];语言文字应用研究论文集(Ⅰ) [C]; 1995年
2尹斌庸,方世增; 词频统计的新概念和新方法 [A];语言文字应用研究论文集(Ⅱ) [C]; 2004年
3侯敏; 语言监测与词语的计量研究 [A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集 [C]; 2006年