欢迎来到三一文库! | 帮助中心 三一文库31doc.com 一个上传文档投稿赚钱的网站
三一文库
全部分类
  • 研究报告>
  • 工作总结>
  • 合同范本>
  • 心得体会>
  • 工作报告>
  • 党团相关>
  • 幼儿/小学教育>
  • 高等教育>
  • 经济/贸易/财会>
  • 建筑/环境>
  • 金融/证券>
  • 医学/心理学>
  • ImageVerifierCode 换一换
    首页 三一文库 > 资源分类 > DOC文档下载  

    《现代汉语词典》标“书”词研究(上).doc

    • 资源ID:1590610       资源大小:19.72KB        全文页数:10页
    • 资源格式: DOC        下载积分:4
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录 QQ登录   微博登录  
    二维码
    微信扫一扫登录
    下载资源需要4
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    《现代汉语词典》标“书”词研究(上).doc

    现代汉语词典标“书”词研究(上) 一、序言 书语词是现代汉语中常出现于书面语,带有典雅、正式、庄重色彩的一类词。现代汉语词典(1996年版;下同;以下简称现汉)用“”对这类词作了标示,“凡例”的说明是:“一般条目中,标的表示书面上的文言词语。”如:“学子:学生:莘莘(shnshn)(很多学生)。”“嘉许:夸奖;赞许:品学兼优,深得师长”“凡例”显示标“”的词具有两个特点:一是它的使用范围是书面语,即口语中一般不会用到。二是它的来源是文言词语。为了在行文时加以区分,本文用“书语词”表示一般意义的书面用词语,用标“书”词指现汉中作了“”标示的词。 对词的语体色彩进行标示,是现汉的一个重要创举。它还对另两类词语也作了语体色彩标示,“标的表示方言”,“标的表示古代的用法”。这些标示对加强语言分析和理解的准确性,对提高人们使用语言的水平都是有积极作用的。现汉的标“书”词有5570条,占全书词目的近十分之一,这个比例是相当大的。那么这数量众多的标“书”词是些什么样的词,它们表达了怎样的意思?传递着怎样的语言交际信息,在汉语词汇体系中居于什么样的地位?这都是值得探讨的问题。值得进一步探讨的是,标“书”词与标了“”的词如何区分?现汉的释义中还存在着“旧词语”,用来表示那些正在逐步退出现代汉语使用的词语;还有指称古代事物的词语,即历史词。标“书”词与它们之间又有着怎样的关系?相互之间如何区分?这些都是很值得探讨的问题。最终,当然也就可以回答“标书词”是不是都是“书语词”的问题。这种探讨不仅跟词汇学有关,而且进入了词典编纂学的范围。在词汇学上它将能帮助我们认识汉语词汇系统的内部成分及其关系,在词典学上将有助于词典编纂水平的提高,有助于提高使用者正确运用词语的水平。 二、标“书”词的分布与归类 现汉共有标“书”词5570条。现在先来看看这些标“书”词的构成。根据“”标注的词目单位的大小,可分出义项标示与整词标示两类。义项标示的有901条,如“稗”:“(1)稗子。(2)比喻微小、琐碎的:史。”;整词标示的有4669条,如“陂塘:水塘。”二者分别占16与84,后者占了5/6。在整词标示部分又可根据所标示的词目性质,分出“词”、“词素”、“异体字”、“交叉类”四类。下面略加分析: 1词。标示对象为“词”,即这个词目具有独立使用的能力。共有3632条,其中单音节词1090条;多音节词2542条,包括出现在单字词目的释义部分中的194条。 ?W烹煮(鱼、肉)。 哀荣 指死后的荣誉。 2词素。即词目不能独立使用,只是复音词的构成部分。有528条。 霭云气:烟、暮。 芸芸形容众多:万物|众生。 3异体字。全部采用“同某”的参见格式,其实是义同形别的异体字。有198例。 ?同“鞍”。 ?G同“杯”。 4交叉类。同一条目中包括有两类以上者。有311例。 嬖 (1)宠爱爱|呢。(2)受宠爱臣|妾。(3)受宠爱的人。 按该例是整词标示,其中义项(1)(2)是词索义,义项(3)是词义。 ?佟?(1)同呃。(2)形容鸟鸣声。 按:该例是整词标示,其中义项(1)是异体字,义项(2)是词义。1从标示对象单位的大小来看,它除了标示出整词外,还标示出了义项。标示义项的出现表明标“书”的工作做得相当细微,深入到了对各个词义的分辨。 2从标示的对象性质来看,既有词,还有词素,还有字。字与“词”、“词素”是很不一样的,像“睾”与“鞍”,更雅致或更古朴,可它们的意思与读音都是一样的,只是写法和传递的色彩不一样。可见,现汉对标“书”词的认定是完全从语体风格上来作出判断的。 值得注意的是,标示对象中“词”与“词素”的差别。“词”是一个独立的使用单位,它的标示,是对它整体的书语词身份与用法的确认。而“词素”的标示则有着不完全一样的功能。当这个“词素”是书面语性质的,但与它共同构词的其他词素是否属于书语词则不定,它所构成的复合性整词是否也必定属于书语词呢?如“霭”是带书语词意味的词素,“烟”、“暮”两个词素不是,构成的“烟霭”、“暮霭”属书语词。可也有不是这样的。如“蕴”是标“书”词,“蕴:(1)包含;蓄积;藏。(2)事理深奥的地方:底。”“藏”、“底”不是。构成的“蕴藏”不是书语词,如“蕴藏蓄积而未显露或未发掘:大沙漠下面着丰富的石油资源I他们心中着极大的爱国热情”;而“底蕴”属书语词,如“底蕴:详细的内容;内情:不知其中”。应该说大多数词素的书语词色彩会影响到整词的色彩。由此亦可见,标词素是一个较为简洁的方法,在理解上也容易抓到关键。 3在对“词”的标示中,根据音节的长短,又可分出单音词与多音词两类。单音词有1090例,多音词有2542例。 从上面的统计中,可看到标“书”词的范围相当宽,涉及的对象也相当复杂。这样的处理隐约显示现汉似乎并不太介意标“书”是否完全是针对“词”来作出的判断,尽管“书语词”本来是应该对“词”的语体色彩的一种专有属性的分类,而“词素”,特别是“字”并不属于“词”的范围。在这里映透着人们仍习惯于对汉语最小单位字的认同。标“书”词的判断也就成了对汉语的基础语言单位的一种色彩、语境、风格的选择与认定。这种色彩、语境或日是风格就是较为典雅,较为僻用,较富文气,而这正是古语词与历史词所同时具有的。那么它们之间有着怎样的关系?这正是诱使我们作进一步探讨的动力之一。 由于标“书”词的对象过于复杂,在对“书语词”作进一步判断、甄别,特别是在了解书语词的通用程度、适用语境时,为了做到可操作性,提高分析的准确程度,下面作了筛选,只选用“整词标示”部分而没有选用“词义标示”部分,同时为了更好地纯化,选取的又是“整词标示”中的多音节词,共2348例。这里用的为什么不是2542例,是因为排除了只出现在单字释义中的那194例。因此,下面分析所使用的2348例标“书”词,也就具有了“整词”、“多音节词”、“独立词”等特点。 三、标“书”词的词频调查与分析 “凡例”的说明显示出标“书”词具有使用范围是书面语与来源是文言词语的两个特点。这两个特点其实都掩盖不了书语词的另一种很重要的,即断代的共时属性,现实性与通用性应该是书语词所应具有的基本特性。书语词必定会在现实语言生活中呈现一定的使用频率。因此,通过词频调查,我们将能对标“书”词的“现实性”与“通用性”程度有所了解。本文用词频调查的语料是现当代 文学作品,共7000万字,涵盖了现当代文学265位作家的343部长篇和3829篇短篇作品,包括小说、剧本、讲义、散文、杂文、诗歌等题材。之所以只选取文学作品丽没有选用新闻语料,因为文学作品是书语词最适合出现的语境。我们也将它放在10亿字的新闻语料(人民日报)中作过检索,词频明显低于文学作品,这也从一个侧面说明现在的选择是对的。 先从语料中检索出2348条标“书”词的词频,经过人工初步干预,排除因分词错误、同形异义导致的假频,作了简单的频率统计, 上表中值得关注的是“百分比”栏,其解读如下:被调查的词中10的词频只有1次或1次以下;20的词频在13次之间;30的词频在37之间;17次是一个分界线,表明低于或高于它的各占一半。 以上数据清楚反映了这样一个事实:低频词数量多,频次低;高频词数量少,频次高。有两组数据都有力地支持着这一事实。第一组数据是“平均数”与“中位数”的明显差距。平均数是52.12,中位数是17,说明是少数词的高频率把平均数拉上去了。第二组数据是“百分比”的分布。从低往高处算起,在等距的百分比中,愈是在低位的百分比频距愈小,10到20,相差是2,从20到30,相差是4,从30到40,相差也是4。而在高位的百分比中,频率的数距明显增大。从70到80,相差20,从80到90,相差55,而90至最高数(限数),相差4887。 将所查得的词频按四分位数来切分,可将第一个25算低频区,第4个25算高频区,中间的50算中频区。低频区的词频在14次之间,有词语576条。高频区的词频在50次以上,有词语562条。中频区的词频则在549次之间,约1210条,占总数的一半。下面对各个频度的词做个简单分析。 1低频词分析 低频词中无一次出现者204条,如:骈阗、膺选、喧哗、萱堂、儇佻、谱牒、酸醅、勖励、讯步、诮呵、牙侩、崖略、皮傅、獠、狂狂、披怀,等。 出现1次者,如:谐戏、重趼、奥博、佻薄、刑辱、俦类、商兑、佻巧、弋获、驰骛、驰目、欣忭、颓放、滚滚、穰穰、荏弱、蜷局、潭府、岁杪,等。 出现2次者,如:践诺、枭将、参错、阆苑、悠谬、廓张、并骨、拿陋、笃志、魁元、快然、津梁、诧愕、杳渺、蠡测、伶俜、荫翳、炳蔚、沮遏,等。 出现3次者,如:厕足、赅括、仓禀、湔洗、剿袭、鹣鲽、俎上肉、蔼蔼、谙练、听讼、倜然、讹夺、傥荡、探胜、陂塘、佛戾、岁除、笔受、拂煦,等。 我们之所以将这些低频词按出现的频次细细缕列,是因为这样可以清楚地告诉我们这些词已经很难与当代词语联系起来了。它们已经基本丧失了“当代性”与“通用性”。除极少数以外,大部分应该说已经退出了现代汉语的使用范围。 2中频词分析 中频词的频次范围在549之间,下面来看看频次为30的词,共25条。它们是:恢恢、逋逃、不韪、粲然、昌言、芳邻、父执、赴敌、率尔、强颜、漪澜、秉烛、鸿儒、宅第、噍类、阑干、离析、受业、挞伐、怃然、宵旰、修明、羞赧、延揽、苟同。中频词都有一定的语言使用频率在支撑着它们,人们对它们有一定的熟悉度。这种熟悉程度与语言使用者的文化水平有密切关系,这是符合书语词特点的。 3高频词分析 高频词的词频数在50以上,共有562条。居于中位的是词频为100次的高频词。词频数在99103次之间的有16个词:陵寝、人杰、归田、何谓、进谗、倍道、子虚、教化、更始、恻隐、羁縻、艳羡、行囊、不才、旧家、手谕。 通过上面对三个频度的例词分析,我们已经可以清楚地感受到低频、中频、高频三类标“书”词在现实语料中的使用情况。至少可以说,500余条的低频词已基本丧失了生存能力。中频词、高频词则得到了相当数量语言事实的支持。 为什么在标“书”词内部,词与词之间的“现实性”与“通用性”差异会如此之大?可能有这样两方面的原因第一个原因可能是语料不当,或过于生僻,以致它们难以出现,或过新过俗,不属它们的生存环境。但从对语料的构成分析来看,这个原因基本上可以排除。因为这些语料的作者既有较早的鲁迅、老舍、曹禺、叶圣陶、茅盾、林语堂、巴金、冰心,又有承上启下的邓友梅、孔捷声、路遥、姚雪垠,也包括了新时期的梁晓声、刘心武、陈忠实、高晓声、阿城、池莉、孔庆东、阿成、艾晓明、莫言、毕淑敏等,应该说对现当代各个时期的文学语言有相当的代表性。第二个可能的原因就是词语本身。如果在代表一种语言精华的文学作品中都难觅踪影,这样的词语恐怕很难算得上是书面语了。

    注意事项

    本文(《现代汉语词典》标“书”词研究(上).doc)为本站会员(吴起龙)主动上传,三一文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一文库(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    经营许可证编号:宁ICP备18001539号-1

    三一文库
    收起
    展开