欢迎来到三一文库! | 帮助中心 三一文库31doc.com 一个上传文档投稿赚钱的网站
三一文库
全部分类
  • 研究报告>
  • 工作总结>
  • 合同范本>
  • 心得体会>
  • 工作报告>
  • 党团相关>
  • 幼儿/小学教育>
  • 高等教育>
  • 经济/贸易/财会>
  • 建筑/环境>
  • 金融/证券>
  • 医学/心理学>
  • ImageVerifierCode 换一换
    首页 三一文库 > 资源分类 > DOC文档下载  

    汉语句法语义标注库的描述格式说明.doc

    • 资源ID:12166247       资源大小:21KB        全文页数:2页
    • 资源格式: DOC        下载积分:2
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录 QQ登录   微博登录  
    二维码
    微信扫一扫登录
    下载资源需要2
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    汉语句法语义标注库的描述格式说明.doc

    汉语句法语义标注库的描述格式说明为便于自动处理,我们设计了一种灵活的“属性=值”描述格式,可以方便地添加不同层次的句法语义标注信息。按照不同的数据内容,可以分成以下三部分:1)元信息标注,主要包括以下内容: 句子序号:对句子集合中的每个待处理句子,给出唯一的句子序号ID ;语料来源:使用 TCT '、RMRB '等标识不同语料来源信息; 来源位置:使用 文件名-句子序号 ( 开始位置-终止位置 )'格式表示 该句子在原始语料库的哪个文件、哪个句子的哪个位置片段出现,便于以后方便 地找到对应的语料库标注句子; 基本标注:使用 词语/词类 '标注格式给出原始的词语切分和词性标注 处理句子,它是后续处理的基础数据;2)目标动词义项标注,主要包括以下内容: 目标动词:给出目标动词的基本词条信息,作为后续处理的基础; 动词位置:描述该动词在句子中出现的词语位置,从 0 开始计数; 义项标注:给出该目标动词在不同语义词典中的义项标注信息,数据内容包括:XX义项描述 和XX确定度 ,其中XX分别表示目前处理的几个语义资源: 情境库、知网、词林、现汉通和清华知识库等。对于情境库,给出情境表达式描 述;对于知网中,给出知网内部 ID 和 DEF 表达式;对于词林,给出词林内部语 义编码和相应的同义词集合描述;对于现汉通和清华知识库,给出自然语言释义 文本。3)句法语义信息标注,针对上面给出的每个事件载体目标动词,标注以下内容: 句法语义块标注:在基本信息标注基础上,给出针对目标动词的句法语义块标注 信息。使用:"句法标记 语义标记 ”格式标注每个块,其中句法标记 描述格式为: 功能标记 -成分标记 -关系标记 ,分别表示该块在句子中的句 法功能、成分组合标记和内部关系标记; 语义标记'描述格式为:对目标动词 所在块,用 Tgt '表示,对其他事件体描述块,使用相应的语义角色或锚定参量 表示。另外,每个块中的语义中心词,通过 -'标记表示。 核心句式描述:从句法语义标注句子中,提取形成以下核心句式描述信息:核心句式 :给出核心句式中各个块的句法语义链接信息,基本格式为: 块序号描述 -句法功能标记 -语义角色标记 ; 分别给出各个描述块的详细信息描述,包括:词语位置 ,给出该块在句子中的左右边界位置和中心词语位置; 句法描述 ,给出该块的句法标记 信息; 语义角色 ,给出该块的语义角色描述。词汇关联对描述:保存从上述标注句式中可以提取的词汇关联对信息,主要内容 包括:关联对总数 :描述可以提取的关联对数目, 与下面的关联对描述相匹配; 词汇关联对 - 块序号n-关联对编号 m :表示从上面的第 n个块中可 以提取出的第 m 个关联对描述信息。每个关联对描述信息格式为: 目标 词 目标词词性 关联词 关联词词性 目标词功能位置 关联词功 能位置 关联词语义角色描述 可能的分隔词语信息 。面给出一个具体的标注实例:句子序号 = 45语料来源 = TCT来源位置 = SW0120-28(0-13)目标动词 = 编造动词位置 = 0基本标注=编造/v 假/a 话/n 容易/aD 讨/v 老师/n 喜欢/v , /, 讨好/v 老师/n 容易/aD 得到/v 表扬/v 。/。情境库义项描述 = DO(x,P(x,y)_CAUSE_exist(y,L)+P=Forge情境库确定度 = 1.00知网义项描述=8282- forge|伪造知网确定度 = 1.00 词林义项描述 = Hj580101- 编,编造,杜撰,假造,捏合 ,捏造,无中生有 ,向壁虚构 ,虚构,造 词林确定度 = 1.00现汉通义项描述 = 凭想象创造现汉通确定度 = 1.00 清华库义项描述 = 凭想像创造(故事) 。清华库确定度 = 1.00句法语义块标注 =P-vp-SG编造/v- Tgt O-np-DZ 假/a 话/n- y容易/aD 讨/v 老师 /n 喜欢 /v , /, 讨好 /v 老师 /n 容易 /aD 得到 /v 表扬 /v 。 /。核心句式 = Ch1-P-Tgt Ch2-O-yCh1. 词语位置 = 0-0-0Ch1.句法描述=P-vp-SGCh1.语义角色=TgtCh2.词语位置=1-2-2Ch2.句法描述=0-n p-DZCh2.语义角色=y关联对总数 = 1词汇关联对 2-1= 编造 v 话 n G O y *

    注意事项

    本文(汉语句法语义标注库的描述格式说明.doc)为本站会员(scccc)主动上传,三一文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一文库(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    经营许可证编号:宁ICP备18001539号-1

    三一文库
    收起
    展开