欢迎来到三一文库! | 帮助中心 三一文库31doc.com 一个上传文档投稿赚钱的网站
三一文库
全部分类
  • 研究报告>
  • 工作总结>
  • 合同范本>
  • 心得体会>
  • 工作报告>
  • 党团相关>
  • 幼儿/小学教育>
  • 高等教育>
  • 经济/贸易/财会>
  • 建筑/环境>
  • 金融/证券>
  • 医学/心理学>
  • ImageVerifierCode 换一换
    首页 三一文库 > 资源分类 > PPT文档下载  

    融入句型信息的汉英双向调序模型.ppt

    • 资源ID:3209824       资源大小:154.51KB        全文页数:26页
    • 资源格式: PPT        下载积分:6
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录 QQ登录   微博登录  
    二维码
    微信扫一扫登录
    下载资源需要6
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    融入句型信息的汉英双向调序模型.ppt

    1,融入句型信息的汉英双向调序模型,张家俊、宗成庆 中科院自动化所 2008.11.28,2,背景,自从IBM翻译模型的提取,特别是基于短语的翻译模型提出后,调序模型始终是统计机器翻译的关键问题,是研究的热点 从基于距离的扭曲模型、词汇化的调序模型到层次化的短语翻译模型、最大熵调序模型,都非常有效地提高了翻译质量,3,想法,这些模型没有充分利用语言所固有的语法信息,在不需要调序的地方浪费了大量的计算时间 这些模型没有充分利用句子的先验知识,譬如句型,因为不同的句型具有不同的调序策略,4,句型在调序中的作用,几个例子:,5,句型调序分析,特殊疑问句中至少有一固定的短语(我们称为特殊疑问短语)在翻译成英语时通常出现在句首; 一般疑问句在翻译时有特定的例如can, do, is等引导词; 在非疑问句中,有很大比例的句子中出现介词短语、时间地点短语,这些短语在汉语中出现在动词前,而在翻译时一般出现在动词的后面,6,口语语料分析,我们分析277k 中英对齐句对发现,大约 17.2% 是特殊疑问句, 约 25.5% 为一般疑问句,其余为非疑问句。 可见在口语翻译中,基于句型的调序是非常有意义且具有研究价值的,7,基于句型调序的翻译框架(汉英),C1:特殊疑问句,C2:一般疑问句,C3:非疑问句,8,基于句型调序的翻译框架(英汉),C1、C2和C3的意义同上图,“逆”表示与上图的算法相似但调序方向相反,9,模型与算法,句型的分类算法:SVM-based 前向调序模型、逆前向调序模型 后向调序算法、逆后向调序模型,10,句型分类算法,SVM的优势,分类准确,几乎不受标点的影响 (我们知道标点是句型关键性的特征) 实验: 语料:三类句型分别问1000句,80%作为训练,20%作为测试 实验结果:,11,前向调序模型,适用句型:特殊疑问句 调序对象:特殊疑问短语 调序的两个关键问题: 特殊疑问短语的识别 正确的调序位置,12,调序的两个关键问题,特殊疑问短语的识别 我们在语法上给特殊疑问短语一个定义:包含特殊疑问词的完整的语法成分。 特殊疑问词是利用互信息得到的一个闭集:什么、哪、多(多长、多久)、怎、谁、几、为什么、何 在汉语中,从语法层面看来,特殊疑问短语可能会是任何一类语法成分,从语法层无法识别 我们采用chunking的浅层句法分析来识别特殊疑问短语,13,调序的两个关键问题,正确的调序位置 分析翻译实例我们发现,调序的位置分为3类:句首、子句首、特定模板短语(从对齐语料习得)后 分别举例: 这个 味道 怎么样 ?=怎么样 这个 味道 ? 请问 , 去 海滩 怎么 走 ? =请问 , 怎么 走 去 海滩 ? 你 认为 到 那 要 多长 时间 ?=你 认为 要 多 长 时间 到 那 ?,14,逆前向调序模型,适用句型和处理对象与前向模型一样 面向英汉翻译任务 对翻译结果的修正 同样面临调序的两个关键问题: 特殊疑问短语的识别 正确的调序位置,15,调序的两个关键问题,特殊疑问短语的识别同前向模型 调序的目标位置: 特殊疑问句的结构 调序规则,16,调序的两个关键问题,特殊疑问句的两种结构 作为强调部分出现在句末 作为动词短语的修饰成分出现在动词短语的前面 调序规则 若SQP为动词短语,则将其调至包含该SQP的子句末尾 若SQP不是动词短语,而且中有动词短语,则保持其位置不变;否则将其调至包含该SQP的子句末尾,17,后向调序模型,针对句型:所有句型 调序对象:在翻译中最有可能调序的短语=介词短语、时间地点短语 调序的两个关键问题 介词短语、时间地点短语与动词短语的识别 调序策略,18,调序的两个关键问题,介词短语、时间地点短语与动词短语的识别 采用chunking浅层句法分析 虚拟动词短语(VVP)的定义:由于识别错误等原因,有时在介词短语、时间地点短语后没有识别出动词短语。为加强该模型的适应性,我们定义自此介词或时间地点短语后到子句的结束为伪动词短语,并赋予其动词短语的功能。 例:请 在 这里 签名 。“签名”被识别为NP,在我们的模型中,它就是VVP,19,调序的两个关键问题,调序策略:利用最大熵模型决定识别出的介词或时间地点短语是否需调序到紧跟着它们的动词短语后。 调序规则:,20,逆后向调序模型,面向英汉翻译任务 介词短语、时间地点短语等的识别方法同后向模型 调序方向相反,21,逆后向调序模型,调序规则,22,实验设计与结果,baseline: 利用我们实验室实现的基于短语的统计机器翻译系统 利用单调的解码策略,23,实验设计与结果,语料说明: 表1:汉英翻译相关语料 表2:英汉翻译相关语料,24,实验设计与结果,实验结果: 表3:汉英翻译实验结果 表4:英汉翻译实验结果,25,总结与展望,句型信息对口语翻译的帮助非常大 研究汉语的特点才能更有效地提高机器翻译质量,26,THANKS!,

    注意事项

    本文(融入句型信息的汉英双向调序模型.ppt)为本站会员(本田雅阁)主动上传,三一文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一文库(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    经营许可证编号:宁ICP备18001539号-1

    三一文库
    收起
    展开