欢迎来到三一文库! | 帮助中心 三一文库31doc.com 一个上传文档投稿赚钱的网站
三一文库
全部分类
  • 研究报告>
  • 工作总结>
  • 合同范本>
  • 心得体会>
  • 工作报告>
  • 党团相关>
  • 幼儿/小学教育>
  • 高等教育>
  • 经济/贸易/财会>
  • 建筑/环境>
  • 金融/证券>
  • 医学/心理学>
  • ImageVerifierCode 换一换
    首页 三一文库 > 资源分类 > DOC文档下载  

    搜索引擎的智能化发展趋势.doc

    • 资源ID:7211665       资源大小:28KB        全文页数:9页
    • 资源格式: DOC        下载积分:4
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录 QQ登录   微博登录  
    二维码
    微信扫一扫登录
    下载资源需要4
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    搜索引擎的智能化发展趋势.doc

    搜索引擎的智能化发展趋势本文档下载自文档下载网,内容可能不完整,您可以复制以下网址继续阅读或下载:http:/doc.wendoc.com/b08b78dd0eb49487cba2abfd0.html选填,简要介绍文档的主要内容,方便文档被更多人浏览和下载。科技情报开发与经济(!#()文章编号:"#$%的程序软件定期在网上爬行根据网页链接进行搜索,在网上自动抓取和分析被它找到的网站及底下相链接的所有网页,然后利用索引软件对收集的信息进行自动标引建立较为庞大的索引数据库,覆盖面相对较大并按照一定的策略进行更新,但是不够精确。基于自主索引数据库提供检索服务的搜索引擎被称为独立的搜索引擎,而元搜索引擎则不同。元搜索引擎通过使用其他独立引擎的索引数据库,将独立搜索引擎的搜索功能加以集成,获得较全面的检索效果。它将用户的查询要求给予分析和转化,分别提交给协作的独立引擎同时处理,然后将独立搜索引擎结果进行二次加工,并标明结果记录的本源搜索引擎及相关度,不同的元搜索引擎具备不同的处理方式。任何独立搜索引擎不可能涵盖"#?的./0信息,通常最多不超过#?。元搜索引擎借助一些覆盖域不同的独立引擎,提高检全率,但是不能充分使用原搜索引擎的查询功能,存在检准率控制问题。!搜索引擎存在的问题!"信息检索质量不高搜索引擎通常依赖于自动建立的摘要,该摘要一般取自./0页的主题或前几行内容形成的,不一定反映实际情况。根据这种索引数据检索出来的结果将出现偏差,不能很好地满足用户的检索需求。搜索引擎对要检索的信息仅仅采用机械的词语匹配来实现,缺乏知识处理能力和理解能力。!检索方式单一搜索引擎一般提供分类浏览的查询方式和关键词的全文检索,不能实现概念检索,不能从文献的多个方面对检索提问进行限制,只能就某一关键词或者概念进行笼统的检索。!个性化服务问题搜索引擎提供相同的界面和检索策略,不提供用户的信息定制,任何人输入相同的查询条件返回的结果必定相同。搜索引擎提供拉 133服务方式,即用户输入检索要求,系统返回包含大量包含关键词及其相应地址列表的页面,不能根据用户的一贯兴趣模式和一定的专业领域主动反馈有用的信息,无法实现推 1AB服务方式。!(:/doc.wendoc.com/b08b78dd0eb49487cba2abfd0.htmlpar搜索引擎对信息的标引深度不够目前,搜索引擎检索的结果往往只提供一些线形的网址和包括关键词的网页信息,与人们对它的预期存在较大的距离,或者返回过多的无用信息,或者信息丢失,特别是对特定的文献数据库的检索显得无能为力。!$信息收集与检索的分离搜索引擎进行信息的收集和查询是两个分离的过程,缺少有机的结合。系统无法根据用户的检索要求进一步提供相关信息,用户不能依据有关提示进行理性的检索,操作比较机械。智能化搜索引擎特征搜索引擎的智能化是其发展的根本趋势,只有开发出智能化的搜索引擎才能真正实现为用户提供更好的信息服务的目的。智能化搜索引擎是基于人工智能-C,融合专家系统、自然语言理解、用户模型、模式识别、数据挖掘及信息检索领域的知识和先进技术发展起来的。智能化搜索引擎具有与传统搜索引擎不同的特征。"搜索信息更加准确传统的搜索引擎使用方法是被动搜索,通常执行基于关键词的信息检索方式。准确的搜索应该建立在对收录信息和搜索请求的理解之上,智能化搜索引擎使用自然语言理解技术,能实现分词、同义词理解和短语识别,将信息检索提升到知识(概念)层面,可以同用户进行自然语言交谈,并深刻理解用户的搜索请求,查询的结果更加准确。!搜索智能化且功能强大智能化搜索引擎除了提供传统搜索引擎的快速检索、相关度排序等功能外,还提供信息服务表现相当的智能性;智能化搜索引擎具有跨平台工作和处理多种混合文档结构的能力,能处理B*D3、ED3文档、*E*、.F2G或. A文档以及其他相关类型的文档;智能化搜索引擎支持多!""刘遵雄搜索引擎的智能化发展趋势本刊#$%&()* *,%&(-./012-034信息产业语言检索处理和转换功能,实现机器翻译技术,用户可以使用母语检索其他语言表示的信息。F-F信息服务个性化智能化搜索引擎提供用户角色登记、用户兴趣自动识别、智能化信息过滤和信息推送主动服务http:/doc.wendoc.com/b08b78dd0eb49487cba2abfd0.html等功能,能提供更加方便的符合特定需求的信息服务。页的链接,可以计算出K3*页的权威权重和关键权重,该技术在RST的“权威”UV#W#O系统中得到应用。智能化搜索引擎可以使用户优先响应的页面,提高检索质量。(包括检K3*行为挖掘是通过对用户以往使用搜索引擎的日志文件索时间、检索词、路径以及检索中浏览的检索结果)进行分析,总结出用户检索行为的模式,实现智能性信息过滤,个性化和主动信息服务。G-F自然语言理解技术自然语言理解是人工智能研究领域的一个重大课题,旨在通过研究开发实现计算机对人们日常交流的自然语言的分析和回答,从而达成更加有效的人机交互,确保搜索结果描述的准确性、相关性和相似性,而且自然语言理解关系到智能化搜索引擎建立知识库的效果。自然语言理解涉及语言学研究方面的技术,如汉语分词、短语识别等技术。G-G分布式并行计算技术计算机网络技术的发展使系统间的资源(包括计算机软硬件)共享成为可能,从而摆脱了应用计算依附少量大型机的局面,相关应用真正实现了分布式数据存贮和分布式计算的功能,极大地提高了应用实现的灵活性和工作效率。智能化搜索引擎面向的是一个分布、异构的信息库系统,其收集和索引的K3*信息实现了分布式存贮,关键是对这些资源进行有效的整合,以方便用户的高效检索。例如,元搜索引擎利用了别的独立搜索引擎的索引数据库,面向的是分布的各数据库系统。同样智能化搜索引擎可以利用计算机最新发展技术建立自主的分布的索引数据库、知识库和用户规则模式库,并提供一定的镜像支持。智能化搜索引擎派出的多个搜索代理可以独立地进行信息收集和使用分布式并行计算的功能,并将信息提交给多个索引代理协同或独自创建索引数据库和知识库等。GG-"智能化搜索引擎主要技术智能代理技术智能代理自!H世纪IH年代出现以来一直作为人工智能研究领域的热点技术得到不断推广,被广泛用在信息服务、网络管理、电子商务以及教育娱乐http:/doc.wendoc.com/b08b78dd0eb49487cba2abfd0.html等实际应用上。智能代理是一段计算机程序或具体硬件系统,能依据一定的需求,自主地完成相关的功能或任务。智能化搜索引擎采用了功能不同的J=304.以提供更好的信息服务。例如,作为用户接口的J=304.具有学习用户行为和操作的能力,并在用户下次执行同样的操作或特定需要时做出正确适当的反应。具有通过事例学习的能力。G-!K3*挖掘技术是近几年来随着数据数据挖掘,也称为数据库中的知识发现LMM,库和人工智能发展起来的一门新兴的数据库技术,帮助人们从庞大的目标数据集合中抽取出可信的、新颖的、有效的并被人们理解的知识。互联网是一个巨大的信息资源库,其分布广泛,涉及诸多信息服务,并包含丰富的超链接信息和K3*页面使用访问信息,结合机器学习的方法,合理地对这些信息进行挖掘建立用户规则库和信息资源知识库,可以为搜索引擎提供智能化的信息服务提供保证。在智能化搜索引擎中K3*挖掘同样区分为K3*内容挖掘、K3*结构挖掘和K3*使用挖掘。K3*内容挖掘对搜索器收集的K3*页面中的文本进行适当的分析解释,避免传统搜索引擎分析方法的简单化,结合索引器建立更加精确的K3*文档索引库。为了有效地进行K3*文档挖掘,必须解决好文档的表示问题,实现文本的自动分类和检索结果的联机聚类,文本的自动分类可称之为有导师学习,基于一组预先分类好的文档,对新收集的K3*文档加以分类,从而建立更加精确的分类索引数据库,便于用户检索。常用的自动分类法有朴素贝叶斯分类和L$最临近分类等。检索结果从某种角度讲可算是大量返回信息组成的K3*文档,通过对检索结果文档集合进行聚类,使与用户检索需求相关的文档聚类较近并提交这样的结果给用户。K3*结构挖掘主要通过K3*之间超链接关系及K3*文档自身的机构信息(J0X结语任何实际技术总是在应用需求和相关科学技术的推动下逐步发展起来的,智能化搜索引擎能够实现信息服务的人性化、高效化,为用户检索互联网信息提供了极大的便利,其发展是一个长期的过程。目前的搜索引擎主要提供基于文字的信息检索服务,而对于语音、图像的http:/doc.wendoc.com/b08b78dd0eb49487cba2abfd0.html检索有大量的工作要做,搜索引擎真正地实现智能化并不简单,但是我们有理由相信,技术的进步将会给用户带来更好的信息检索工具。参考文献张晓刚-智能搜索引擎技术的研究与发展YZ-计算机工程与应(!G)用,:!HH"$H-Y!ZYFZYGZ(G)吴丹-搜索引擎的智能化研究YZ-情报理论与实践,!HH!:陈福集-一种基于LMM的K3*搜索引擎框架YZ-情报学报,!HH!IF$!IX-():!$!-李广建-基于KKK的全文检索系统设计与实现YZ-现代图书情(!)报技术,:!HHH!$!-(责任编辑:刘翠玲)Y"Z"""""""""""""""第一作者简介:刘遵雄,男,江西省瑞昌市人,"I年"!月生,"III年毕业于华东交通大学,讲师,华东交通大学信息工程学院,江西省南昌市,FFHH"F-!"#"$%&()* "(,%-./"0(."$"1.23$43.%(%-./"5"3 1/6()("70892(:;%()%&?3.&0&(9.&0:&(;&4202046348&:420&(.3&8&0:7;4.128C&8:.283(&43:43!5:.3&8!"!文档下载网是专业的免费文档搜索与下载网站,提供行业资料,考试资料,教学课件,学术论文,技术资料,研究报告,工作范文,资格考试,word文档,专业文献,应用文书,行业论文等文档搜索与文档下载,是您文档写作和查找参考资料的必备网站。文档下载 http:/doc.wendoc.com/亿万文档资料,等你来免费下载

    注意事项

    本文(搜索引擎的智能化发展趋势.doc)为本站会员(李医生)主动上传,三一文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一文库(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    经营许可证编号:宁ICP备18001539号-1

    三一文库
    收起
    展开