欢迎来到三一文库! | 帮助中心 三一文库31doc.com 一个上传文档投稿赚钱的网站
三一文库
全部分类
  • 研究报告>
  • 工作总结>
  • 合同范本>
  • 心得体会>
  • 工作报告>
  • 党团相关>
  • 幼儿/小学教育>
  • 高等教育>
  • 经济/贸易/财会>
  • 建筑/环境>
  • 金融/证券>
  • 医学/心理学>
  • ImageVerifierCode 换一换
    首页 三一文库 > 资源分类 > DOC文档下载  

    基于元数据技术的教育资源共享平台研究.doc

    • 资源ID:1809262       资源大小:17.73KB        全文页数:11页
    • 资源格式: DOC        下载积分:4
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录 QQ登录   微博登录  
    二维码
    微信扫一扫登录
    下载资源需要4
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    基于元数据技术的教育资源共享平台研究.doc

    基于元数据技术的教育资源共享平台研究 摘 要:针对目前教育资源多源异构、共享程度低、互操作性差的问题,基于元数据技术研发了教育资源共享服务平台。同时,针对教育资源元数据库信息量大,导致检索速度慢,无法为学习者提供有效性服务的问题,基于FTC聚类算法实现了教育资源元数据的聚类。通过实践证明,该平台极大的提高了教育资源的共享程度,且性能稳定,服务上乘,通过聚类算法的嵌入使得用户能够快速定位所需资源,为学习者提供了一个良好的学习环境。 一、引言 目前,无论是在国家层面还是在各个院校、教育、培训等部门都意识到了教育资源在全社会范围内共享的重要性。教育资源共建共享的理念正逐步深入人心。实现教育资源的共建共享,对于推动全社会教育公平,促进教育平衡发展,提高国家教育质量,推进全国教育与社会发展具有重大现实意义。1基于这样的背景,本研究开展了晋北地区教育资源共享服务平台的构建工程。从2010年初至今,已经收集了来自晋北地区各个学校或培训机构的数千条具有重要教学价值的教育资源。为了建构合理的教育资源库,针对教育资源具有跨学科、多源异构、异质等特点,提出了基于元数据技术进行教育资源整合的方案,并在资源整合的基础上开发了教育资源元数据共享服务平台,为实现教育资源在全社会范围内的共建共享提供途径。同时针对教育资源元数据库信息量大、检索速度慢、无法为用户提供有效服务的问题,提出基于FTC实现教育资源元数据的有效聚类。 二、教育资源元数据标准 教育资源往往具有多种表现形式,比如说文档、网页、图片、视频等。这些教育资源大多以非结构化形式存在,影响了数据的存储,进而导致教育资源的共享难以实现,不同的教育部门或机构之间的沟通也无法得到保障。而建设教育资源数据共享工程、构建教育资源数据共享服务体系,必须要保证对教育资源数据共享技术体系架构有统一的标准。通过元数据标准来定义一致的数据资源描述框架,是使得教育资源在数据共享层面能纳入统一框架的一种有效手段。 所谓元数据标准,指的是描述某类资源的具体对象时所有规则的集合。这里所指的资源就是教育教学资源。实现教育资源元数据的标准化,一方面能够为资源提供方提供一个标准著录格式,以便于其对所拥有的数据资源进行恰当描述。另一方面,有助于实现对教育资源的高效组织和管理,并帮助学习者快速的定位所需信息。再者,教育资源元数据标准的制定为实现不同教学系统间元数据的互操作提供技术支持。 目前,国际上常用的教育资源元数据标准主要有三类:IEEELOM、DC-Education和ADL/SCORM。其中,IEEELOM是学习对象元数据标准,目的是完成学习对象的描述和管理。DC-Education又称为都伯林核心教育元数据,是在DC的基础上增加了一些新的元素并复用到DC-Education。ADL/SCORM称为可共享内容对象参考模型,目的是实现教育资源的可重用性。2,3 结合我国各类教育资源的特点,本文以DC-Education作为元数据标准的基础,并根据实际情况对其进行了部分调整。元数据是对原始数据结构特征的描述,学习者浏览元数据的最终目的是为了访问原始数据资源。原始数据资源可能以文件形式提供,也可能以HTTP或FTP方式提供。为了便于学习者根据元数据定位到原始数据资源,本研究对DC-Education增加了文件服务、HTTP服务和FTP服务三个字段。这样用户在浏览元数据的时候,如果想对该教育资源有更进一步的了解,可以通过共享平台提供的文件服务进行相关文件的下载,或者可以通过HTTP服务和FTP服务进行在线资源的跳转访问。 教育资源具有跨学科、多源异构、异质的特性,导致无法采用统一的数据结构进行有效存储,阻碍了教育资源共享平台的建设。而以上元数据标准的制定使得各种不同的教育资源都能够用相同的模式去表示,对于建设教育资源共享平台、实现教育资源的互操作都有极大的推动作用。 三、教育资源共享平台架构设计 1.以元数据技术为核心的体系结构 一个服务上乘的教育资源共享服务平台,不仅能够通过元数据为学习者提供数据资源的发现、查询、数据导航等功能,而且还要为资源提供方提供元数据的汇交、上传和注册等服务。可以说,作为数据共享中心的一个透明的中间层,元数据发挥着“一站式”服务的核心功能。以元数据为中心,结合教育资源数据共享的特点,本文把教育资源共享服务平台的基本功能划分为四大模块,即教育资源的浏览和查询、教育资源的发布、教育资源的访问和在线分析服务。这些基本功能将在元数据的统一调度下完成教育资源的汇交、共享、查询、浏览、下载和分析等数据服务。 (2)教育资源发布。共享平台为教育资源的发布提供两种方式。其一:直接把元数据信息从已经收集到的原始数据资源中提取出来,并注册到共享平台的数据目录服务中,保证学习者能够浏览和查询该数据资源;其二:资源提供者通过共享平台提供的元数据汇交接口把数据资源提交到数据库中心。汇交内容不但包括描述教育资源的元数据,同时也包括教育资源原始数据,在汇交的同时完成数据的注册。数据提供者一旦把数据发布在教育资源共享服务平台中,经管理员审核通过后,全球用户都可以通过网络发现和访问这些数据资源。 (3)教育资源访问。教育资源访问通过两种模式实现,一种是通过元数据浏览或查询接口获取相应的数据资源,如可以直接链接到数据,可以下载数据,还可以预订数据。另一种是对平台功能进行扩展,为用户提供元数据接口调度信息服务功能,以此达到元数据浏览、分析和操作的目的。 (4)教育资源在线分析。为了更好的服务用户,平台提供数据分析功能。一方面,对所有用户访问信息进行统计分析,找出用户感兴趣的教育资源,对此类数据资源要加强更新,以满足用户连续性学习的要求。另一方面,对独立用户进行知识偏好统计,通过显示的询问方式或隐式的跟踪用户行为方式,分析其学习兴趣所在,在此基础上为其提供个性化信息服务。 围绕上述功能,网络平台的结构框架如图1所示。从总体结构上可分为五层,自底向上分为网络平台层、资源管理层、核心服务层、共享业务层、平台门户层。4每个层次各司其职,分别完成不同的任务。为了便于平台实施开发,依据平台的层次结构,把功能细分为13个相对独立但彼此联系的子系统。分别为平台门户和功能入口子系统、元数据汇交子系统、数据资源下载子系统、数据资源浏览查询子系统、数据资源审查发布子系统、数据安全服务、元数据服务、数据分析服务、日志服务、备份管理、原始资源管理、元数据管理、用户信息管理,如图1所示。 2.教育资源元数据汇交及审核发布 建好一个教育资源平台,只有少数人能用,只有少数人参与建设,那不叫共建共享。资源建设中只有做到全员参与,全员使用,所创建的资源库才能做到动态更新,才能成为活的资源库,才能充分发挥所建资源库或资源平台的作用。为了实现真正意义上的共建共享,教育资源共享平台为广大用户提供了元数据汇交接口,通过系统提供的元数据汇交界面,注册用户就可以方便的向共享平台提交自己的数据资源。所以元数据汇交是该平台的一个核心模块。 用户提交的数据资源有可能涉及非法言论,在正式发布之前需进行必要的审核。审核任务由系统管理员经平台所提供的元数据管理模块完成。 元数据汇交及审核发布系统为教育资源的共建共享提供技术支撑,保障了共建共享机制的完美实现。元数据汇交由注册用户完成,其流程如图2所示,元数据审核发布由系统管理员完成,其流程图如图3所示。 四、基于改进FTC的教育资源元数据聚类 教育资源共享平台的开发要坚持以人为本、以学习者为中心,强调为学习者提供高效的资源获取途径。5随着教育资源共享服务平台的不断完善以及用户群的不断扩展,教育资源信息量将会越来越大。当信息量超过一定的限度时,将导致检索周期长、检索速度慢的问题,学习者在检索到的海量信息面前很难定位真正需要的教育资源。为了提高学习者检索效率并帮助用户快速定位所需资源,本文把数据挖掘中的聚类思想用于教育资源元数据的合理组织。把教育资源按某种聚类算法进行处理以后,学习者就能够依据聚类结果,快速定位自己所需要的教育资源,这样不仅大大提高了学习者信息的查准率,为学习者提供了一个良好的学习环境,也有利于对教育资源的充分利用,有效提高了教育资源在全社会范围内的共享程度。 聚类是数据挖掘中一项重要的技术。传统聚类算法像基于层次的CURE或基于划分的K-MEANS都可以实现数据聚类,但是这些算法大多采用向量空间模型表示数据,容易产生“高维效应”,直接聚类效率及准确度。针对这样的问题,Bei和Xu在文献6中提出了一种基于频繁项集的数据聚类方法FTC(Frequent Term-based Clustering)。FTC算法对高维度数据聚类具有较强的处理能力,可伸缩性良好。该算法产生的簇标签可以为用户浏览或检索数据资源提供方便。但是FTC会把一条元数据硬性的划分到唯一结果簇中,而未考虑教育资源多主题性的自然属性,因此不能获取最优聚类结果。针对FTC算法在实现教育资源元数据聚类中存在的不足,本文进行了有效改进,定义了簇间相似度度量公式,以决定簇间是否应该存在重叠,合理实现了对候选簇的软分离,保证了聚类结果全局最优。 1.FTC算法介绍 FTC算法的基本思路是:首先从元数据集合中把所有满足最小支持度的频繁项集全部找出,同时把包含相同频繁项集的元数据集合作为一个候选簇,然后通过一种贪心算法,循环选择与其他候选簇重叠度最小的作为结果簇,当结果簇集合覆盖到所有元数据,则算法为止。 考虑到一条元数据通常包含多个频繁项集,因此它可能分属于不同的候选簇,即簇间重叠现象比较严重。特定义了熵重叠度(entropy overlap)EO(Ci),以作为衡量Ci与其它候选簇的重叠情况的标准,如公式(1)所示。 EO(Ci)=-•1n()(1) 所包含的频繁项集个数用fj表示。 熵重叠度能够表达簇Ci所支持的频繁项集在其它候选簇中的分布情况。从公式(1)可以看出,EO(Ci)值越大,Ci与其它候选簇的重叠越严重。特别的,值等于0时,所支持的元数据都不包含其它频繁项集,表示Ci与其它候选簇之间不存在重叠。 输出:结果簇集合C (2)置聚类结果簇集C为空。 (3)计算所有Ci的熵重叠度。 (4)找出熵重叠度最小的簇Ci,并将之并入结果簇集C中。 (5)对于任一DjCi,若Dj同时也属于其它簇Cj,则从Cj中直接删除Dj。 (6)把Ci从候选簇集中删掉。 (7)判断结果簇C是否能够包含所有元数据,若不能,则返回(3)重复执行,否则算法结束。 2.FTC算法改进 为了确定是否应该把一条教育资源元数据归属到不同的簇中,定义衡量簇间相似度的计算公式: sim(Ci,Cj)=*(2) 如前所示,在FTC实现聚类的第(5)步骤中,如果把Ci作为结果簇,则支持Ci的一条元数据Di,若同时也存在于其它候选簇Cj中,将会直接从Cj中把Di删掉,而未考虑教育资源元数据多主题性的特点。为了避免FTC算法的此点缺陷,首先依据公式(2)计算出簇间相似度sim(Ci,Cj),若sim(Ci,Cj)小于实现确定的阈值?唬?则表明两簇的主题差异较大,Cj中的元数据Di应予以保留;如果sim(Ci,Cj)大于?唬?表名两簇主题相似程度很高,此时应把Cj中的元数据Di删掉,采用这种方法合理的实现了软聚类。 3.聚类结果评估 为了评估聚类结果的有效性,本文以晋北地区教育资源共享平台为依托,分析对比了聚类前和聚类后的检索效率,如图4所示。 从图4可以看出,随着数据量的逐渐增大,聚类前和聚类后的平均检索时间都逐渐增大,但聚类前的平均检索时间增大的更快一些,表明本文提出的基于FTC的教育资源元数据聚类策略,能够在相当程度上提高学习者的检索效率,减少了学习者不必要的等待时间。 五、总结 教育资源跨学科、多源异构、异质的特性导致了教育资源共享程度低、互操作性差的问题,阻碍了教育资源在全社会范围内的共建共享。为了有效的利用教育资源,提出了采用元数据技术对其进行合理描述的方案,这种结构化的描述方式大大提高了教育资源的共享和集成程度。同时,为了提高学习者检索效率、帮助学习者在海量信息面前快速定位到所需的资源,把基于频繁项集的FTC聚类算法应用于教育资源的有效组织。实践证明,这种组织方法大大提高其检索速度,且算法生成的簇标签非常便于学习者按类别浏览元数据,为学习者提供了良好的学习环境。

    注意事项

    本文(基于元数据技术的教育资源共享平台研究.doc)为本站会员(3d66)主动上传,三一文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一文库(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    经营许可证编号:宁ICP备18001539号-1

    三一文库
    收起
    展开