欢迎来到三一文库! | 帮助中心 三一文库31doc.com 一个上传文档投稿赚钱的网站
三一文库
全部分类
  • 研究报告>
  • 工作总结>
  • 合同范本>
  • 心得体会>
  • 工作报告>
  • 党团相关>
  • 幼儿/小学教育>
  • 高等教育>
  • 经济/贸易/财会>
  • 建筑/环境>
  • 金融/证券>
  • 医学/心理学>
  • ImageVerifierCode 换一换
    首页 三一文库 > 资源分类 > PDF文档下载  

    56.com 视频推荐与大数据架构介绍.pdf

    • 资源ID:3329557       资源大小:949.46KB        全文页数:23页
    • 资源格式: PDF        下载积分:6
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录 QQ登录   微博登录  
    二维码
    微信扫一扫登录
    下载资源需要6
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    56.com 视频推荐与大数据架构介绍.pdf

    视频推荐与大数据架构介绍 56搜索组团队 余镇源 用户数据挖掘与视频推荐 怎样通过大数据挖掘用户价值? 用户行为 用户观看,评论,转贴分享等行为数据收集 推荐引擎 正向:多种推荐引擎结合计算 推荐数据 待推荐视频排序并展示给用户 用户反馈 反向:相关视频反馈系统与个性化反馈系统 环形 正向与反向收集与计算,自动调整优化系统 用户行为收集 用户行为收集 行为类别 行为类别 录入数据量 录入数据量 每天行为记录 千万级别 每天用户反馈行为记录 千万级别 行为数据总量 几十亿级别 登录与非登录用户 亿级别 推荐引擎系统 如何做推荐引擎?思路。 推荐引擎系统 推荐引擎系统 正向:协同过滤推荐计算 反向:相关视频反馈系统 推荐引擎业务应用 相关视频: 转化率提升: 1)主站播放页原来8%转化率 25%转化率 2)手机客户端达40%转化率 实现效果: 1)旧算法:文本相关,缺点:太依赖文本信息,文本不相关但内容相关不能找出来,文本太相关主题不 发散。 2)新算法:完全依赖用户行为转化成视频相关,实现相关又发散的效果,主题可以发散 推荐引擎业务应用 猜你喜欢: 1 个人中心与首页推广使用 (18%转化率) 2 准备投入播放页面使用(预计千万请求量无缓存) 大数据后台的系统架构 分布式存储 HDFS分布式文件系统,HBase列式存储数据库 分布式计算 Yarn资源调度系统,MapReduce ,Spark计算引擎 分布式搜索 SolrCloud分布式搜索,以及Hbase推荐服务入口 集群 Hadoop,hbase,solrCloud集群架构 性能 各集群数据性能 大数据分布式存储与计算架构 分布式搜索架构 完整服务流程例子? 硬件配置 1)搜索集群架构 (solrCloud集群) 5台布置了两个zookeeper集群 (solrCloud以及hadoop系列使用) 16台机器做搜索solrCloud服务 (64G RAM+24cpu+256GSSD) 2)分布式存储与计算架构( hdfs,hbase ,yarn) HBase/HDFS: 10台存储*10个硬盘*64G*24cpu+2台namenode Yarn:30台结点计算,虚拟分配 20G*10台+8G*16台+4G*4台 Yarn中使用搜索机器共享出来的内存与cpu做计算使用 Hadoop HBase Hbase吞吐量 hbase高峰期,每秒并发读200万左右(主要是MR计算),平时是4000/s读请求 HDFS性能 HDFS 文件系统 数据读写吞吐量平均如下,高峰则2G/s 总量200多T 搜索性能 展望 运用Spark计算框架 ,视频准实时推荐计算(图计算),广告业务等 谢谢 谢谢!

    注意事项

    本文(56.com 视频推荐与大数据架构介绍.pdf)为本站会员(爱问知识人)主动上传,三一文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一文库(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    经营许可证编号:宁ICP备18001539号-1

    三一文库
    收起
    展开