七牛云存储的运维实践.ppt
七牛的运维实践,韩拓,第22期: 云存储平台的实战经验分享 - 七牛云存储技术专场 www.LAMPER.cn http:/weibo.com/lampercn,七牛的场景,服务器数量多 网络带宽大 5人的运维团队 服务种类多,进程实例多 客户类型非常复杂 对服务品质诉求高 对基础资源的依赖,我们的工具链,github.com jenkins redmine zabbix jiankongbao.com puppet supervistor 自主研发系统.,我们的工作流程,开发 集成 质量控制 部署 监控 日志及运营数据分析,开发,开发包括哪些事情? 开发的流程 分支 开发人员的职责,集成,基于jenkins,基本没有做修改 编译耗时的控制,和底线 交叉编译 大部分编译仍由手工触发 二进制包的构成,构建服务器,质量控制,静态质量控制: 特点:容易实施,覆盖率低,安全无害 手段:code review,单元测试 半动态质量控制: 特点:实施有难度,覆盖率较高,需要花精力保证,安全无害 手段:集成测试,预发布环境 动态质量控制: 特点:最难实施,覆盖率最高,有副作用 手段:灰度发布,监控,日志分析,部署,部署什么? 通常部署的流程 puppet deploy.git 跳板机 指令编排,部署系统,监控,我们认为监控是运维体系中最重要的一环 已经积累了几万个监控点 基于zabbix 在目前阶段,监控系统尽量保持为一种非侵入式的存在 get.sh、action.sh env.sh,数万个监控点,日志和运营数据分析,日志也要高可用,高可靠 实时分析 准实时分析 离线分析,业务数据,Q & A,我们的微博: 七牛云存储 试用我们的服务: http:/qiniu.com,