什么是运维?运维主要做哪些工作?

news/2024/11/20 1:28:04/

  今天先探讨下运维主要做什么,至于需要的具体技能、需要会的(MySQL? Apache? python?)首先还是要重申一下,我们这里的运维不是指工厂设备维护,也不是办公IT支持,我们这里讨论的运维工作只限于大型业务系统的运维,比如阿里、美团、京东做运维的攻城狮们,需要过硬的技术、敏捷的头脑、还有,还有就是强悍的体魄。

一、什么是运维

  运维顾名思义就是运行维护,运维工程师就是要做好生产系统的稳定运行维护工作。是不是很好理解?但是光这一句稳定运行,需要运维工程师们具备各方面的能力,以至于一人无法完成全部维护工作,从而形成了各类运维工程师的分工协作,比如应用运维、系统运维、网络运维等。最近很火的devpos概念,可能有人已经有所了解了,现在说的devpos工程师就是开发与运维的结合,提出运维需要开发技能。个人认为有些扯淡,运维本来就要会些开发技能的,但是运维和开发还是有本质区别的,其思考方式就不一样,开发人员考虑的是系统实现功能马上投产,运维工程师关心的是系统好不好用,是不是具备高性能,高可用?怎样去保证每天长治久安的安全稳定运行?所以个人以为运维就是运维,运维本身也需要开发技能,但是从总体上说还是运维工程师,我们会的比开发工程师还要多,开发只是我们工作的很小一部分。

二、运维工程师主要做哪些工作

  既然工作目标是保证系统的安全稳定运行,那么我们的工作就是围绕着这个目标转。我们需要:

2.1、构建系统监控体系

  没有监控就等于是瞎子,系统出了问题都不知道,要是哪天支付宝不能支付了,支付宝的运维工程师肯定是第一时间知道的,总不见得等用户投诉,媒体报导了自己才知道吧?关于监控体系我之前已经说过了。

2.2、应急处理

  系统出故障了怎么办?着急的看着束手无策肯定不行,这时一个优秀的运维工程师的价值就体现出来了,一个有经验的运维工程师能第一时间确定故障原因,并迅速恢复业务,保证对外影响时间最小。当然,这里故障是多方面的,有应用故障,数据库故障,甚至是网络线路故障。

2.3、 技术问题分析

  出了问题就需要分析,这里需要具备一些必备能力,比如网络抓包分析、tcpdump抓包及分析、代理的机制等。

2.4、业务问题处理

  就是在业务层面进行统计分析,比如统计系统的每日交易量,成功率,错误码的分布情况,这对这些错误码分析原因,找出集中在哪个环节,集中在哪家商户,找到他,然后冲过去帮商户解决问题。

2.5、版本测试

  开发发布版本后运维工程师需要进行相应的性能和高可用测试,不具备高可用的系统建议还是不要上线了,否则后果不堪设想。

2.6、版本上线

  这个就需要体能储备了,在晚间业务量小的时候悄悄的进行,要让用户无感知,熬个夜完成系统的升级改造,第二天给广大用户一个惊喜,有没有发现有时候一夜之间支付宝,京东啥的换了个页面,出了啥新功能啥的?

2.7、系统演练

  养兵千日用兵一时,平时不努力,故障时吃苦头。所以平时自己要安排些实际故障的演练,验证下系统的强制性,再考验下一线工程师的应变能力。

2.8、工具开发

  运维没有工具怎么行?包括监控工具、交易成功率统计分析工具、变更自动化工具等等。

2.9、业务分析

这个你需要具备一项新技能:“统计分析”。各种统计分析工具,数学建模是必须要掌握的内容。


http://www.ppmy.cn/news/717755.html

相关文章

网络维护日常工作

网络工作主要包含三个方面:网络建设、网络维护和网络服务。 1.网络设备的管理 网络设备的管理是网管工作中重点中的重点。 要管理网络设备,就必须知道网络在物理上是如何连接起来的,网络中的终端如何与另一终端实现互访与通信,如何处理速率与带宽的差别,同时网络是如何

Codeforces Minimize Permutation Subarrays(构造)

You are given a permutation p of size n. You want to minimize the number of subarrays of p�hat are permutations. In order to do so, you must perform the following operation exactly once: Select integers i, j, where 1≤i,j≤n, thenSwap pi and pj…

大数据面试题:Kafka的Message包括哪些信息

面试题来源: 《大数据面试题 V4.0》 大数据面试题V3.0,523道题,679页,46w字 参考答案: 一个 Kafka 的 Message 由一个固定长度的 header 和一个变长的消息体 body 组成,header 部分由一个字节的 magic&…

DLSS/NIS/FSR

免费的性能增强怎么来的? 有哪些技术: 英伟达 的 DLSSAMD 的 FSR英特尔 的 XeSS 原理: DLSS技术利用 Tensor Core来提升游戏帧数。DLSS全称 Deep Learning Super Sampling,即深度学习超级采样,先渲染低分辨率的图像…

5G,会消灭电视吗?

11月15日,在2019中国移动全球合作伙伴大会上,中国移动副总裁简勤称,预计到2020年将销售1亿部5G手机、5000万台家庭泛智能终端以及1500万行业模组。从这一计划可以看到,现阶段5G最典型的应用场景是智能手机,第二场景是家…

优秀的 Verilog/FPGA开源项目介绍(十一)- SPI/SPI FLASH/SD卡

优秀的 Verilog/FPGA开源项目介绍(十一)- SPI/SPI FLASH/SD卡 0 官网 https://www.spi-inc.org/ https://www.2spi.com/ Software in the Public Interest (SPI) 是一家在纽约州注册的非营利性公司,其成立的目的是为开发开源软件和硬件的组织提供财政赞助。我们的使命是通过…

海外权威媒体连续三年颁奖中国电视,这项新技术很关键

有关中国智造的故事,总是一个比一个精彩。经历行业地位上升和技术研发转型期后,中国的科技企业开始以充沛热情向市场推出越来越多的好产品,甚至走出国门在国际市场上获得领先地位,令一众国际竞争对手汗颜。 有这么一个来自中国的电…

AI成为强大的像素绘图工具

借助神经渲染技术,AI以高达530%的渲染加速击败像素图形处理。 2022年9月20日,英伟达的应用深度学习副总裁布莱恩•卡坦扎罗(Bryan Catanzaro)在推特大胆声称,在《传送门》RTX版等GPU密集的游戏中,屏幕上的8…