硬件运维工程师是做什么的
1、质量:保障并不断提升服务的可用性,确保用户数据安全,提升用户体验。2、效率:用自动化的工具/平台提升软件在研发生命周期中的工程效率。
3、成本:通过技术手段优化服务架构、性能调优;通过资源优化组合降低成本、提升ROI。
硬件运维工程师日常工作
对比不同品牌的设备性能及成本,进行新设备采购,并做好硬盘等设备的预热工作(有时新买的需要一个磨合期)。安装设备与布线,包括服务器,交换机,路由器,网线、电线的规划。这个规划是要考虑软件的需求的,比如有一些服务器之间要能够连通,不能根据完全根据个人审美。
备份策略的制定与实施:服务器是不能一个萝卜一个坑的,不然坏掉一台就会影响用户使用了,因此要在考虑网络联通的前提下,规划好哪些机器是主要机器,用来提供服务,哪些是对应的备用机器,并配合软件工程师或软件运维做好配置。
巡检:我们就以一千台服务器为例吧,每天去低温环境里待几个小时好像也不是高科技行业该做的工作。因此我们需要在服务器上安装相应的软件来帮我们做监控,并能够发现问题,自动报警;硬件也是同理,我们不能拿电笔去测每个插座有没有电,是要靠电路监控的。
维护:并不是有了自动化监控就没有其它事情了,而是我们要不断的根据实际情况调整自动化的策略。同时,出现的问题要处理,必要的走到每台机器前例行检查也是少不了的,发现异常的响动这些,就要及时维修。
新增:业务发展是好事,用户多了,需要的资源多了,就要规划是买新的服务器,还是只买cpu或者内存,加到现有的服务器中。
硬件运维工程师工作职责
1. 负责利用监控平台进行线上系统的7*24运行保障;2. 对发生告警或故障事件,能及时判断严重等级,并根据流程规范进行问题处置;
3. 响应报障电话、邮件,跟踪管控故障的处理,及时完成信息记录归档;
4. 辅助进行日常运维相关活动。