一、管理岗职责
1、运维制度建设
2、指定运维规划与策略
3、明确运维职责划分
4、运维质量管理
5、监督运维执行情况
6、沟通与决策
二、运维岗职责(具体运维工作实现)
1、服务器维护
2、Paas和Saas(软件即服务)
3、资源监控和优化配置:资源调度、存储优化;
4、云管平台管理
5、虚拟网络维护
6、监控与故障处理
主动工作:(预先的管理与规划,防止问题的发生)
系统维护与管理
性能监控与优化
资源管理域优化
自动化和工具开发
技术研究和培训
被动工作:(已发生问题处理)
故障响应
问题处理
应急响应
运维安全保障
三、运维安全
1、运维十不准
2、网安十不准
3、账户安全
使用复杂密码
唯一密码策略
定期更换密码
密码管理器:KeePass、Bitwarden。
多因素认证
邮箱账号安全
4、变更规范
系统和软件更新
安全配置
5、操作规范
数据备份和恢复
监控和日志管理
灾难恢复和
6、行为升级
安全升级和合规性
7、物理与环境安全
物理安全
设备安全
8、运维生产安全
运维工具配置加密
运维地址表加密
四、网络信息安全
1、网络
网络安全
邮箱安全
2、系统服务端
严禁记住密码
登入限制
定期杀毒
身份验证和访问控制
系统安全配置
3、应用
软件下载
聊天软件
软件版本
4、数据
敏感数据保护避免泄漏
五、监控技术概述
监控核心在于全面覆盖,而告警的核心在于准确及时;
1、监控简介
数据中心监控硬件和用软件;
2、监控对象
容器
分布式存储
分布式系统
3、监控作用
实时监控
告警机制
指标采集
数据存储
页面展示
告警通知
4、监控发展趋势
早期阶段:工具与和平台(top\vmstat\netstat)和目标;
扩展与集成阶段:zabbix、prometheus及grafana
智能化阶段:预测性分析(datadog\splunk\newrelic)
5、传统监控
通过技术手段收集设备指标来保证系统及业务正常运行的管理软件,是对信息技术系统的运行状态监测和管理的过程;
监控内容:
硬件监控
服务器基础监控
数据库监控
中间件监控
应用监控
六、自动化运维
提高运维效率、降低成本、减少认为错误,并提升系统的稳定性和安全性;
1、场景
配置管理自动化:
配置100台服务器配置;
部署自动化:
部署100台nginx应用;
监控与告警自动化:
模版自动关联主机服务器和应用监控;
编译部署自动化:
借助CICD快速迭代工具和快速交付;
自动化安全
系统及软件暴露漏洞扫描告警和修复;
2、关键技术
配置管理运维自动化
Ansible
Inventory:主机ip
语法:
i.域名、ssh用户等
ii.定义访问端口,root用户账号和密码
Modules:常见模块及自定义模块;
文件模块:copy、file、lineinfile(确保特定行是否在文件中)、synchronize(使用rsync同步内容);
软件包模块:package、yum、apt、dnf、gem、pip;
系统模块:firewalld、reboot、service、user;
Net Tools模块:get_url、nmcli、uri;
Playbook:批量处理主机;
定义playbook文件;
要求:Python2.6以上;
ansible.cfg:全局配置行为包含定义默认行为、管理主机文件路径、设置插件和库的路径、配置远程用户、配置角色路径、配置日志记录、配置其他高级选项(待补充)
SaltStack
Puppet
实现批量主机、网络设备、云平台的批量安全配置等操作;
监控自动化
Zabbix
Prometheus
Nagios
通过模版配置和自动关联,实现CPU利用率、内存利用率、空间利用率等指标的监控,出现指标异常自动通知;
编译部署自动化
Jenkins
Bamboo
Argo CD
开发的源代码自动部署到生产和测试环境中,中间的编译、部署、测试环节,有事先配置的规则处理完成;
七、Shell脚本
1、概述
shell脚本特点:非交互式、(变量、条件语句和循环控制等功能)、类似DOS批处理文件;
shell脚本用途:自动化日常任务、批量处理数据、系统管理与维护;
shell脚本的优势:提高工作效率、易于修改和使用、跨平台支持;
Bash:/bin/sh指向/bin/bash的符号链接;
2、案列
特殊字符:
“”双引号使shell认出特殊字符;
‘’单引号使shell无法认出特殊字符;
?问号:匹配一个字符
[abcdef]111:pipei
标签:shell,运维,工程师,配置,安全,监控,自动化,云运维 From: https://www.cnblogs.com/gkhost/p/18660321