背景介绍
有一个网站(pf.apps.example.com),会获取主机的信息,但是主机信息的格式不统一,而且经常性会添加机器,但是信息又是不确定的,所以有时添加新机器会缺失字段,导致网站异常。
有两种解决方法,
- 优化代码,提高代码的兼容性,不致于导致页面无法显示。
- 严格规范字段的输入,必须保证字段的完整性。
不管哪种方法,我们都需要在页面出现故障时第一时间知道。这就要求编写代码自动监测网站相关页面的可用性,一旦出现问题,及时发邮件告知,第一时间恢复。
有使用到上篇介绍的zalenium
Openshift部署zalenium(容器化的selenium)及Python自动测试
编写监控脚本
监控脚本使用selenium控制浏览器,先模拟登录,再访问需要测试的页面,如果页面正常打开则正常,否则发邮件告警。(由于这个网站的每个页面都有id=content的一个div,所以通过检测页面中是否存在id=content的div来判断页面是否正常)monitor.py
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82
| # -*- coding: utf-8 -*- """ ------------------------------------------------- File Name: test Description : Author : 潘晓华 date: 2018/6/5 ------------------------------------------------- """ import unittest from selenium import webdriver from selenium.webdriver.remote.remote_connection import RemoteConnection import smtplib from email.mime.text import MIMEText from email.header import Header
TEST_USERNAME = 'test' TEST_PASSWORD = '123456'
NOTICE_EMAIL = 'panxiaohua@mail.com'
class SeleniumTestCase(unittest.TestCase): def setUp(self): remoteconnection = RemoteConnection('http://zalenium.apps.example.com/wd/hub', keep_alive=False, resolve_ip=False)
self.driver = webdriver.Remote(command_executor=remoteconnection, desired_capabilities={ 'browserName': "chrome", 'video': 'False', 'platform': 'LINUX', 'platformName': 'LINUX' }) self.driver.implicitly_wait(30) self.driver.maximize_window()
def test_login_test_case(self): self.driver.get("http://pf.apps.example.com") username_input = self.driver.find_element_by_id('username') password_input = self.driver.find_element_by_id('password') login_button = self.driver.find_element_by_id('login_btn') username_input.clear() username_input.send_keys(TEST_USERNAME) password_input.clear() password_input.send_keys(TEST_PASSWORD) login_button.click() try: self.driver.find_element_by_id('content')
self.driver.get("http://pf.apps.example.com/dashboard/dailyresource")
self.driver.find_element_by_id('content')
except Exception, e: self.notice_by_email()
def notice_by_email(self): sender = 'panxiaohua@mail.com' message = MIMEText(u'自动平台有故障,请检查', 'plain', 'utf-8') message['From'] = Header(u"AutoPf") # 发送者 message['To'] = Header("panxiaohua") # 接收者
subject = u'自动化平台有故障告警' message['Subject'] = Header(subject)
try: smtpObj = smtplib.SMTP() smtpObj.connect('mail.com', 25) # 25 为 SMTP 端口号 smtpObj.login(sender, '123456') smtpObj.sendmail(sender, [NOTICE_EMAIL], message.as_string()) print u"邮件发送成功" except smtplib.SMTPException: print u"Error: 无法发送邮件"
def tearDown(self): self.driver.quit()
if __name__ == '__main__': unittest.main()
|
制作监控镜像
基于python27,安装相关的模块,并将monitor.py导入镜像
1 2 3 4
| # Dockerfile FROM centos/python-27-centos7:2.7 RUN bash -c 'pip install selenium -i https://pypi.douban.com/simple/' COPY monitor.py ./monitor.py
|
创建定时任务
通过创建Cronjob每隔一个小时,运行创建的容器,并检测对应网站的状态。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
| # cronjob.yaml kind: CronJob apiVersion: batch/v1beta1 metadata: name: monitor spec: jobTemplate: spec: template: spec: containers: - name: monitor-autopf image: harbor.apps.example.com/autopf/monitor:v1 imagePullPolicy: Always command: ["bash", "-c", "python monitor.py"] restartPolicy: Never schedule: "0 * * * *"
|
通过configmap实现通用监控
很明显,以上的镜像只能针对该网站的指定两个页面(一个是登录后自动跳转的页面,另一个为“http://pf.apps.example.com/dashboard/dailyresource”),如果有新的监控项或者对其它网站有监控,就必须重新制作对应的镜像。这将会是多麻烦。
通过ConfigMap可以将监控代码作为变动项,而保证镜像统一。也就是说将monitor.py(或者有其它依赖的文件)作为configmap资源,挂载到镜像中,最后再通过设置command来执行监控。
创建ConfigMap将monitor.py代码放在configmap中
1 2 3 4 5 6 7
| apiVersion: v1 data: monitor.py: "# -*- coding: utf-8 -*-\r\n\"\"\"\r\n-------------代码内容---------------unittest.main()" kind: ConfigMap metadata: creationTimestamp: null name: monitor
|
将它挂载到Cronjob中的/opt/app-root/src下
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
| ... jobTemplate: spec: template: spec: containers: - command: - bash - -c - python monitor.py image: harbor.apps.example.com/autopf/monitor:v1 imagePullPolicy: Always name: monitor-autopf volumeMounts: - mountPath: /opt/app-root/src name: monitor-cm restartPolicy: Never volumes: - configMap: defaultMode: 420 name: monitor name: monitor-cm schedule: 0 */6 * * * ...
|
至此便完成了通用监控镜像,如果监控有更新,只需要更改configmap中的monitor.py的代码即可。