加载中...
avatar
文章
264
标签
121
分类
14
主页
归档
标签
分类
友情链接
Michael BlogOpenShift集群健康检查 返回首页
搜索
主页
归档
标签
分类
友情链接

OpenShift集群健康检查

发表于2020-05-20|更新于2026-04-01
|浏览量:

参考文章
https://docs.openshift.com/container-platform/3.11/day_two_guide/environment_health_checks.html#day-two-guide-router-and-registry-health

文章作者: Michael Pan
文章链接: https://xhua.eu.org/posts/6f6257a9edfd.html
版权声明: 本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源 Michael Blog!
openshift
上一篇
Openshfit-4-1部署手册
设备与网络准备 网络要求 能够访问OpenShift Infrastructure Providers以下载安装程序 能访问quay.io以获取安装群集所需的软件包 能访问Red Hat’s software as a service page以获取相关订阅 准备节点 1 bootstrap节点 RHCOS,引导计算机部署集群,在完成部署后该机器可被删除 3 master节点 RHCOS 2 compte节点 RHCOS or RHEL 7.6 部署前准备 外部负载均衡器 配置主机端口 配置DNS 确保网络连接 以下端口必须能被集群中的所有机器访问 端口 说明 2379-2380 etcd server, peer, and metrics ports 6443 Kubernetes API 9000-9999 Host level services, including the node exporter on ports 9100-9101 and the Cluster Version Operator on port 9099. ...
下一篇
OpenShift部署时如何延长组件证书的有效期
延长集群核心证书的有效期OpenShift集群正常运行中涉及到非常多的证书,有各节点通信的证书,有数据库的证书,有私有镜像仓库的证书,还有各种组件的证书(EFK、ClusterMonitor、Metrics等)。对于集群的相关证书可以通过在inventory文件中添加如下配置就可以非常方便地更改相关证书的默认有效期。 1234openshift_hosted_registry_cert_expire_days=3650openshift_ca_cert_expire_days=3650openshift_master_cert_expire_days=3650etcd_ca_default_days=3650 但是以上的几个配置对于一些组件并不起作用,如EFK等。 延长一些特殊组件证书的有效期openshift自签应用证书的有效期为2 or 5年。其中crt证书默认为两年,ca证书为5年。例如es中的证书中,admin-ca有效期为5年,admin-crt有效期为2年。 也就是说按照当前OpenShift安装的默认步骤安装的EFK组件,证书最短有效期为两年,两年后需要执行证书更...
相关推荐
cover
2020-05-22
Openshift-常见运维脚本及问题解决
1.扩容计算结点在执行扩容前需检查扩容节点的以下几点信息: 内核版本 selinux已经开启enforcing docker数据盘已经就绪 /etc/resolv.conf配置正确 hostname已经设置 时间同步已配置 在每个节点都能解析新增节点的域名,如果是通过/etc/hosts来配置域名解析,需要在配置后重启所有节点的dnsmasq服务 docker证书的问题需要添加到自动化配置中来,特别是私有镜像仓库的证书。有三个地方: /etc/sysconfig/docker配置, /etc/pki/ca-trust/source/anchors/目录下的证书, /etc/docker/certs.d下docker拉取镜像认证证书 123456789101112131415# /etc/ansible/hosts[OSEv3:children]mastersnodesetcdnew_nodes...[new_nod...
cover
2020-05-20
Openshift上使用shell-operator创建自己的operator
shell operator是由Falnt公司开发并开源的。Flant公司是一家致力于提供解决所有基础设施问题的解决方案的公司。他们自称是提供DevOps-as-a-Service的服务。 需求 一个简单的任务:监听项目创建与删除事件,并发出告警。 一种简单的解决方法:定时脚本cron,每隔一段时间(如1min)获取对Openshift集群的所有项目,并将它与上次获取的结果值进行比较,得到新创建的项目及删除的项目该方法的缺点: 不及时 性能差,很多时候并没有操作项目,但仍然需要不断执行脚本 如果1min内即创建了新项目,又把这个项目删除了,则无法监测到 另一种解决方法:事件驱动,即订阅来自Kubernetes对象的事件,如果有对Project操作就触发告警。很明显这种方法解决了定时任务的所有问题。 该很么做呢?会不会非常复杂。不会。使用shell-operator项目就可以非常简单地实现。shell-operator项目地址:https://github.com/flant/shell-operator 实现部骤 创建shell-operator项目 1$ oc n...
2020-05-20
OpenShift节点kubelet证书过期异常的解决步骤
环境:OpenShift 3.10 or 3.11问题: 重新部署了新的CA,节点不再处于就绪状态。 如何手动强制创建新证书。 节点无法更新其证书,并出现以下错误: 123atomic-openshift-node[3715]: I0313 11:40:48.864375 3715 bootstrap.go:56] Using bootstrap kubeconfig to generate TLS client cert, key and kubeconfig fileatomic-openshift-node[3715]: I0313 11:40:48.865525 3715 bootstrap.go:86] No valid private key and/or certificate found, reusing existing private key or creating a new oneatomic-openshift-node[3715]: F0313 11:40:48.893737 3715 server.go:262] failed...
2020-05-20
OpenShift-Route支持TCP负载均衡改造与使用
Route作为TCP负载均衡器的部署 获取当前Route的haproxy-template配置 12345# oc project default# oc get podNAME READY STATUS RESTARTS AGErouter-16-5rv4q 2/2 Running 2 18h# oc rsh router-16-5rv4q cat haproxy-config.template > haproxy-config.template 编辑导出的haproxy-config.template文件在内容{{- end }}{{/*end tls==passthrough*/}}下一行,添加以下内容: 1234567891011{{/*TCP support*/}}{{- if eq "tcp" (index...
cover
2020-05-20
Ceph的搭建流程及openshift上使用ceph-rbd实现动态存储
Ceph分布式块存储部署机器列表 名称 核数 内存 ip hostname 外挂磁盘大小(G) 管理节点admin 2 4 192.168.1.2 admin.ceph.com 监控节点monitor 2 4 192.168.1.3 monitor.ceph.com 存储节点node1 2 4 192.168.1.4 node1.ceph.com 100G 存储节点node2 2 4 192.168.1.5 node2.ceph.com 100G 部署Ceph RBD 1、给每台机器设置hostname 12345# 设置hostname hostnamectl --static set-hostname admin.ceph.com #192.168.1.2 hostnamectl --static set-hostname monitor.ceph.com #192.168.1.3 hostnamectl --static set-hostname node1.ceph.com #192.168.1.4 hostnamectl --s...
2020-05-20
数据库写测试
先出结果数据库Mysql 5.7数据 NetApp Ceph NFS-SSD NFS-SAS HOST PATH 写(qtps) 33333 888 20000 3000 延时(us) 1029 40488 1184 NetApp 12345678910111213141516171819202018-06-27 17:56:45 ======================== mysql_test ========================2018-06-27 17:56:45 SQL01 exe=5000 fail=0 row=5000 ela=5180 ms avg=1036 us2018-06-27 17:56:45 SQL01 1 ms exec= 2853, ela= 2530 ms, avg= 886 us, pct= 57, 572018-06-27 17:56:45 SQL01 2 ms exec= 2122, ela= 2443 ms, avg= 115...
avatar
Michael Pan
日积硅步以致千里,记录日常工作与学习
文章
264
标签
121
分类
14
Follow Me
最新文章
OpenClaw:开源AI代理与技能生态系统详解2026-02-05
Claude Code 使用最佳实践与技巧2026-01-28
Cursor IDE 使用最佳实践与技巧:从入门到精通2026-01-28
Agent Skill:从使用到原理,一次讲清2026-01-25
Docker BuildKit 新特性与最佳实践:更快构建、更强缓存与供应链元数据2026-01-22
© 2023 - 2026 By Michael Pan
搜索
数据加载中