「Kubernetes Debugging」- 排错与调试

  CREATED BY JENKINSBOT

我们从来没有遇到这种事情:以前不管使用什么系统,即使出现各种运行错误,也很容易处理。但是现在我们需要建立专门的章节,来学习 Kubernetes 相关的排错与调试内容(也许是我们以前使用的东西太简单了)。而且在 Kubernetes 官方文档中关于排错调试的内容远多余我们用过的其他服务,从来没见过哪个工具服务有这么多排错及调试相关的文档 :-)。不过这也很正常,虽然 Kubernetes 的很多新概念,但是底层的 Docker IPVS iptables PKI Storage 等等技术都是建立在已有技术的基础之上,这么多技术粘合在一起,出现各种错误也是相当正常的。所以 Kubernetes 的使用是件简单的事情,通过阅读官方文档即可,但是维护、排错、调试可不简单。

鉴于此,我们创建该章节,专门用来学习和记录与 Kuberntes 排错及调试相关的内容。比如 Pod 为什么处于 Pending 状态、Pod 为什么会重启、apiserver 为什么会退出、etcd 为什么会突然重新选举……各种各样的问题。

章节列表

「Kubernetes」- rafthttp: request cluster ID mismatch (got m want n)
「Kubernetes Debugging」- Unable to connect to the server: x509: certificate is valid for …, not …
「kubelet」- 磁盘 I/O 极高
「Kubernetes Debugging」- Orphaned pod … found, but volume paths are still present on disk
「Kubernetes」- NGINX master process died (-1): signal: illegal instruction (core dumped)