「KUBERNETES-TROUBLESHOOT」- 排错与调试

  CREATED BY JENKINSBOT

我们从来没有遇到这种事情:以前不管使用什么系统,即使出现各种运行错误,也很容易处理。但是现在我们需要建立专门的章节,来学习 Kubernetes 相关的排错与调试内容(也许是我们以前使用的东西太简单了)。而且在 Kubernetes 官方文档中关于排错调试的内容远多余我们用过的其他服务,从来没见过哪个工具服务有这么多排错及调试相关的文档 :-)。不过这也很正常,虽然 Kubernetes 的很多新概念,但是底层的 Docker IPVS iptables PKI Storage 等等技术都是建立在已有技术的基础之上,这么多技术粘合在一起,出现各种错误也是相当正常的。所以 Kubernetes 的使用是件简单的事情,通过阅读官方文档即可,但是维护、排错、调试可不简单;

鉴于此,我们创建该章节,专门用来学习和记录与 Kuberntes 排错及调试相关的内容。比如 Pod 为什么处于 Pending 状态、Pod 为什么会重启、apiserver 为什么会退出、etcd 为什么会突然重新选举……各种各样的问题;