当前位置:首页>云原生>Kubernetes日常故障处理集锦

Kubernetes日常故障处理集锦

目录


    问题1:Kubernetes集群服务访问失败?



    原因分析:证书不能被识别,其原因为:自定义证书,过期等。

    解决方法:更新证书即可。

    问题2:Kubernetes集群服务访问失败?

    curl: (7) Failed connect to 10.103.22.158:3000; Connection refused

    原因分析:端口映射错误,服务正常工作,但不能提供服务。

    解决方法:删除SVC,重新映射端口即可。

    kubectl delete svc nginx-deployment


    问题3:Kubernetes集群服务暴露失败?

    Error from server (AlreadyExists): services "nginx-deployment" already exists

    原因分析:该容器已暴露服务了。

    解决方法:删除SVC,重新映射端口即可。

    问题4:外网无法访问Kubernetes集群提供的服务?

    原因分析:‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍Kubernetes集群的type为ClusterIP,未将服务暴露至外网。

    解决方法:修改Kubernetes集群的type为NodePort即可,于是可通过所有Kubernetes集群节点访问服务。

    kubectl edit svc nginx-deployment


    问题5:Pod状态为ErrImagePull?

    readiness-httpget-pod   0/1     ErrImagePull   0          10s


    原因分析:image无法拉取。



    解决方法:更换镜像即可。

    问题6:创建init C容器后,其状态不正常?

    NAME READY STATUS RESTARTS AGE
    myapp-pod 0/1 Init:0/2 0 20s

    原因分析:查看日志发现,Pod一直出于初始化中;然后查看Pod详细信息,定位Pod创建失败的原因为:初始化容器未执行完毕。

    Error from server (BadRequest): container "myapp-container" in pod "myapp-pod" is waiting to start: PodInitializing

    waiting for myservice

    Server: 10.96.0.10
    Address: 10.96.0.10:53

    ** server can't find myservice.default.svc.cluster.local: NXDOMAIN

    *** Can'
    t find myservice.svc.cluster.local: No answer
    *** Can't find myservice.cluster.local: No answer
    *** Can'
    t find myservice.default.svc.cluster.local: No answer
    *** Can't find myservice.svc.cluster.local: No answer
    *** Can'
    t find myservice.cluster.local: No answer
    解决方法:创建相关Service,将SVC的name写入Kubernetes集群的CoreDNS服务器中,于是CoreDNS就能对Pod的init C容器执行过程中的域名解析了。

    kubectl apply -f myservice.yaml

    NAME READY STATUS RESTARTS AGE

    myapp-pod 0/1 Init:1/2 0 27m
    myapp-pod 0/1 PodInitializing 0 28m
    myapp-pod 1/1 Running 0 28m


    问题7:探测存活Pod状态为CrashLoopBackOff?

    原因分析:镜像问题,导致容器重启失败。

    解决方法:更换镜像即可。


    问题8:Pod创建失败?

    readiness-httpget-pod 0/1 Pending 0 0s
    readiness-httpget-pod 0/1 Pending 0 0s
    readiness-httpget-pod 0/1 ContainerCreating 0 0s
    readiness-httpget-pod 0/1 Error 0 2s
    readiness-httpget-pod 0/1 Error 1 3s
    readiness-httpget-pod 0/1 CrashLoopBackOff 1 4s
    readiness-httpget-pod 0/1 Error 2 15s
    readiness-httpget-pod 0/1 CrashLoopBackOff 2 26s
    readiness-httpget-pod 0/1 Error 3 37s
    readiness-httpget-pod 0/1 CrashLoopBackOff 3 52s
    readiness-httpget-pod 0/1 Error 4 82s

    原因分析:镜像问题导致容器无法启动。


    解决方法:更换镜像。


    问题9:Pod的ready状态未进入?

    readiness-httpget-pod   0/1     Running   0          116s

    原因分析:Pod的执行命令失败,无法获取资源。


    解决方法:进入容器内部,创建yaml定义的资源。


    问题10:Pod创建失败?


    原因分析:yml文件内容出错—-使用中文字符。

    解决方法:修改myregistrykey内容即可。


    11、kube-flannel-ds-amd64-ndsf7插件Pod的status为Init:0/1?


    排查思路:kubectl -n kube-system describe pod kube-flannel-ds-amd64-ndsf7 #查询Pod描述信息。


    原因分析:k8s-slave1节点拉取镜像失败。

    解决方法:登录k8s-slave1,重启Docker服务,手动拉取镜像。


    k8s-master节点,重新安装插件即可。

    kubectl create -f kube-flannel.yml;kubectl get nodes


    12、Kubernetes创建服务status为ErrImagePull?


    排查思路:

    kubectl describe pod test-nginx


    原因分析:拉取镜像名称问题。

    解决方法:删除错误Pod;重新拉取镜像。
    kubectl delete pod test-nginx;kubectl run test-nginx --image=10.0.0.81:5000/nginx:alpine

    13、不能进入指定容器内部?


    原因分析:yml文件comtainers字段重复,导致该Pod没有该容器。

    解决方法:去掉yml文件中多余的containers字段,重新生成Pod。


    14、创建PV失败?


    原因分析:PV的name字段重复。

    解决方法:修改PV的name字段即可。


    15、Pod无法挂载PVC?


    原因分析:Pod无法挂载PVC。


    AccessModes与可使用的PV不一致,导致无法挂载PVC,由于只能挂载大于1G且AccessModes为RWO的PV,故只能成功创建1个Pod,第2个Pod一致pending,按序创建时则第3个Pod一直未被创建。

    解决方法:修改yml文件中AccessModes或PV的AccessModes即可。


    16、问题:Pod使用PV后,无法访问其内容?


    原因分析:NFS卷中没有文件或权限不对。


    解决方法:在NFS卷中创建文件并授予权限。


    17、查看节点状态失败?


    Error from server (NotFound): the server could not find the requested resource (get services http:heapster:)


    原因分析:没有Heapster服务。

    解决方法:安装Prometheus监控组件即可。


    18、Pod一直处于pending状态?


    原因分析:由于已使用同样镜像发布了Pod,导致无节点可调度。


    解决方法:删除所有Pod后部署Pod即可。


    19、Helm安装组件失败?

    [root@k8s-master01 hello-world]# helm install

    Error: This command needs 1 argument: chart nam

    [root@k8s-master01 hello-world]# helm install ./
    Error: no Chart.yaml exists in directory "/root/hello-world"

    原因分析:文件名格式不对。

    解决方法:mv chart.yaml Chart.yaml


    原文链接:https://www.cnblogs.com/chalon/p/14415252.html




    给TA打赏
    共{{data.count}}人
    人已打赏
    云原生后端开发

    eBPF 成立独立基金会

    2021-8-15 15:55:59

    云原生后端开发

    eBPF 成立独立基金会

    2021-8-15 16:01:11

    {{yiyan[0].hitokoto}}
    0 条回复 A文章作者 M管理员
      暂无讨论,说说你的看法吧
    个人中心
    购物车
    优惠劵
    今日签到
    有新私信 私信列表
    搜索