calico node restart issue

k8s cluster 에서 calico node가 자꾸 리스타트를 한다.

문제를 찾아보다 확인된 issue

https://github.com/projectcalico/calico/issues/5122

내용인즉은 timeout이 1초로 되잇다고한다. 그래서 unhealth가 되서 자꾸 재시작이 됨.

daemonset에서 1초를 10초로 변경해주면 문제가 없어진다.

kubespray 1.27.0에서만 발생하는 이슈이고 1.27.1에서는 발생하지 않는다.

1.27.1에서는 다음 옵션이 추가가 되서 시간을 더 늘릴수도 있다.

# Under certain situations liveness and readiness probes may need tunning
calico_node_livenessprobe_timeout: 11
calico_node_readinessprobe_timeout: 11

기본값은 10초이다.

이것때문에 설치를 몇번을 더햇는지 모른다.

참고로 업그레이드커맨드는

ansible-playbook -i inventory/c2/hosts.yml upgrade-cluster.yml -b -v  -u root
teamsmiley's profile image

teamsmiley

2021-12-29 00:00

Read more posts by this author