calico node restart issue
k8s cluster 에서 calico node가 자꾸 리스타트를 한다.
문제를 찾아보다 확인된 issue
https://github.com/projectcalico/calico/issues/5122
내용인즉은 timeout이 1초로 되잇다고한다. 그래서 unhealth가 되서 자꾸 재시작이 됨.
daemonset에서 1초를 10초로 변경해주면 문제가 없어진다.
kubespray 1.27.0에서만 발생하는 이슈이고 1.27.1에서는 발생하지 않는다.
1.27.1에서는 다음 옵션이 추가가 되서 시간을 더 늘릴수도 있다.
# Under certain situations liveness and readiness probes may need tunning
calico_node_livenessprobe_timeout: 11
calico_node_readinessprobe_timeout: 11
기본값은 10초이다.
이것때문에 설치를 몇번을 더햇는지 모른다.
참고로 업그레이드커맨드는
ansible-playbook -i inventory/c2/hosts.yml upgrade-cluster.yml -b -v -u root