Recover Rancher Kubernetes cluster from a Backup

etcdctl backup --data-dir <dataDir> --backup-dir <backupDir>

# ls /var/etcd/backups/ -l
total 44
drwx------ 3 root root 4096 Apr  9 15:03 2018-04-09T15:03:54Z_etcd_1
drwx------ 3 root root 4096 Apr  9 15:05 2018-04-09T15:05:54Z_etcd_1
drwx------ 3 root root 4096 Apr  9 15:07 2018-04-09T15:07:54Z_etcd_1
drwx------ 3 root root 4096 Apr  9 15:09 2018-04-09T15:09:54Z_etcd_1
drwx------ 3 root root 4096 Apr  9 15:11 2018-04-09T15:11:54Z_etcd_1
drwx------ 3 root root 4096 Apr  9 15:13 2018-04-09T15:13:54Z_etcd_1
drwx------ 3 root root 4096 Apr  9 15:15 2018-04-09T15:15:54Z_etcd_1
drwx------ 3 root root 4096 Apr  9 15:17 2018-04-09T15:17:54Z_etcd_1
drwx------ 3 root root 4096 Apr  9 15:19 2018-04-09T15:19:54Z_etcd_1
drwx------ 3 root root 4096 Apr  9 15:21 2018-04-09T15:21:54Z_etcd_1
drwx------ 3 root root 4096 Apr  9 15:23 2018-04-09T15:23:54Z_etcd_1

target=2018-04-09T15:23:54Z_etcd_1
docker volume create --name etcd
docker run -d -v etcd:/data --name etcd-restore busybox
docker cp /var/etcd/backups/$target etcd-restore:/data/data.current
docker rm etcd-restore

# kubectl get pods --all-namespaces
NAMESPACE       NAME                                    READY     STATUS    RESTARTS   AGE
cattle-system   cattle-859b6cdc6b-tns6g                 1/1       Running   0          19s
ingress-nginx   default-http-backend-564b9b6c5b-7wbkx   1/1       Running   0          25s
ingress-nginx   nginx-ingress-controller-shpn4          1/1       Running   0          25s
kube-system     canal-5xj2r                             3/3       Running   0          37s
kube-system     kube-dns-5ccb66df65-c72t9               3/3       Running   0          31s
kube-system     kube-dns-autoscaler-6c4b786f5-xtj26     1/1       Running   0          30s

rke etcd snapshot-save --config <config-path> --name <snapshot-name>

rke etcd snapshot-restore --config <config-path> --name <snapshot-name>

# rke etcd snapshot-save --name rancher.snapshot --config cluster.yml
INFO[0000] Starting saving snapshot on etcd hosts       
INFO[0000] [dialer] Setup tunnel for host [x.x.x.x] 
INFO[0003] [etcd] Saving snapshot [rancher.snapshot] on host [x.x.x.x] 
INFO[0004] [etcd] Successfully started [etcd-snapshot-once] container on host [x.x.x.x] 
INFO[0010] Finished saving snapshot [rancher.snapshot] on all etcd hosts

# rke etcd snapshot-restore --name rancher.snapshot --config cluster.yml

INFO[0000] Starting restoring snapshot on etcd hosts    
INFO[0000] [dialer] Setup tunnel for host [x.x.x.x] 
INFO[0001] [remove/etcd] Successfully removed container on host [x.x.x.x] 
INFO[0001] [hosts] Cleaning up host [x.x.x.x]      
INFO[0001] [hosts] Running cleaner container on host [x.x.x.x] 
INFO[0002] [kube-cleaner] Successfully started [kube-cleaner] container on host [x.x.x.x] 
INFO[0002] [hosts] Removing cleaner container on host [x.x.x.x] 
INFO[0003] [hosts] Successfully cleaned up host [x.x.x.x] 
INFO[0003] [etcd] Restoring [rancher.snapshot] snapshot on etcd host [x.x.x.x] 
INFO[0003] [etcd] Successfully started [etcd-restore] container on host [x.x.x.x] 
INFO[0004] [etcd] Building up etcd plane..              
INFO[0004] [etcd] Successfully started [etcd] container on host [x.x.x.x] 
INFO[0005] [etcd] Successfully started [rke-log-linker] container on host [x.x.x.x] 
INFO[0006] [remove/rke-log-linker] Successfully removed container on host [x.x.x.x] 
INFO[0006] [etcd] Successfully started etcd plane..     
INFO[0007] Finished restoring snapshot [rancher.snapshot] on all etcd hosts

docker restart kube-apiserver kubelet kube-controller-manager kube-scheduler kube-proxy
docker ps | grep flannel | cut -f 1 -d " " | xargs docker restart
docker ps | grep calico | cut -f 1 -d " " | xargs docker restart

Recover Rancher Kubernetes cluster from a Backup

Etcd in Rancher 1.6

Restoring backup

Etcd in Rancher 2.0

After Rancher Installation

RKE etcd Snapshots

RKE etcd snapshot restore

1. Restarting Kubernetes components

2. Restoring etcd on a multi-node cluster

3. Invalidated service account tokens

Conclusion