Docker overlay 网络
说明
Overlay网络是指在不改变现有网络基础设施的前提下,通过某种约定通信协议,把二层报文封装在IP报文之上的新的数据格式。 这样不但能够充分利用成熟的IP路由协议进程数据分发,而且在Overlay技术中采用扩展的隔离标识位数,能够突破VLAN的4000数量限制, 支持高达16M的用户,并在必要时可将广播流量转化为组播流量,避免广播数据泛滥。 因此,Overlay网络实际上是目前最主流的容器跨节点数据传输和路由方案。 Overlay网络的实现方式可以有许多种,其中IETF(国际互联网工程任务组)制定了三种Overlay的实现标准 1. 虚拟可扩展LAN(VXLAN) 2. 采用通用路由封装的网络虚拟化(NVGRE) 3. 无状态传输协议(SST) Docker内置的Overlay网络是采用IETF标准的VXLAN方式,并且是VXLAN中普遍认为最适合大规模的云计算虚拟化环境的SDN Controller模式。 Docker的Overlay网络功能与其Swarm集群是紧密整合的,因此为了使用Docker的内置跨节点通信功能,最简单的方式就是采纳Swarm作为集群的解决方案。
overlay 条件
在 docker 1.9 中,要使用 Swarm + overlay 网络架构,还需要以下几个条件:
所有Swarm节点的Linux系统内核版本不低于3.16 (在 docker 1.10 后面版本中,已经支持内核3.10,升级内核实在是一个麻烦事情)
需要一个额外的配置存储服务,例如Consul、Etcd或ZooKeeper
所有的节点都能够正常连接到配置存储服务的IP和端口
所有节点运行的Docker后台进程需要使用『–cluster-store』和『–cluster-advertise』参数指定所使用的配置存储服务地址
环境说明
1
2
3
4
5
6
7
| 服务器3台 如下:
10.6.17.12
10.6.17.13
10.6.17.14
|
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
| docker version
Client:
Version: 1.10.0-rc1
API version: 1.22
Go version: go1.5.3
Git commit: 677c593
Built: Fri Jan 15 20:50:15 2016
OS/Arch: linux/amd64
|
修改主机名
1
2
3
4
5
| 10.6.17.12 = hostnamectl --static set-hostname swarm-master
10.6.17.13 = hostnamectl --static set-hostname swarm-node-1
10.6.17.14 = hostnamectl --static set-hostname swarm-node-2
|
上面的4个条件中,第一个条件在docker 1.10 RC 版本中已经默认就满足了。
下面我们来创建第二个条件中的 配置存储服务,配置存储服务按照大家的使用习惯,自己选择一个配置存储。
由于我们java 项目一直在使用 ZooKeeper ,所以这边选择 ZooKeeper 作为存储服务,为了方便测试,这边只配置 单机的 ZooKeeper 服务
配置 swarm 集群
1
2
3
4
5
6
7
| [10.6.17.12]# sed -i 's/-H fd:\/\//-H tcp:\/\/10.6.17.12:2375 --cluster-store=zk:\/\/10.6.17.12:2181/store --cluster-advertise=10.6.17.12:2376/g' /lib/systemd/system/docker.service
[10.6.17.13]# sed -i 's/-H fd:\/\//-H tcp:\/\/10.6.17.13:2375 --cluster-store=zk:\/\/10.6.17.12:2181/store --cluster-advertise=10.6.17.13:2376/g' /lib/systemd/system/docker.service
[10.6.17.14]# sed -i 's/-H fd:\/\//-H tcp:\/\/10.6.17.14:2375 --cluster-store=zk:\/\/10.6.17.12:2181/store --cluster-advertise=10.6.17.14:2376/g' /lib/systemd/system/docker.service
|
1
2
3
| systemctl daemon-reload
systemctl restart docker.service
|
首先我们选择 10.6.17.12 这台机器做为 master 节点 创建 swarm:
1
| [10.6.17.12]# docker -H tcp://10.6.17.12:2375 run --name master --restart=always -d -p 8888:2375 swarm manage zk://10.6.17.12:2181/swarm
|
在其他两台Docker业务容器运行的节点上运行Swarm Agent服务:
1
| [10.6.17.13]# docker -H tcp://10.6.17.13:2375 run --name node_1 --restart=always -d swarm join --addr=10.6.17.13:2375 zk://10.6.17.12:2181/swarm
|
1
| [10.6.17.14]# docker -H tcp://10.6.17.14:2375 run --name node_2 --restart=always -d swarm join --addr=10.6.17.14:2375 zk://10.6.17.12:2181/swarm
|
查看所有节点上的信息:
1
2
3
4
5
6
7
8
| [10.6.17.12]# docker -H tcp://10.6.17.12:8888 ps -a
CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES
5fc7753caa2c swarm "/swarm join --addr=1" Less than a second ago Up Less than a second 2375/tcp swarm-node-1/node_1
330b964ba732 swarm "/swarm join --addr=1" Less than a second ago Up Less than a second 2375/tcp swarm-node-2/node_2
|
至此 swarm 集群已经搭建完成了。
创建 overlay 网络
Swarm提供与Docker服务完全兼容的API,因此可以直接使用docker命令进行操作。
注意上面命令中创建Master服务时指定的外部端口号8888,它就是用来连接Swarm服务的地址。
现在我们就可以创建一个Overlay类型的网络了:
1
| [10.6.17.12]# docker -H tcp://10.6.17.12:8888 network create --driver=overlay ovr0
|
这个命令被发送给了Swarm服务,Swarm会在所有Agent节点上添加一个属性完全相同的Overlay类型网络。
在每个节点上面 使用 docker network ls 可以查看 到已经有一个 ovr0 的 overlay 网络
在Swarm的网络里面,每个网络的名字都会加上节点名称作为前缀,
如:
1
2
3
| swarm-node-1/node_1
swarm-node-2/node_2
|
但Overlay类型的网络是没有这个前缀的,这也说明了这类网络是被所有节点共有的。
下面我们在Swarm中创建两个连接到Overlay网络的容器,并用Swarm的过滤器限制这两个容器分别运行在不同的节点上。
创建基于overlay的容器
nginx dockerfile
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
| FROM centos
MAINTAINER jicki@qq.com
RUN yum -y update; yum clean all
RUN yum -y install epel-release; yum clean all
RUN yum -y install wget; yum clean all
ADD ./nginx.sh /root/
RUN /bin/bash /root/nginx.sh
RUN rm -rf /root/nginx.sh
RUN rm -rf /opt/local/nginx/conf/nginx.conf
ADD ./nginx.conf /opt/local/nginx/conf/
RUN mkdir -p /opt/local/nginx/conf/vhost
ADD ./docker.conf /opt/local/nginx/conf/vhost
RUN chown -R upload:upload /opt/htdocs/web
EXPOSE 80 443
CMD ["/opt/local/nginx/sbin/nginx", "-g", "daemon off;"]
|
1
2
3
| [10.6.17.12]# docker -H tcp://10.6.17.12:8888 run --name nginx_web_1 --net ovr0 --env="constraint:node==swarm-node-1" -d -v /opt/data/nginx/logs:/opt/local/nginx/logs nginx
[10.6.17.12]# docker -H tcp://10.6.17.12:8888 run --name nginx_web_2 --net ovr0 --env="constraint:node==swarm-node-2" -d -v /opt/data/nginx/logs:/opt/local/nginx/logs nginx
|
测试网络
创建完两个容器以后,下面来来测试一下 ovr0 这个网络的连通性
1
2
3
4
5
6
7
8
9
10
11
12
13
| [10.6.17.12]# docker -H tcp://10.6.17.12:8888 exec -it nginx_web_1 ping nginx_web_2
PING nginx_web_2 (10.0.0.3) 56(84) bytes of data.
64 bytes from nginx_web_2.ovr0 (10.0.0.3): icmp_seq=1 ttl=64 time=0.360 ms
64 bytes from nginx_web_2.ovr0 (10.0.0.3): icmp_seq=2 ttl=64 time=0.247 ms
64 bytes from nginx_web_2.ovr0 (10.0.0.3): icmp_seq=3 ttl=64 time=0.234 ms
64 bytes from nginx_web_2.ovr0 (10.0.0.3): icmp_seq=4 ttl=64 time=0.241 ms
64 bytes from nginx_web_2.ovr0 (10.0.0.3): icmp_seq=5 ttl=64 time=0.212 ms
|
如上所示 我们已经在Docker的Overlay网络上成功的进行了跨节点的数据通信。
测试两个 ssh 的服务,创建两个 容器,查看容器所属 IP 。
1
2
3
4
5
| [10.6.17.12]# docker -H tcp://10.6.17.12:8888 run --name ssh-1 --net ovr0 --env="constraint:node==swarm-node-1" -d -p 8001:22 ssh
[10.6.17.12]# docker -H tcp://10.6.17.12:8888 run --name ssh-2 --net ovr0 --env="constraint:node==swarm-node-2" -d -p 8001:22 ssh
|
创建容器 IP 为 DHCP 分配, 按照从下向上分配, 重启不会改变overlay 的IP 。
首先创建 ssh-1 分配IP为 10.0.0.4 创建 ssh-2 分配IP为 10.0.0.5
销毁 ssh-1 再次创建 分配IP 为 10.0.0.4
销毁 ssh-1 ssh-2 先创建 ssh-2 分配 IP 为 10.0.0.4
alias
在 docker 1.10 后面的版本中 –net-alias=[] 的使用!!
在docker run 的时候 可指定相同的 alias ,可以实现 故障切换的效果。。
具体命令如:
1
2
3
| [10.6.17.12]# docker -H tcp://10.6.17.12:8888 run --name nginx_web_1 --net ovr0 --net-alias="nginx" --env="constraint:node==swarm-node-1" -d -v /opt/data/nginx/logs:/opt/local/nginx/logs nginx
[10.6.17.12]# docker -H tcp://10.6.17.12:8888 run --name nginx_web_2 --net ovr0 --net-alias="nginx" --env="constraint:node==swarm-node-2" -d -v /opt/data/nginx/logs:/opt/local/nginx/logs nginx
|
当我们进入 机器里面的时候 使用 dig 查看 nginx A记录 看到的是一个,但是 一个容器 挂掉以后
A记录会自动绑定到另外一台机器中。
在 docker 1.11 后面的版本中 –net-alias=[] 已经支持 负载均衡。
当我们使用 dig 查看 A记录 时可以看到多个 A记录
network disconnect
docker network disconnect 与 docker network connect 命令的使用!
使用这两个命令可达到 A B 测试 以及 快速 回滚 的效果。
1
2
3
| docker network connect ----> 加入 指定网络
docker network disconnect ----> 退出 指定网络
|
具体命令使用:
1
2
3
| docker network disconnect ovr0 nginx_web_2 nginx_web_2 这个容器退出 ovr0 这个网络。
docker network connect ovr0 nginx_web_2 nginx_web_2 这个容器重新加入 ovr0 这个网络。
|