docker容器监控

一、docker介绍

Docker的中文意思就是码头工人，进入到Docker的官方网站后，也可以看到Docker的图标，如下图所示。

这个Docker图标上就是一条鲸鱼，上面有很多集装箱，集装箱就相当于虚拟环境，每个集装箱有自己的虚拟环境，Docker中文意思是码头工人，相当于把集装箱从鲸鱼身上取下来，然后使用这个集装箱的虚拟环境。

Docker搭建虚拟环境包括三个要素，Registry，Contaniner和Image。如下图所示。

从图中可以看出，Registry是一个远程的仓库，从远程的仓库可取拉取一个镜像到本地，拉取镜像后可以运行成一个容器。客户端可以使用docker pull从远程仓库拉取一个镜像，docker run指令可以将一个镜像运行成一个容器，进入这个容器需要使用docker exec指令，可以进入到运行中的容器中，docker build可以把一个设置成功的虚拟环境容器再打包成环境。这系列操作可以通过以下简单实现。

这里的元程仓库是hub.docker.com，这里包括很多的docker镜像。

二、windows中docker的安装

进入docker官网下载地址docker下载，下载Windows版本。

下载之后双击打开，按默认设置点击安装，完成后界面如下，点击close and restart重启完成安装。

进入docker主界面，左下角显示绿色，则表示docker安装成功。

在docker设置中添加镜像网址"registry-mirrors":["https://docker.mirrors.ustc.edu.cn/"]。添加完成后点击右下角蓝色按钮应用设置。

在power shell中输入具体的docker指令。

三、docker实现容器式监控

docker程序还是安装在硬盘上的，随着程序的增加，程序运行时间就会长，需要的内存就会大，硬盘的数据也会多。这就带来性能上的优化问题。解决内存、硬盘、网络接口速度不能超过限额也就成为一个问题。

也就是，如果多个容器运行，需要收集docker各容器的运行状态和运行信息，也就是需要监控模块的参与。

docker运行的监控原理图如下所示。

图中指示可以使用docker stats去查看每个容器的运行状态。

#docker  stats

使用这个指令后的运行结果如下所示。

对这个结果也可以进行格式化提取，使用—format参数对输出的格式进行初始化。

如单纯提取出ContainerId，指令如下。

docker stats –format “{{.Container}}”

这个指令把docker stats中的第一列的维度Container做为format的参数，然后输出了容器运行的相关信息。

如果输出再添加上CPU的占比信息，这里把Container和CPU的信息以“：”号隔开。

docker stats –format “{{.Container}}:{{.CPUPerc}}”

注意：这里提取CPU的百分比信息，需要把CPU%列维度的名称中“%”替换为Perc，即可。

如果再把内存的占比信息

Docker stats –format “{{.Container}}:{{.CPUPerc}}:{{MemPerc}}”

接下来进入监控的实现，监控实现的时候，不会直接在宿主机中监控，这样不利于管理，因为监控需要提取相关的重要信息，收集信息后还需要使用一些有利的语言工具进行分析，进而进行图形展示。如使用python，matplotlib，tensorflow，web这样的技术架构形成分析界面，这样就需要服务器也要安装这样的资源才能进行分析，cpu的资源又被无端被占用。可以使用docker容器配置环境，进行环境监控。

监控方法的原理图如下所示。

从图中可以得出。需要把Docker stats信息传入到docker容器中，然后在容器安装python，去完成监控信息的分析即可。

解决方法：把docker stats的输出结果放在文件里，文件挂载容器数据卷持久到容器中，运行python程序对数据进行提取。

这里提到了一个技术“挂载”，Docker容器启动的时候，如果要挂载宿主机的一个目录，可以用-v参数指定。可以这样理解，挂载相当于docker的虚拟环境可能使用主机中文件信息。

具体把docker stats的监控信息挂载到docker虚拟机中进行分析的流程如下。

第一步：实时流的获取
docker stats --format "ContainerID:{{.Container}}:CPU%:{{.CPUPerc}}:MEM%:{{.MemPerc}}">info.txt第二步：运行后ctrl+c中止第三步:使用ftp软件下载info.txt文件到本地第四步，写一段程序分解info.txtimport pandas
data=pandas.read_csv("info.txt",sep=":",names=["name1","container_id","name2","cpu%","name3","Mem%"])
data=data[["container_id","cpu%","Mem%"]]
#有几个容器就有几条指令,通过unique()方法对容器进行汇总去重统计
container_length=data["container_id"].unique().size
while True:
print(data.tail(container_length))第五步，接下来，就需要在宿主机建一个文件夹，管理这两个文件，一个是把文件能够在docker虚拟机中执行，一个是收集到的容器信息info.txt。    第六步：现在使用-v实现挂载目录，把宿主机目录挂载到虚拟环境中，需要使用docker pull python3拉取一个python3的容器。然后使用下面的指令进行挂载。
Docker run –it  -v  /home/monitor python /bin/bash
这样可以进入到启动容器中，进入容器后，在这里使用pip3安装pandas软件，使用指令如下。pip install pandas
如图；

第七步：保留进程退出宿主机Ctrl+p+q第八步：先删除宿主机文件info.txt，然后运行docker stats一边收集docker容器的相关信息，一边在宿主机中启动 python程序进行实时流的分析，先重新收集docker容器的相关信息。命令如下。
docker stats
dokcer stats --format "ContainerID:{{.Container}}:CPU%:{{.CPUPerc}}:MEM%:{{.MemPerc}}">/home/monitor/info.tx第九步：再次进入容器，启动python test.py

这里可以看到收集到的实时信息，分析和后续的web展示先略。

四、google方案的图形展示

前面介绍了启动docker stats来收集容器信息，这里也可以不必启动docker stats，可以根据需求监控docker的具体工作目录。Google提供的cadvisor可以监控/var/lib/docker ,第二/sys,第三/var/run，其中var/lib/docker是docker中的相关信息，/sys是系统的相关信息，/var/run是系统运行的相关信息，这些收集的技术的原理图如下图所示。

这里提醒了大家，google使用这个技术默认采用8080端口，这个端口是启动容器中不能占用的端口。监控容器的应用使用cadvisor。

拉取镜像的命令如下。

docker pull google/cadvisor

这里为了更好的验证google/cadvisor，在启动google/cadvisor之前首先需要启动三个centos容器。便于监控使用。启动google/cadvisor容器指令如下。

docker run -it -p 8890:8080 -v /var/run:/var/run -v /var/lib/docker:/var/lib/docker:ro -v /sys:/sys:ro google/cadvisor /bin/bash

启动后，在地址栏输入虚拟机的ip+端口号

如http://192.168.110.148:8890/containers/

进入首页，可以查看整体运行情况。进入首页后，点击第一项:Docker Containers，就可以查看到所有的容器名称，可以点击进入到其中一个容器。

这里可查看容器的运行情况，如下图所示。

这里CPU shares 1024shares表示了CPU进行了限额设置。

比如A容器设置1024，B容器1024C容器1024，A/B/C就可以得到1:1:1，意味着系统平分CPU的占比。

如果A容器设置512，假定启动了centos；B容器设置1024 ，假定启动了apache小程序，C容器设置2048，假设启动 python机器学习。那么A:B:C=1:2:4表示在CPU空闲时间内，C优先级比A/B都高，C占cpu的比率就会大。

具体cpu限额的设置方法，可以在启动容器时设定这个值。指令参数如下。

Docker run --cpu-shares 1024

还可以从前台查看docker服务环境的运行情况，专业术语叫巡检。巡检界面如下图所示。

这里图形显示，显示的内容是实时的，这条曲线也会一直在运动着。

通过google/cadvisor监控查看运转情况的原理图如下。