Docker打包深度学习项目

1、参考博客

1、 docker的安装使用，及打包深度学习环境【很详细】
2、 Docker打包深度学习项目（解决：Opencv依赖库、共享内存）
3、 Docker 镜像构建之 Dockerfile
4、 Docker深度学习环境安装、部署、打包
5、使用conda pack进行环境迁移（步骤很详细）
6、使用nvidia-docker创建gpu支持深度学习环境的容器
2、普通Docker和NVIDIA Docker安装

不同平台的Docker安装方式可以参考官方文档（Docker Install），我这里就用Ubuntu系统作为例子。
1、 Install Docker Engine on Ubuntu

# Docker
#在首次在新的主机上安装Docker Engine之前，需要设置Docker存储库。之后，您可以从存储库中安装和更新Docker。
#1、更新apt包索引并安装包，以允许apt通过HTTPS使用存储库:
$ sudo apt-get update
$ sudo apt-get install \
    apt-transport-https \
    ca-certificates \
    curl \
    gnupg-agent \
    software-properties-common
#2. 添加Docker的官方GPG密钥:
$ curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo apt-key add -
#添加docker官方gpg密钥，这里改成中科大镜像的
curl -fsSL https://mirrors.ustc.edu.cn/docker-ce/linux/ubuntu/gpg | sudo gpg --dearmor -o /usr/share/keyrings/docker-archive-keyring.gpg
#3、使用以下命令设置存储库:
$ sudo add-apt-repository \
   "deb [arch=amd64] https://download.docker.com/linux/ubuntu \
   $(lsb_release -cs) \
   stable"  
 #设置稳定版本库，也换成中科大的
 echo \
"deb [arch=$(dpkg --print-architecture) signed-by=/usr/share/keyrings/docker-archive-keyring.gpg] https://mirrors.ustc.edu.cn/docker-ce/linux/ubuntu/ \
$(lsb_release -cs) stable" | sudo tee /etc/apt/sources.list.d/docker.list > /dev/null
# Docker engine，安装docker,默认是安装最新版
#1. 更新apt包索引，安装最新版本的Docker Engine、containd和Docker Compose，或者执行下一步安装具体版本:
$ sudo apt-get update
$ sudo apt-get install docker-ce docker-ce-cli containerd.io
 sudo apt-get update
 sudo apt-get install docker-ce docker-ce-cli containerd.io docker-compose-plugin
在完成安装后，执行下面命令，以确保安装成功：
sudo docker run hello-world
执行后看到打印出来正常的提示信息则表示安装成功。 
Unable to find image 'hello-world:latest' locally
latest: Pulling from library/hello-world
2db29710123e: Pull complete 
Digest: sha256:10d7d58d5ebd2a652f4d93fdd86da8f265f5318c6a73cc5b6a9798ff6d2b2e67
Status: Downloaded newer image for hello-world:latest
Hello from Docker!
This message shows that your installation appears to be working correctly.
To generate this message, Docker took the following steps:
1. The Docker client contacted the Docker daemon.
2. The Docker daemon pulled the "hello-world" image from the Docker Hub.
    (amd64)
3. The Docker daemon created a new container from that image which runs the
    executable that produces the output you are currently reading.
4. The Docker daemon streamed that output to the Docker client, which sent it
    to your terminal.
To try something more ambitious, you can run an Ubuntu container with:
$ docker run -it ubuntu bash
Share images, automate workflows, and more with a free Docker ID:
https://hub.docker.com/
7. 卸载
sudo apt-get purge docker-ce docker-ce-cli containerd.io docker-compose-plugin
sudo rm -rf /var/lib/docker
sudo rm -rf /var/lib/containerd
输入指令： docker version或者docker -v
然后启动，输入指令：systemctl start docker
输入指令：systemctl status docker 查看状态
设置开机自启动
输入指令：systemctl enable docker
2、安装NVIDIA Docker。
 
详细安装步骤见NVIDIA Docker Installation Guide. 安装完记得重启Docker，并用nvidia/cuda：11.0-base这个默认容器测试一下是否安装成功。 
1、Setting up Docker
 
在更新包清单后安装nvidia-docker2包(和依赖项): 
curl https://get.docker.com | sh \
  && sudo systemctl --now enable docker
sudo apt-get update
sudo apt-get install -y nvidia-docker2
2、重启docker
 
查看docker镜像
nvidia-docker image ls
sudo systemctl restart docker
sudo docker run --rm --gpus all nvidia/cuda:10.2-devel  nvidia-smi
sudo docker run --rm --gpus all nvidia/cuda:11.0.3-base-ubuntu20.04 nvidia-smi
# Restart the Docker daemon to complete the installation after setting the default runtime:
sudo systemctl restart docker
sudo docker run --rm --gpus all nvidia/cuda:11.0-base nvidia-smi
# 出现显卡信息界面即为安装成功
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 450.51.06    Driver Version: 450.51.06    CUDA Version: 11.0     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|                               |                      |               MIG M. |
|===============================+======================+======================|
|   0  Tesla T4            On   | 00000000:00:1E.0 Off |                    0 |
| N/A   34C    P8     9W /  70W |      0MiB / 15109MiB |      0%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------+
+-----------------------------------------------------------------------------+
| Processes:                                                                  |
|  GPU   GI   CI        PID   Type   Process name                  GPU Memory |
|        ID   ID                                                   Usage      |
|=============================================================================|
|  No running processes found                                                 |
+-----------------------------------------------------------------------------+
#查看目前有的镜像
$: docker images ls
REPOSITORY        TAG                            IMAGE ID       CREATED          SIZE
chicken           v1                             1108516f1e34   40 minutes ago   41.5GB
pytorch/pytorch   1.10.0-cuda11.3-cudnn8-devel   46961cbf2ac7   13 days ago      14.4GB
nvidia/cuda       11.0-base                      2ec708416bb8   14 months ago    122MB
pytorch/pytorch   0.4-cuda9-cudnn7-devel         63994d8624a2   3 years ago      4.71GB
#查看目前有的nvidia镜像
(base) lhy@thales-Super-Server:~$ sudo nvidia-docker image ls
REPOSITORY                                      TAG                             IMAGE ID       CREATED         SIZE
base_lhy                                        v2                              099779ca711d   2 hours ago     3.35GB
ship_lhy                                        v2                              d7736e805e66   3 hours ago     3.85GB
base_lhy                                        v1                              39254c6ac92d   5 hours ago     349MB
ship                                            v1                              800102d47ed0   2 days ago      15.8GB
mmrotate-base                                   latest                          b33eed70e933   2 days ago      11.8GB
10.1.30.236:1180/zdplane-alg/pytorch            1.7.1                           6d16d5fd026c   4 weeks ago     19.1GB
plane_change                                    v1                              d481d76ca6a1   5 weeks ago     3.11GB
plane_cd_base                                   v1                              2951b40b0c50   5




    
 weeks ago     929MB
base                                            v5                              0c129df3f48b   5 weeks ago     273MB
base                                            v4                              3a808aa5bee7   5 weeks ago     349MB
rotplane_base                                   v2                              c26be3e9fc4e   2 months ago    11.3GB
rotplane_base                                   v1                              a51c200fd94b   2 months ago    11.3GB
nvidia/cuda                                     11.0.3-base-ubuntu20.04         8017f5c31b74   3 months ago    122MB
pzrh                                            v1                              d06577ff10c1   3 months ago    2.09GB
<none>                                          <none>                          56f73c60d0b4   3 months ago    2.09GB
10.1.30.238:1180/alg/piesat.ortho.img_rectify   v1.2ghb                         fd04729678e0   4 months ago    1.54GB
continuumio/anaconda3                           latest                          377b235daeb7   4 months ago    3.65GB
frolvlad/alpine-miniconda3                      latest                          0ff139b9c93c   5 months ago    163MB
wuda                                            2.0                             800b35286000   5 months ago    1.94GB
24test100                                       v3                              101ff1eb47fc   5 months ago    11GB
base                                            v3                              1cd39b55f94b   5 months ago    273MB
base                                            v2                              bcfa14c8c145   5 months ago    273MB
base                                            v1                              e674c4d007d6   5 months ago    158MB
<none>                                          <none>                          4c251ae5df8f   5 months ago    5.03GB
<none>                                          <none>                          eae9394a25b0   5 months ago    7.75GB
tjp                                             v2                              954754db5c38   7 months ago    13.5GB
road_keras                                      v2                              5d12ac1f344d   7 months ago    12.3GB
building                                        v2                              73897a66af37   7 months ago    26.1GB
nvidia/cuda                                     10.2-cudnn7-devel-ubuntu18.04   02a0c8a4b445   9 months ago    3.96GB
bridge                                          v1                              c49c6be899cc   12 months ago   25.6GB
plane                                           v7                              c3137977e0e6   14 months ago   12.2GB
nvidia/cuda                                     10.2-devel                      7e913212889f   15 months ago   3.01GB
nvidia/cuda                                     9.0-base                        0bedd0dfd4cb   15 months ago   152MB
greenhouse                                      v5                              40f0131db4ca   2 years ago     9.06GB
dockerduong/cuda10.2-ubuntu18.04                latest                          08e708eba74a   2 years ago     108MB
3、启动NVIDIA-DOCKER
 
3、打包镜像Docker Build Image
 
1、拉取基础镜像
 
Anaconda发行版被安装到/opt/conda文件夹中，并确保默认用户的路径中有conda命令。
 You can download and run this image using the following commands: 
docker pull continuumio/anaconda3
docker run -i -t continuumio/anaconda3 /bin/bash
## 1、整理代码
将需要打包的模型代码整理到同一个目录下。举例来说，目录应该包含模型代码、数据文件夹、输出文件夹：
```bash
Model：
      Val Data
      Output Data
如果用的是python语言的，可以准备一个requirement.txt，列出需要安装的包。后面就可以一步安装到位。 
# 到代码目录下新建requirement.txt文件
touch requirment.txt
我的只需要再安装一个opencv包，所以我的requirment文件只要加上： 
opencv-python==3.4.2.17
大家看自己需要什么额外的包直接写上名称和对应版本就可以了。用pip生成的requirement文件包含太多重复无用的包，建议还是自己简单写几个。
 例如：
 ![在这里插入图片描述](https://img-blog.csdnimg.cn/61c4929ffcf74d5c8725b9ec084b6d27.png 
基于anconda基本镜像创建一个容器，通过这个步骤了解用命令创建一个容器的方法；
 
docker run -it --runtime=nvidia --name=tensorflow_gpu -p 8888:8888 --gpus all continuumio/anaconda3
其中，–runtime指定nvidia,代表容器真正运行的地方，理论上在daemon配置里面指定了docker的runtime后，命令里面可以不加，我这里还是加上了；-p 8888:8888是主机端口到容器端口的映射；tensorflow_gpu是我创建的容器的名称；–gpus参数控制可以用那些gpu，注意一定要指定该参数，否则创建的容器没法使用gpu，这里创建的容器可使用全部gpu，你也可以通过ID指定；continuumio/anaconda3是容器依赖的基本镜像。
 创建好之后，会自动进入容器的bash交互界面，你可以输入nvidia-smi查看gpu信息。使用按键Ctrl+D可以退出交互界面；
 Tips.
 在容器外面： 若要停止容器运行，使用 docker stop 命令。 若你想删除创建的容器，使用docker rm 命令。
 使用如下命令，重新启动容器并进入容器的交互界面：
 docker start tensorflow_gpu
 docker attach tensorflow_gpu 
新建一个session或者退出容器的bash交互界面后，使用docker cp命令可以将文件（当然也可以是项目、conda的虚拟环境）拷贝到容器中。
 这里我将conda中一个安装有TensorFlow+keras+gpu的环境移植到容器中：
 docker cp /root/anaconda3/envs/cyc_work tensorflow_gpu:/opt/conda/envs 
其中，/root/anaconda3/envs/cyc_work是主机中虚拟环境路径，可以再激活待移植环境后使用whereis conda查询；tensorflow_gpu是我创建的容器名称，/opt/conda/envs是容器中conda环境的路径。
 完成拷贝后，可以重新进入容器的bash交互界面，使用conda env list查看，你会发现主机中的虚拟环境已经成功移植过来：
 
 Tips. 因为是拷贝的虚拟环境，每次进入容器后手动source activate 很麻烦，可以修改~/.bashrc文件中的最后一行配置，修改conda默认启动环境。
 至此，已经成功实现将conda的虚拟环境移植到docker容器中，使用这个方法可以轻松地将不同的环境移植到不同的容器 
2、创建Dockfile创建镜像
 
同样，新建一个Dockfile文件，每一步的详细说明可以查看Dockerfile说明 、Dockerfile reference 
# Use an official PyTorch runtime as a parent image
FROM pytorch/pytorch
# Set the working directory
WORKDIR /docker_sample
# Copy the current directory contents into the container
COPY . /docker_sample
# Install any needed packages specified in requirements.txt
RUN pip install -r requirements.txt
# Run when the container launches
CMD ["python", "deploy_models.py"]
3、Dockerbuild
 
1、通过dockerfile生成 镜像
 
# 命令关键字 build -f参数后紧跟dockerfile文件名 -t参数后跟随的是期望的镜像名称和版本号。
# 别忘了最后的那个 . 这个点是为生成后的docker镜像指定上下文的路径。一般写个. 表示将当前的目录
# 作为上下文赋予新建的docker镜像。如果有特殊需要，可以将宿主机中的具体目录写在 . 的位置也可以。
[root@docker01 ~]# docker build -f centos_dockerfile -t mycentos7:1.0 .
查看效果，如下图红框中的内容即新增出来的镜像 
2、打包Docker镜像
 
sudo docker build -t docker_sample:latest .
其中-t参数指定镜像的名称为docker_sample和tag标签为latest，其中tag标签相当于版本号，最后的小点"."表示当前目录，因为当前目录下有Dockerfile文件。
3、运行Docker镜像
 
每个Docker镜像只被分配了几百M的共享内存，对于很多CNN模型是远远不够的，因此需要加上 --shm-size 8G 来增大Docker镜像的共享内存大小（Shared Memories Size）。我的任务8G就够用了。 
docker run --shm-size 8G --gpus all -v -it --rm image-name
添加-v Path：/model/val 就可以将宿主机上的Path文件夹映射到Docker镜像里的val文件夹下，那么Docker镜像运行时就会从Path这个文件夹下取数据，记得Path一定要是绝对路径。Ubuntu中可以通过Ctrl+L得到文件的绝对路径。 
对于我这个任务来说，我需要将新测试集和输出文件夹位置映射给Docker镜像，所以运行命令就是： 
sudo docker run --shm-size 8G --gpus all -v PATH_TO_VAL:/model/val
-v PATH_TO_PUT:/model/output -it --rm image_name
sudo nvidia-docker run --shm-size 8G --gpus all -v PATH_TO_VAL:/model/val
-v PATH_TO_PUT:/model/output -it --rm image_name
测试成功就可以提交打包的镜像啦！ 
4、 保存Docker镜像
 
# 保存文件
docker save -o output-filename image-name
sudo docker save -o docker_image.tar docker_sample:latest
4、外部测试镜像
 
1、导入Docker镜像
 
sudo docker load -i docker_image.tar
2、运行Docker镜像
 
docker run -idt --shm-size 4096m  --gpus all --name swin_seg xx:xx
sudo nvidia-docker run  --gpus all  -it baseconda_lhy:v1 /bin/bash
# 参数一 
--shm-size  # 设置容器的共享内存大小，这里设置的4g
# 参数二
--gpus all # 开启gpu
5、实例：Pyinstaller打包代码和虚拟环境成exe与Dockfile封装（）
 
1、安装pyinstaller
 
pip install pyinstaller
2、打包可执行程序
 
(mmrotate) lhy@thales-Super-Server:/media/lhy/mmrotatecopy$ pyinstaller -F detect_ship_hugetif.py -p  /home/lhy/anaconda3/envs/mmrotate/lib/python3.8/site-packages

 生成一次之后路径下会生成XX.spec，修改后可以用spec生成。
  
# -*- mode: python ; coding: utf-8 -*-
block_cipher = None
a = Analysis(
    ['detect_ship_hugetif.py'],
    pathex=['/home/lhy/anaconda3/envs/mmrotate/lib/python3.8/site-packages'],
    binaries=[],
    datas=[],
    hiddenimports=['setuptools._distutils','mmcv._ext'],#如果有库的依赖错误，在这里补上即可
    hookspath=[],
    hooksconfig={},
    runtime_hooks=[],
    excludes=[],
    win_no_prefer_redirects=False,
    win_private_assemblies=False,
    cipher=block_cipher,
    noarchive=False,
pyz = PYZ(a.pure, a.zipped_data, cipher=block_cipher)
exe = EXE(
    a.scripts,
    a.binaries,
    a.zipfiles,
    a.datas,
    [],
    name='detect_ship_hugetif',
    debug=False,
    bootloader_ignore_signals=False,
    strip=False,
    upx=True,
    upx_exclude=[],
    runtime_tmpdir=None,
    console=True,
    disable_windowed_traceback=False,
    argv_emulation




    
=False,
    target_arch=None,
    codesign_identity=None,
    entitlements_file=None,
options常用参数（按需求选择）：
 -D 与 -F 相反用法，生成一个文件目录包含可执行文件和相关动态链接库和资源文件等，对于打包结果较大的项目，选用-D生成目录相比-F的打包方式，执行速度更快，但包含更加多的文件 
-F 表示在 dist 文件夹下只生成单个可执行文件（内部包含所有依赖），不加默认会在 dist 生成一大堆依赖文件+可执行文件。 
-w 表示去掉控制台窗口，如果你的程序是有界面的，可以不写这个参数， 
-c 表示去掉窗框，使用控制台，推荐使用，会打印各种信息和log到控制台，加上这个参数生成的spec中的console=True 
-p 表示自己定义需要加载的类路径，项目中包含多个自建模块的时候需要加上 -p aaa.py -p bbb.py -p ccc.py 
-i 表示可执行文件的图标，后面跟图标的路径，可以自定义exe文件的图标，我尝试了好多次没成功
 　　打包完毕后在 dist 文件夹下双击项目启动文件就可以执行了 
3、执行.spec可执行程序
 
(mmrotate) lhy@thales-Super-Server:/media/lhy/mmrotatecopy$ pyinstaller detect_ship_hugetif.spec
4、dist下面会生成可执行文件，将配置文件和参数存进来即可。
 
5、执行./exe
 
(mmrotate) lhy@thales-Super-Server:/media/lhy/mmrotatecopy$ cat param.json | python detect_ship_hugetif.py
6、拉去或者导入base镜像
 
1、查看本地的基础
 
(base) lhy@thales-Super-Server:~$ sudo docker image ls
REPOSITORY                                      TAG                             IMAGE ID       CREATED         SIZE
base_lhy                                        v2                              099779ca711d   3 hours ago     3.35GB
ship_lhy                                        v2                              d7736e805e66   4 hours ago     3.85GB
base_lhy                                        v1                              39254c6ac92d   6 hours ago     349MB
ship                                            v1                              800102d47ed0   2 days ago      15.8GB
mmrotate-base                                   latest                          b33eed70e933   2 days ago      11.8GB
10.1.30.236:1180/zdplane-alg/pytorch            1.7.1                           6d16d5fd026c   4 weeks ago     19.1GB
plane_change                                    v1                              d481d76ca6a1   5 weeks ago     3.11GB
plane_cd_base                                   v1                              2951b40b0c50   5 weeks ago     929MB
base                                            v5                              0c129df3f48b   5 weeks ago     273MB
base                                            v4                              3a808aa5bee7   5 weeks ago     349MB
rotplane_base                                   v2                              c26be3e9fc4e   2 months ago    11.3GB
rotplane_base                                   v1                              a51c200fd94b   2 months ago    11.3GB
nvidia/cuda                                     11.0.3-base-ubuntu20.04         8017f5c31b74   3 months ago    122MB
pzrh                                            v1                              d06577ff10c1   3 months ago    2.09GB
<none>                                          <none>                          56f73c60d0b4   3 months ago    2.09GB
10.1.30.238:1180/alg/piesat.ortho.img_rectify   v1.2ghb                         fd04729678e0   4 months ago    1.54GB
continuumio/anaconda3                           latest                          377b235daeb7   4 months ago    3.65GB
frolvlad/alpine-miniconda3                      latest                          0ff139b9c93c   5 months ago    163MB
wuda                                            2.0                             800b35286000   5 months ago    1.94GB
24test100                                       v3                              101ff1eb47fc   5 months ago    11GB
base                                            v3                              1cd39b55f94b   5 months ago    273MB
base                                            v2                              bcfa14c8c145   5 months ago    273MB
base                                            v1                              e674c4d007d6   5 months ago    158MB
<none>                                          <none>                          4c251ae5df8f   5 months ago    5.03GB
<none>                                          <none>                          eae9394a25b0   5 months ago    7.75GB
tjp                                             v2                              954754db5c38   7 months ago    13.5GB
road_keras                                      v2                              5d12ac1f344d   7 months ago    12.3GB
building                                        v2                              73897a66af37   7 months ago    26.1GB
nvidia/cuda                                     10.2-cudnn7-devel-ubuntu18.04   02a0c8a4b445   9 months ago    3.96GB
bridge                                          v1                              c49c6be899cc   12 months ago   25.6GB
plane                                           v7                              c3137977e0e6   14 months ago   12.2GB
nvidia/cuda                                     10.2-devel                      7e913212889f   15 months ago   3.01GB
nvidia/cuda                                     9.0-base                        0bedd0dfd4cb   15 months ago   152MB
greenhouse                                      v5                              40f0131db4ca   2 years ago     9.06GB
dockerduong/cuda10.2-ubuntu18.04                latest                          08e708eba74a   2 years ago     108MB
我们选取base：v4 作为基础镜像 
7、 dockerfile：指定工作目录 ，打出基础镜像
 
sudo docker build -t base_lhy:v1   .
8、 把打包好的推理文件夹考备到docker容器里
 
1、进入容器
 
sudo nvidia-docker run -it base_lhy:v1 /bin/bash
sudo nvidia-docker run  --gpus all  -it baseconda_lhy:v1 /bin/bash
2、查看运行的容器Id号
 
sudo docker ps -a
3、将dist中准备好的文件拷贝到运行的容器中的主目录code文件夹下
 
(base) lhy@thales-Super-Server:/media/lhy/mmrotatecopy/dist_1$ sudo docker cp /media/lhy/mmrotatecopy/dist_1/myconfig  640ff0779bf1:/code/
(base) lhy@thales-Super-Server:/media/lhy/mmrotatecopy/dist_1$ sudo docker cp /media/lhy/mmrotatecopy/dist_1/myweight  640ff0779bf1:/code/
(base) lhy@thales-Super-Server:/media/lhy/mmrotatecopy/dist_1$ sudo docker cp /media/lhy/mmrotatecopy/dist_1/proj  640ff0779bf1:/code/
(base) lhy@thales-Super-Server:/media/lhy/mmrotatecopy/dist_1$ sudo docker cp /media/lhy/mmrotatecopy/dist_1/param.json  640ff0779bf1:/code/
(base) lhy@thales-Super-Server:/media/lhy/mmrotatecopy/dist_1$ sudo docker cp /media/lhy/mmrotatecopy/dist_1/inference_dirs  640ff0779bf1:/code/
4、在容器内部运行代码
 
root@640ff0779bf1:/code/inference_dirs/input# cat param.json | ./detect_ship_hugetif 
5、Docker commit 容器名 镜像名(使用docker commit 进行镜像容器修改)
 
docker commit  容器名 镜像名(使用docker commit 进行镜像容器修改)
docker commit  640ff0779bf1 ship_lhy:v2(使用docker commit 进行镜像容器修改)
docker commit  6ae727b2a299  ship_lhy:v3
6、外部调用打包好的docker镜像
 
(base) lhy@thales-Super-Server:~$ sudo nvidia-docker run  ship_lhy:v2  /bin/bash  -c "cat param.json | ./detect_ship_hugetif" 
sudo nvidia-docker run -v /media/lhy/mmrotate/inference_dirs/redet_ship_exp1/input:/code/inference_dirs/input -it ship_lhy:v2  /bin/bash -c "cat param.json|./detect_ship_hugetif"#外部数据路径映射docker内部的/code/inference_dirs/input数据路径
7、docker save -o 镜像名 tar包名(镜像打包保存)
 
docker save -o tar包名  镜像名
sudo docker save -o dockership_lhy.tar ship_lhy:v2
6、实例：打包mmsegmentation深度学习环境
 
1、构建Dockerfile
 
# 从conda开始构建
FROM continuumio/anaconda3:2020.07
MAINTAINER xxxx
# 从cuda复制基础环境
COPY --from=nvidia/cuda:11.4.0-devel-ubuntu20.04 / /
# Set the working directory
WORKDIR /xx_code
# Copy the current directory contents into the container
COPY .  /xx_code
# 复制代码
#COPY xx_code /xx_code
# 复制conda环境
COPY env_name.tar.gz /opt/conda/envs/
# 解压创建conda环境
RUN mkdir /opt/conda/envs/env_name
RUN tar -zxf /opt/conda/envs/env_name.tar.gz -C /opt/conda/envs/env_name
# 设置全局shell环境，使用/bin/bash
SHELL ["/bin/bash","-c"]
RUN source activate env_name
RUN echo "source activate env_name " >> ~/.bashrc
#运行代码
CMD python detect_ship_hugetif.py
2、后续执行可以参考5、实例：Pyinstaller打包代码和虚拟环境成exe与Dockfile封装的代码步奏与顺序

                                    在我们平时使用PyCharm的过程中，一般都是连接本地的Python环境进行开发，但是如果是离线的环境呢？这样就不好搭建Python开发环境，因为第三方模块的依赖复杂，不好通过离线安装包的方式安装。本文将介绍如何利用PyCharm来连接Docker镜像，从而搭建Python开发环境。
首先，我们需要准备一下工具：
  PyCharm专业版
  Docker
我们用一个示例项目来演示在PyCharm中如何利用Docker镜像搭建Python开发环境。项目的截图如下：
注意到，在该项目中还没有设置Python开发环境，External Libraries为空，到时候我们将用Docker中的
                                    docker的介绍网上有很多，对于深度学习的认来讲，docker的好处就是直接把环境分享给他人，他人不需要再配置环境了。比如我有一个目标检测的项目，我想分享给朋友，那么他首先需要在自己的电脑上配置好显卡驱动、CUDA、CuDNN，在拿到我的项目后，还需要安装各种依赖库，最后代码还不一定跑起来。如果我是用了docker环境进行项目配置，我只需要将环境打包好后分享给朋友。他只需要安装好显卡驱动就行，什么cuda、pytorch之类的都在我分享的环境了。
                                    这是我遇到的问题，这个问题是因为项目中的VGG19预训练模型是从网上下载的，之后再运行，代码会直接在迁移后的电脑的./cache/torch/hub/checkpoints/下找这个下载的预训练模型。注意：输入这个命令就行，加别的命令会报错，如果有–add data参数的需求，直接在spec里改datas就行，–hidden什么的直接在spec里改就行了，我在上面写了。由于我需要打包的是多个.py文件，以及包含了.pth权重资源文件的项目，所以我不能用许多博客里描述的直接用。
 作为2021年全栈深度学习的一部分，我们将逐步开发完整的深度学习代码库，以理解手写段落的内容。
 我们将使用PyTorch和PyTorch-Ligtning的现代堆栈
今天，我们将使用DL的主要功能：CNN，RNN和变形金刚
我们将使用我们认为最适合该工作的工具来管理实验：权重和偏差
我们将使用CircleCI为我们的代码库建立持续集成系统
我们将使用FastAPI将预测系统打包为REST API，然后将其作为Docker容器部署在AWS Lambda上。
 我们将设置监控，以在传入数据分布发生变化时向我们发出警报。
 ：设置我们的计算环境。
 ：制定问题，构建代码库，为MNIST训练MLP。
  ：介绍EMNIST，生成合成手写行，并训练CNN。
  ：使用具有CTC损失的CNN + LSTM进行行文本识别。
 ：使用变压器进
这是一个购买预测机器学习模型，该模型是在Logistic回归的帮助下创建的，用于根据年龄和估计工资确定Car的购买意愿。
它使用深度学习和python检测图像
我将在此项目中使用Logistic回归，尤其是在Kaggle提供的数据集上进行训练。
* pip3 install numpy
* pip3 install flask 
* Docker
该模型基于python程序构建，随后将其连接到Flask ，从而帮助其在Web服务器上进行部署。 网页建立在HTML和CSS之上。 Docker和Dockerfile用于将其全部转换为OS（图像）。 该映像随后在Docker Hub上推送以供公众使用。 要从Docker Hub中提取该图像，请在docker pull maverick6798 / logistic上稍后将所有文件上传到github。
运行项目
下载码头工
                                    从Keras到Kubernetes：机器学习模型到生产的旅程
-2019年4月发行书籍
在过去的几年中，我们已经看到人工智能（AI）的使用呈指数增长。 人工智能正在成为新的力量，并正在触及从零售到制造业到医疗保健再到娱乐的各个行业。 在AI内，我们看到机器学习（ML）和深度学习（DL）应用程序有了特殊的增长。 ML就是从标记的（有监督的）或无标记的数据（无监督的）中学习关系。 DL具有许多学习层，可以从非结构化数据（例如图像，视频，音频等）中提取模式。
 从Keras到Kubernetes：机器学习模型到生产的旅程将带您了解在Keras中构建DL模型的真实示例，以识别图像中的产品徽标并从文本中提取情感。 然后，您将采用经过训练的模型并将其打包为Web应用程序容器，然后学习如何在Kubernetes集群上大规模部署该模型。 您将了解现实世界中ML实现所涉及的不同实际步骤，这些步骤超出了算法。
                                    本博客主要记录下docker打包项目并生成image的流程。
1.docker介绍
docker我的理解有点类似于虚拟机，就是将程序运行的环境与物理机隔离开来，之后移植的时候将整个虚拟环境都移植过去，这样程序在不同的物理机上运行也就不会出错了。
docker最为关键的有image、container、docker hub等一些概念，image就是一个模板，这个模板是一些通用的，基础的，比如系统，又比如python编译器、java编译器等等。通过模板可以生产具体使用的环境，这个就是container了，而do
                                    Docker是一种相对使用较简单的容器，我们可以通过以下几种方式获取信息：1，通过docker run执行命令，或许返回信息2，通过docker logs去获取日志，做有针对性的筛选3，通过systemctl status docker查看docker服务状态4，通过journalctl -u docker.service查看日志。
                                    Docker是一种开源的容器化平台，它可以在操作系统级别运行应用程序。通过将应用程序及其依赖项封装成一个可移植的容器，Docker使得应用程序可以在任何环境中轻松部署、运行和管理。使用Docker，开发人员可以避免在不同环境中出现的配置问题，并且可以更快地构建、测试和交付应用程序。Docker还提供了强大的集群管理功能，可以自动扩展和负载均衡应用程序，从而实现高可用性和可伸缩性。这使得Docker成为现代云原生应用程序开发和部署的核心技术之一,本文基于官方文档对代码库docker打包部署进行介绍。
                                    这里有很多种方式可以生成，本文使用的是popreqs这个工具，这个工具能够只将当前项目所需要的库导出。里面包含三个文件，分别是Python项目文件、requirements.txt、Dockerfile。这个按照自己的环境以及需求进行修改。前往项目路径运行上述命令。
1、参考博客

2、普通Docker和NVIDIA Docker安装

1、 Install Docker Engine on Ubuntu

2、安装NVIDIA Docker。

1、Setting up Docker

2、重启docker

3、启动NVIDIA-DOCKER

3、打包镜像Docker Build Image

1、拉取基础镜像

基于anconda基本镜像创建一个容器，通过这个步骤了解用命令创建一个容器的方法；

2、创建Dockfile创建镜像

3、Dockerbuild

1、通过dockerfile生成镜像

2、打包Docker镜像

3、运行Docker镜像

4、保存Docker镜像

4、外部测试镜像

1、导入Docker镜像

2、运行Docker镜像

5、实例：Pyinstaller打包代码和虚拟环境成exe与Dockfile封装（）

1、安装pyinstaller

2、打包可执行程序

3、执行.spec可执行程序

4、dist下面会生成可执行文件，将配置文件和参数存进来即可。

5、执行./exe

6、拉去或者导入base镜像

1、查看本地的基础

7、 dockerfile：指定工作目录，打出基础镜像

8、把打包好的推理文件夹考备到docker容器里

1、进入容器

2、查看运行的容器Id号

3、将dist中准备好的文件拷贝到运行的容器中的主目录code文件夹下

4、在容器内部运行代码

5、Docker commit 容器名镜像名(使用docker commit 进行镜像容器修改)

6、外部调用打包好的docker镜像

7、docker save -o 镜像名 tar包名(镜像打包保存)

6、实例：打包mmsegmentation深度学习环境

1、构建Dockerfile

2、后续执行可以参考5、实例：Pyinstaller打包代码和虚拟环境成exe与Dockfile封装的代码步奏与顺序