如何在 Docker 中缓存 maven 依赖项

2022-09-04 21:36:10

我正在处理一个具有约200MB依赖项的项目,由于带宽有限,我想避免无用的上传。

当我推送我的Dockerfile(我一会儿会附加它)时,即使我没有触摸pom,我总是有一个~200MB的上传.xml:

FROM maven:3.6.0-jdk-8-slim

WORKDIR /app

ADD pom.xml /app

RUN mvn verify clean --fail-never

COPY ./src /app/src

RUN mvn package

ENV CONFIG_FOLDER=/app/config
ENV DATA_FOLDER=/app/data
ENV GOLDENS_FOLDER=/app/goldens
ENV DEBUG_FOLDER=/app/debug

WORKDIR target

CMD ["java","-jar","-Dlogs=/app/logs", "myProject.jar"]

这个Dockerfile应该制作一个200MB的fatJAR,包括所有的依赖关系,这就是为什么每次发生~200MB的上传。我想实现的是构建一个包含所有依赖项的层,并“告诉”打包阶段不要将依赖项JAR包含在fatJAR中,而是在给定的目录中搜索它们。

我想知道构建一个在构建过程之前执行的脚本,然后将目录复制到容器;然后构建一个“非胖”JAR,该JAR仅链接所有这些依赖项,而不是实际复制到其中。mvn dependency:copy-dependencies

这可能吗?

编辑:我发现容器的 Maven 本地存储库位于 .所以我最终制作了一个非常简单的脚本,如下所示:/root/.m2

BuildDocker.sh

mvn verify -clean --fail-never
mv ~/.m2 ~/git/myProjectRepo/.m2

sudo docker build -t myName/myProject:"$1"

并编辑了Dockerfile,如下所示:

# Use an official Python runtime as a parent image
FROM maven:3.6.0-jdk-8-slim

# Copy my Mavne Local Repository into the container thus creating a new layer
COPY ./.m2 /root/.m2

# Set the working directory to /app
WORKDIR /app

# Copy the pom.xml
ADD pom.xml /app

# Resolve and Download all dependencies: this will be done only if the pom.xml has any changes
RUN mvn verify clean --fail-never

# Copy source code and configs 
COPY ./src /app/src

# create a ThinJAR
RUN mvn package


# Run the jar
...

在构建过程之后,我说有所有的目录I,但一旦我启动JAR,我得到:/root/.m2

Exception in thread "main" java.lang.NoClassDefFoundError: org/apache/log4j/Priority
    at myProject.ThreeMeans.calculate(ThreeMeans.java:17)
    at myProject.ClusteringStartup.main(ClusteringStartup.java:7)
Caused by: java.lang.ClassNotFoundException: org.apache.log4j.Priority
    at java.net.URLClassLoader.findClass(URLClassLoader.java:382)
    at java.lang.ClassLoader.loadClass(ClassLoader.java:424)
    at sun.misc.Launcher$AppClassLoader.loadClass(Launcher.java:349)
    at java.lang.ClassLoader.loadClass(ClassLoader.java:357)
    ... 2 more

也许我不应该运行它?java -jar


答案 1

如果我正确地理解了你想要实现的目标,那么问题是要避免在每个Docker构建中创建一个包含所有Maven依赖项的胖罐(以减轻重建后要推送的Docker层的大小)。

如果是,您可能对Spring Boot Thin Launcher感兴趣,它也适用于非Spring-Boot项目。相应的 GitHub 存储库中提供了一些全面的文档:https://github.com/dsyer/spring-boot-thin-launcher#readmeREADME.md

总而言之,在您的插件中添加以下插件声明就足够了:pom.xml

<build>
    <plugins>
        <plugin>
            <groupId>org.springframework.boot</groupId>
            <artifactId>spring-boot-maven-plugin</artifactId>
            <!--<version>${spring-boot.version}</version>-->
            <dependencies>
                <dependency>
                    <groupId>org.springframework.boot.experimental</groupId>
                    <artifactId>spring-boot-thin-layout</artifactId>
                    <version>1.0.19.RELEASE</version>
                </dependency>
            </dependencies>
        </plugin>
    </plugins>
</build>

理想情况下,此解决方案应与标准设置结合使用,以便从 Docker 的缓存中受益(有关典型示例,请参见下文)。Dockerfile

将 Docker 的缓存机制用于 Java/Maven 项目

如果只触及了源代码文件(),则避免在每个构建中重新下载所有Maven依赖项的原型在以下参考中给出:
https://whitfin.io/speeding-up-maven-docker-builds/Dockerfilesrc/*

更确切地说,建议如下:Dockerfile

# our base build image
FROM maven:3.5-jdk-8 as maven

WORKDIR /app

# copy the Project Object Model file
COPY ./pom.xml ./pom.xml

# fetch all dependencies
RUN mvn dependency:go-offline -B

# copy your other files
COPY ./src ./src

# build for release
# NOTE: my-project-* should be replaced with the proper prefix
RUN mvn package && cp target/my-project-*.jar app.jar


# smaller, final base image
FROM openjdk:8u171-jre-alpine
# OPTIONAL: copy dependencies so the thin jar won't need to re-download them
# COPY --from=maven /root/.m2 /root/.m2

# set deployment directory
WORKDIR /app

# copy over the built artifact from the maven image
COPY --from=maven /app/app.jar ./app.jar

# set the startup command to run your binary
CMD ["java", "-jar", "/app/app.jar"]

请注意,它依赖于Docker所谓的多阶段构建功能(存在两个指令),这意味着最终映像将比基本映像本身小得多。
(如果您在开发阶段对该功能不感兴趣,则可以删除行和 。)FROMmavenFROM openjdk:8u171-jre-alpineCOPY --from=maven /app/app.jar ./app.jar

在这种方法中,Maven 依赖项在行之前获取(以便从 Docker 的缓存中受益)。RUN mvn dependency:go-offline -BCOPY ./src ./src

但请注意,标准目标并不“完美”,因为一些动态依赖项/插件仍可能在步骤中触发一些重新下载。如果这对你来说是一个问题(例如,如果在某些时候你真的想离线工作),你可以看看另一个SO答案,它建议使用提供目标的专用插件。dependency:go-offlinemvn packagede.qaware.maven:go-offline-maven-plugin:resolve-dependencies


答案 2

在一般的 Dockerfile 容器构建中,在层中工作,每次构建这些层时,这些层在 catch 中可用,如果没有更改,则使用。理想情况下,它应该以相同的方式工作。

默认情况下,Maven 通常会在 Ubuntu 中 User 的 Home dir 中的文件夹中查找依赖项.m2/home/username/

如果依赖 jar 不可用,则会将这些 jar 下载到 .m2 并使用它。

现在,您可以在成功构建 1 次后压缩并复制此文件夹,并将其移动到 Docker 容器用户的主目录中。.m2

在运行生成命令之前执行此操作

注意:您可能需要替换 Docker 中的现有文件夹.m2

所以你的 Docker 文件会像这样

FROM maven:3.6.0-jdk-8-slim

WORKDIR /app

COPY .m2.zip /home/testuser/

ADD pom.xml /app

RUN mvn verify clean --fail-never

COPY ./src /app/src

RUN mvn package
...

推荐