論文の概要: Docker Does Not Guarantee Reproducibility
- arxiv url: http://arxiv.org/abs/2601.12811v1
- Date: Mon, 19 Jan 2026 08:16:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-21 22:47:22.803237
- Title: Docker Does Not Guarantee Reproducibility
- Title(参考訳): Dockerは再現性を保証しない
- Authors: Julien Malka, Stefano Zacchiroli, Théo Zimmermann,
- Abstract要約: Dockerのようなコンテナ技術は、ソフトウェア環境をイメージとして知られる共有可能なスナップショットにカプセル化することで、この問題に対処する。
Dockerは理論的に可能なツールとして文献にしばしば引用されているが、その保証と実用上の制限の程度は未調査のままである。
まず、Dockerが文学に関する科学的談話にどのように組み込まれているかを調べるために、系統的なレビューを実施します。
次に、GitHubから収集された5298のDockerfileに関する大規模な実証的研究を行った。
- 参考スコア(独自算出の注目度): 8.363502352389188
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The reproducibility of software environments is a critical concern in modern software engineering, with ramifications ranging from the effectiveness of collaboration workflows to software supply chain security and scientific reproducibility. Containerization technologies like Docker address this problem by encapsulating software environments into shareable filesystem snapshots known as images. While Docker is frequently cited in the literature as a tool that enables reproducibility in theory, the extent of its guarantees and limitations in practice remains under-explored. In this work, we address this gap through two complementary approaches. First, we conduct a systematic literature review to examine how Docker is framed in scientific discourse on reproducibility and to identify documented best practices for writing Dockerfiles enabling reproducible image building. Then, we perform a large-scale empirical study of 5298 Docker builds collected from GitHub workflows. By rebuilding these images and comparing the results with their historical counterparts, we assess the real reproducibility of Docker images and evaluate the effectiveness of the best practices identified in the literature.
- Abstract(参考訳): ソフトウェア環境の再現性は、コラボレーションワークフローの有効性からソフトウェアサプライチェーンのセキュリティ、科学的再現性まで、現代のソフトウェア工学において重要な関心事である。
Dockerのようなコンテナ技術は、ソフトウェア環境をイメージとして知られる共有可能なファイルシステムスナップショットにカプセル化することでこの問題に対処する。
Dockerは理論上の再現性を実現するツールとして文献にしばしば引用されているが、その保証と実用上の制限の程度は未調査のままである。
本稿では,このギャップを2つの相補的アプローチで解決する。
まず、再現性に関する科学的談話の中でDockerがどのように構成されているかを調べ、再現可能なイメージ構築を可能にするDockerfileを書くためのドキュメント化されたベストプラクティスを特定するために、系統的な文献レビューを実施します。
次に、GitHubワークフローから収集された5298のDockerビルドについて、大規模な実証的研究を行います。
これらのイメージを再構築し、その結果を過去のものと比較することにより、Dockerイメージの実際の再現性を評価し、文献で特定されたベストプラクティスの有効性を評価する。
関連論文リスト
- SynthID-Image: Image watermarking at internet scale [55.5714762895087]
本稿では,AI生成画像の透かしを行うディープラーニングシステムであるSynthID-Imageを紹介する。
本稿では,このようなシステムをインターネット規模で展開する上での技術的デシラタ,脅威モデル,実践的課題について述べる。
論文 参考訳(メタデータ) (2025-10-10T11:03:31Z) - gh0stEdit: Exploiting Layer-Based Access Vulnerability Within Docker Container Images [0.0]
gh0stEditは、攻撃者が悪意のあるDockerイメージを編集することを可能にする。
この攻撃は、画像署名を無効にすることなく、署名された画像に対して実行することもできる。
我々は、Dockerイメージのセキュリティと信頼性に対する現在のアプローチの問題点を強調し、検出されることなく、野生で悪用される可能性のある攻撃方法を公開する。
論文 参考訳(メタデータ) (2025-06-09T20:38:17Z) - Toward Automated Test Generation for Dockerfiles Based on Analysis of Docker Image Layers [1.1879716317856948]
Dockerイメージを構築するプロセスは、Dockerfileと呼ばれるテキストファイルで定義されている。
Dockerfileは、Dockerイメージのビルド方法の指示を含む、一種のソースコードと見なすことができる。
本稿では,Dockerfileの自動テスト生成手法を提案する。
論文 参考訳(メタデータ) (2025-04-25T08:02:46Z) - Refactoring for Dockerfile Quality: A Dive into Developer Practices and Automation Potential [0.0]
本稿では,358のオープンソースプロジェクトの600fileを使用したDockerfileの自動化の有用性と実用性について検討する。
提案手法では,画像サイズが平均32%減少し,ビルド期間が6%減少し,77%,91%の症例で理解性と保守性が向上した。
論文 参考訳(メタデータ) (2025-01-23T23:10:47Z) - Exploring Incompatible Knowledge Transfer in Few-shot Image Generation [107.81232567861117]
少ないショット画像生成は、いくつかの参照サンプルを使用して、ターゲットドメインから多彩で高忠実な画像を生成することを学習する。
既存のF SIGメソッドは、ソースジェネレータから事前の知識を選択し、保存し、転送し、ターゲットジェネレータを学習する。
本稿では,知識保存を補完する操作であり,軽量プルーニング方式で実装した知識トランケーションを提案する。
論文 参考訳(メタデータ) (2023-04-15T14:57:15Z) - Benchopt: Reproducible, efficient and collaborative optimization
benchmarks [67.29240500171532]
Benchoptは、機械学習で最適化ベンチマークを自動化、再生、公開するためのフレームワークである。
Benchoptは実験を実行、共有、拡張するための既製のツールを提供することで、コミュニティのベンチマークを簡単にする。
論文 参考訳(メタデータ) (2022-06-27T16:19:24Z) - Studying the Practices of Deploying Machine Learning Projects on Docker [9.979005459305117]
Dockerはコンテナ化サービスであり、Webサイト、データベース、アプリケーションのAPI、機械学習(ML)モデルを数行のコードで簡単にデプロイできる。
私たちは、MLベースのプロジェクトのデプロイにDockerがどのように使用されているのかを理解するために、探索的な調査を実施しました。
論文 参考訳(メタデータ) (2022-06-01T18:13:30Z) - From ImageNet to Image Classification: Contextualizing Progress on
Benchmarks [99.19183528305598]
ImageNet作成プロセスにおける特定の設計選択が、結果のデータセットの忠実性に与える影響について検討する。
私たちの分析では、ノイズの多いデータ収集パイプラインが、結果のベンチマークと、それがプロキシとして機能する実世界のタスクとの間に、体系的なミスアライメントをもたらす可能性があることを指摘しています。
論文 参考訳(メタデータ) (2020-05-22T17:39:16Z) - A Transformer-based Approach for Source Code Summarization [86.08359401867577]
コードトークン間のペア関係をモデル化することにより,要約のためのコード表現を学習する。
アプローチは単純であるにもかかわらず、最先端技術よりもかなりの差があることが示される。
論文 参考訳(メタデータ) (2020-05-01T23:29:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。