論文の概要: Where did we fail? -- Reproducing build failures in embedded open source software
- arxiv url: http://arxiv.org/abs/2604.27075v1
- Date: Wed, 29 Apr 2026 18:07:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-01 16:31:53.748849
- Title: Where did we fail? -- Reproducing build failures in embedded open source software
- Title(参考訳): 組み込みオープンソースソフトウェアにおけるビルド失敗の再現は、どこで失敗したのか?
- Authors: Han Fu, Andreas Ermedahl, Sigrid Eldh, Kristian Wiklund, Philipp Haller, Cyrille Artho,
- Abstract要約: 私たちは、継続的統合ビルドログとメタデータの検索、ストレージ、再生を標準化するデータセットであるPhantomRunを紹介します。
4628回のCI実行に失敗し、91.8%のビルドを再構築し、98%のケースで実行結果を保存した。
実験的な評価によると、再現されたビルドは元のものと密接に一致しており、通常はタイムスタンプやマイナーな非決定論的リオーダーでのみ異なる。
- 参考スコア(独自算出の注目度): 2.64399132991614
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Due to hardware-software co-development in embedded systems, continuous integration (CI) builds frequently fail because of complex cross-compilation, board configurations, and toolchain constraints. Although CI build logs contain valuable diagnostic information, they are short-lived and difficult to reuse due to heterogeneous runners, toolchains, and log formats. To address these challenges, we present PhantomRun, a unified abstraction layer and publicly reusable dataset that standardizes the retrieval, storage, and reproduction of CI build logs and metadata. Across 4628 failing CI runs, we reconstructed 91.8% of builds and preserved execution outcomes in 98% of evaluated cases. PhantomRun provides two core capabilities: retrieving the build log of any commit and faithfully re-executing the corresponding build in a controlled environment. By exposing all build artifacts and metadata in a uniform, machine-readable format, PhantomRun enables reproducible and longitudinal studies of CI failures. An empirical evaluation shows that reproduced builds closely match their originals, typically differing only in timestamps or minor nondeterministic reordering, demonstrating the feasibility of large-scale historical CI reconstruction.
- Abstract(参考訳): 組み込みシステムにおけるハードウェアとソフトウェアの共同開発のため、継続的インテグレーション(CI)ビルドは複雑なクロスコンパイル、ボード構成、ツールチェーンの制約によって頻繁に失敗する。
CIビルドログには貴重な診断情報が含まれているが、ヘテロジニアスランナー、ツールチェーン、ログフォーマットのため、短命で再利用が難しい。
これらの課題に対処するため、私たちは、CIビルドログとメタデータの検索、ストレージ、再生を標準化する、統一された抽象化レイヤと公用データセットであるPhantomRunを紹介します。
4628回のCI実行に失敗し、91.8%のビルドを再構築し、98%のケースで実行結果を保存した。
PhantomRunは、コミットのビルドログを取得することと、コントロールされた環境で対応するビルドを忠実に再実行する、という2つのコア機能を提供する。
すべてのビルドアーティファクトとメタデータを均一でマシン可読な形式で公開することにより、PhantomRunは、CI障害の再現性と縦断的な研究を可能にする。
実験的な評価では、再現されたビルドは元のものと密接に一致しており、通常はタイムスタンプやマイナーな非決定論的リオーダーでのみ異なり、大規模な歴史的CI再構築の可能性を示している。
関連論文リスト
- Understanding by Reconstruction: Reversing the Software Development Process for LLM Pretraining [66.89012795621349]
大規模言語モデル(LLM)は、複雑なソフトウェア工学に必要な、深く、長期にわたる推論に苦しむことが多い。
本稿では,再構築による理解という,新しいパラダイムを提案する。
マルチエージェントシミュレーションを用いて潜在エージェント軌道を合成するフレームワークを提案する。
論文 参考訳(メタデータ) (2026-03-11T09:23:20Z) - His2Trans: A Skeleton First Framework for Self Evolving C to Rust Translation with Historical Retrieval [45.246293154277886]
His2Transは、決定論的でビルド対応のスケルトンと自己進化的な知識抽出を組み合わせて、安定したインクリメンタルマイグレーションをサポートするフレームワークである。
産業用OpenHarmonyモジュールの実験では、His2Transが99.75%インクリメンタルコンパイルパスレートに達した。
論文 参考訳(メタデータ) (2026-03-03T05:42:08Z) - PhantomRun: Auto Repair of Compilation Errors in Embedded Open Source Software [2.64399132991614]
プロジェクトのCI実行から4000以上のビルド障害にまたがる4つの主要なオープンソース組み込みシステムプロジェクトについて調査する。
ハードウェア依存関係がコンパイルエラーの大部分を占めており、その後に構文エラーやビルドスクリプトの問題が発生しています。
PhantomRunは、大規模な言語モデル(LLM)を活用してCIコンパイル障害の修正を生成し、検証する自動化フレームワークである。
論文 参考訳(メタデータ) (2026-02-23T19:13:22Z) - NL2Repo-Bench: Towards Long-Horizon Repository Generation Evaluation of Coding Agents [79.29376673236142]
既存のベンチマークは、完全なソフトウェアシステムを構築するのに必要な長期的能力の厳格な評価に失敗する。
符号化エージェントの長期リポジトリ生成能力を評価するために設計されたベンチマークであるNL2Repo Benchを提案する。
論文 参考訳(メタデータ) (2025-12-14T15:12:13Z) - SwingArena: Competitive Programming Arena for Long-context GitHub Issue Solving [90.32201622392137]
We present SwingArena, a competitive evaluation framework for Large Language Models (LLMs)。
従来の静的ベンチマークとは異なり、SwingArenaはLLMをイテレーションとして組み合わせて、テストケースを作成し、継続的インテグレーション(CI)パイプラインを通じてパッチを検証するパッチとレビュアーを生成することで、ソフトウェアのコラボレーションプロセスをモデル化する。
論文 参考訳(メタデータ) (2025-05-29T18:28:02Z) - Attestable Builds: Compiling Verifiable Binaries on Untrusted Systems using Trusted Execution Environments [2.4650753804485417]
我々は、ソフトウェアアーティファクトに強力なソース対バイナリ対応を提供する新しいパラダイムである、検証可能なビルドを提示する。
我々のシステムは、最新の信頼できる実行環境(TEE)とサンドボックス化されたビルドコンテナを使用して、特定のアーティファクトが特定のソースコードスナップショットから正しく構築されていることを確実に保証します。
論文 参考訳(メタデータ) (2025-05-05T10:00:04Z) - Does Functional Package Management Enable Reproducible Builds at Scale? Yes [4.492444446637857]
Reproducible Builds (R-B) は、ソフトウェアパッケージをソースから再構築することを保証する。
我々は,Nix機能パッケージマネージャのコンテキストにおいて,ビットワイズに関する最初の大規模研究を行う。
非常に高いビットワイズ率、69~91%の上昇傾向、さらに高いリビルド可能性率、99%以上を得ています。
論文 参考訳(メタデータ) (2025-01-27T10:11:27Z) - On the Security Blind Spots of Software Composition Analysis [46.1389163921338]
Mavenリポジトリで脆弱性のあるクローンを検出するための新しいアプローチを提案する。
Maven Centralから53万以上の潜在的な脆弱性のあるクローンを検索します。
検出された727個の脆弱なクローンを検出し、それぞれに検証可能な脆弱性証明プロジェクトを合成する。
論文 参考訳(メタデータ) (2023-06-08T20:14:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。