論文の概要: PhantomRun: Auto Repair of Compilation Errors in Embedded Open Source Software
- arxiv url: http://arxiv.org/abs/2602.20284v1
- Date: Mon, 23 Feb 2026 19:13:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-25 17:34:53.492759
- Title: PhantomRun: Auto Repair of Compilation Errors in Embedded Open Source Software
- Title(参考訳): PhantomRun: 組み込みオープンソースソフトウェアにおけるコンパイルエラーの自動修正
- Authors: Han Fu, Andreas Ermedahl, Sigrid Eldh, Kristian Wiklund, Philipp Haller, Cyrille Artho,
- Abstract要約: プロジェクトのCI実行から4000以上のビルド障害にまたがる4つの主要なオープンソース組み込みシステムプロジェクトについて調査する。
ハードウェア依存関係がコンパイルエラーの大部分を占めており、その後に構文エラーやビルドスクリプトの問題が発生しています。
PhantomRunは、大規模な言語モデル(LLM)を活用してCIコンパイル障害の修正を生成し、検証する自動化フレームワークである。
- 参考スコア(独自算出の注目度): 2.64399132991614
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Continuous Integration (CI) pipelines for embedded software sometimes fail during compilation, consuming significant developer time for debugging. We study four major open-source embedded system projects, spanning over 4000 build failures from the project's CI runs. We find that hardware dependencies account for the majority of compilation failures, followed by syntax errors and build-script issues. Most repairs need relatively small changes, making automated repair potentially suitable as long as the diverse setups and lack of test data can be handled. In this paper, we present PhantomRun, an automated framework that leverages large language models (LLMs) to generate and validate fixes for CI compilation failures. The framework addresses the challenge of diverse build infrastructures and tool chains across embedded system projects by providing an adaptation layer for GitHub Actions and GitLab CI and four different build systems. PhantomRun utilizes build logs, source code, historical fixes, and compiler error messages to synthesize fixes using LLMs. Our evaluations show that PhantomRun successfully repairs up to 45% of CI compilation failures across the targeted projects, demonstrating the viability of LLM-based repairs for embedded-system CI pipelines.
- Abstract(参考訳): 組み込みソフトウェアのための継続的インテグレーション(CI)パイプラインは、コンパイル中に失敗することがある。
プロジェクトのCI実行から4000以上のビルド障害にまたがる4つの主要なオープンソース組み込みシステムプロジェクトについて調査する。
ハードウェア依存関係がコンパイルエラーの大部分を占めており、その後に構文エラーやビルドスクリプトの問題が発生しています。
ほとんどの修理は比較的小さな変更を必要とするため、多様な設定やテストデータの欠如が扱える限り、自動修理が適している可能性がある。
本稿では,大規模な言語モデル(LLM)を利用してCIコンパイル障害の修正を生成し,検証する自動フレームワークPhantomRunを提案する。
このフレームワークは、GitHub ActionsとGitLab CIの適応レイヤと4つの異なるビルドシステムを提供することで、組み込みシステムプロジェクト全体にわたる多様なビルドインフラストラクチャとツールチェーンの課題に対処する。
PhantomRunはビルドログ、ソースコード、履歴修正、コンパイラエラーメッセージを使用して、LLMを使用して修正を合成する。
私たちの評価では、PhantomRunがターゲットプロジェクト全体のCIコンパイル障害の最大45%を修復し、組み込みCIパイプラインのLLMベースの修復が実現可能であることを実証しています。
関連論文リスト
- Auto-repair without test cases: How LLMs fix compilation errors in large industrial embedded code [2.64399132991614]
大規模言語モデル(LLM)によって駆動されるコンパイルエラーに対して,自動修復手法を採用する。
私たちの調査では、製品のソースコードから4000万件以上のコミットを収集しています。
論文 参考訳(メタデータ) (2025-10-15T14:13:13Z) - SwingArena: Competitive Programming Arena for Long-context GitHub Issue Solving [90.32201622392137]
We present SwingArena, a competitive evaluation framework for Large Language Models (LLMs)。
従来の静的ベンチマークとは異なり、SwingArenaはLLMをイテレーションとして組み合わせて、テストケースを作成し、継続的インテグレーション(CI)パイプラインを通じてパッチを検証するパッチとレビュアーを生成することで、ソフトウェアのコラボレーションプロセスをモデル化する。
論文 参考訳(メタデータ) (2025-05-29T18:28:02Z) - CXXCrafter: An LLM-Based Agent for Automated C/C++ Open Source Software Building [14.687126587793028]
C/C++プロジェクトは、ダウンストリームアプリケーションの進行を妨げるため、実際は難しいことがしばしば証明される。
CXXCrafterと呼ばれる自動ビルドシステムを開発し、依存関係の解決などの課題に対処します。
オープンソースソフトウェアに対する我々の評価は、CXXCrafterがプロジェクト構築において78%の成功率を達成したことを示している。
論文 参考訳(メタデータ) (2025-05-27T11:54:56Z) - Attestable Builds: Compiling Verifiable Binaries on Untrusted Systems using Trusted Execution Environments [2.4650753804485417]
我々は、ソフトウェアアーティファクトに強力なソース対バイナリ対応を提供する新しいパラダイムである、検証可能なビルドを提示する。
我々のシステムは、最新の信頼できる実行環境(TEE)とサンドボックス化されたビルドコンテナを使用して、特定のアーティファクトが特定のソースコードスナップショットから正しく構築されていることを確実に保証します。
論文 参考訳(メタデータ) (2025-05-05T10:00:04Z) - CrashFixer: A crash resolution agent for the Linux kernel [58.152358195983155]
この作業は、システムレベルのLinuxカーネルバグのベンチマークと、Linuxカーネルで実験を実行するプラットフォームを共有するkGymの上に構築されている。
CrashFixerはLinuxカーネルのバグに適応する最初のLCMベースのソフトウェア修復エージェントである。
論文 参考訳(メタデータ) (2025-04-29T04:18:51Z) - In industrial embedded software, are some compilation errors easier to localize and fix than others? [1.627308316856397]
製品ソースコードから4つのプロジェクトから40000以上のビルドを収集し、コンパイルエラーを14のエラータイプに分類しました。
最も一般的な5つは、すべてのコンパイルエラーの99%であることを示す。
私たちの研究は、最も一般的な産業的なコンパイルエラーを修正するのに必要な人的労力に関する洞察も提供しています。
論文 参考訳(メタデータ) (2024-04-23T08:20:18Z) - DebugBench: Evaluating Debugging Capability of Large Language Models [80.73121177868357]
DebugBench - LLM(Large Language Models)のベンチマーク。
C++、Java、Pythonの4つの主要なバグカテゴリと18のマイナータイプをカバーする。
ゼロショットシナリオで2つの商用および4つのオープンソースモデルを評価する。
論文 参考訳(メタデータ) (2024-01-09T15:46:38Z) - The Devil Is in the Command Line: Associating the Compiler Flags With
the Binary and Build Metadata [0.0]
コンパイラフラグの望ましくない組み合わせによる欠陥は、非自明なソフトウェアプロジェクトでは一般的である。
コンパイラがどのようにコンパイルされ、ソフトウェアシステムがリンクされたかの問い合わせ可能なデータベースは、早期に欠陥を検出するのに役立ちます。
論文 参考訳(メタデータ) (2023-12-20T22:27:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。