Fugu-MT 論文翻訳(概要): PhantomRun: Auto Repair of Compilation Errors in Embedded Open Source Software

論文の概要: PhantomRun: Auto Repair of Compilation Errors in Embedded Open Source Software

arxiv url: http://arxiv.org/abs/2602.20284v1
Date: Mon, 23 Feb 2026 19:13:22 GMT
ステータス: 翻訳完了
システム内更新日: 2026-02-25 17:34:53.492759
Title: PhantomRun: Auto Repair of Compilation Errors in Embedded Open Source Software
Title（参考訳）: PhantomRun: 組み込みオープンソースソフトウェアにおけるコンパイルエラーの自動修正
Authors: Han Fu, Andreas Ermedahl, Sigrid Eldh, Kristian Wiklund, Philipp Haller, Cyrille Artho,
Abstract要約: プロジェクトのCI実行から4000以上のビルド障害にまたがる4つの主要なオープンソース組み込みシステムプロジェクトについて調査する。ハードウェア依存関係がコンパイルエラーの大部分を占めており、その後に構文エラーやビルドスクリプトの問題が発生しています。 PhantomRunは、大規模な言語モデル(LLM)を活用してCIコンパイル障害の修正を生成し、検証する自動化フレームワークである。
参考スコア（独自算出の注目度）: 2.64399132991614
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Continuous Integration (CI) pipelines for embedded software sometimes fail during compilation, consuming significant developer time for debugging. We study four major open-source embedded system projects, spanning over 4000 build failures from the project's CI runs. We find that hardware dependencies account for the majority of compilation failures, followed by syntax errors and build-script issues. Most repairs need relatively small changes, making automated repair potentially suitable as long as the diverse setups and lack of test data can be handled. In this paper, we present PhantomRun, an automated framework that leverages large language models (LLMs) to generate and validate fixes for CI compilation failures. The framework addresses the challenge of diverse build infrastructures and tool chains across embedded system projects by providing an adaptation layer for GitHub Actions and GitLab CI and four different build systems. PhantomRun utilizes build logs, source code, historical fixes, and compiler error messages to synthesize fixes using LLMs. Our evaluations show that PhantomRun successfully repairs up to 45% of CI compilation failures across the targeted projects, demonstrating the viability of LLM-based repairs for embedded-system CI pipelines.
Abstract（参考訳）: 組み込みソフトウェアのための継続的インテグレーション(CI)パイプラインは、コンパイル中に失敗することがある。プロジェクトのCI実行から4000以上のビルド障害にまたがる4つの主要なオープンソース組み込みシステムプロジェクトについて調査する。ハードウェア依存関係がコンパイルエラーの大部分を占めており、その後に構文エラーやビルドスクリプトの問題が発生しています。ほとんどの修理は比較的小さな変更を必要とするため、多様な設定やテストデータの欠如が扱える限り、自動修理が適している可能性がある。本稿では,大規模な言語モデル(LLM)を利用してCIコンパイル障害の修正を生成し,検証する自動フレームワークPhantomRunを提案する。このフレームワークは、GitHub ActionsとGitLab CIの適応レイヤと4つの異なるビルドシステムを提供することで、組み込みシステムプロジェクト全体にわたる多様なビルドインフラストラクチャとツールチェーンの課題に対処する。 PhantomRunはビルドログ、ソースコード、履歴修正、コンパイラエラーメッセージを使用して、LLMを使用して修正を合成する。私たちの評価では、PhantomRunがターゲットプロジェクト全体のCIコンパイル障害の最大45%を修復し、組み込みCIパイプラインのLLMベースの修復が実現可能であることを実証しています。

関連論文リスト

Auto-repair without test cases: How LLMs fix compilation errors in large industrial embedded code [2.64399132991614]
大規模言語モデル(LLM)によって駆動されるコンパイルエラーに対して,自動修復手法を採用する。私たちの調査では、製品のソースコードから4000万件以上のコミットを収集しています。
論文参考訳（メタデータ） (2025-10-15T14:13:13Z)
Where LLM Agents Fail and How They can Learn From Failures [62.196870049524364]
大規模言語モデル(LLM)エージェントは、複雑なマルチステップタスクの解決において有望であることを示す。単一ルート原因エラーがその後の決定を通じて伝播する、障害のカスケードに対する脆弱性を増幅する。現在のシステムは、モジュール的で体系的な方法でエージェントエラーを包括的に理解できるフレームワークを欠いている。 AgentErrorTaxonomyは、メモリ、リフレクション、計画、アクション、システムレベルの操作にまたがる障害モードのモジュール分類である。
論文参考訳（メタデータ） (2025-09-29T18:20:27Z)
SwingArena: Competitive Programming Arena for Long-context GitHub Issue Solving [90.32201622392137]
We present SwingArena, a competitive evaluation framework for Large Language Models (LLMs)。従来の静的ベンチマークとは異なり、SwingArenaはLLMをイテレーションとして組み合わせて、テストケースを作成し、継続的インテグレーション(CI)パイプラインを通じてパッチを検証するパッチとレビュアーを生成することで、ソフトウェアのコラボレーションプロセスをモデル化する。
論文参考訳（メタデータ） (2025-05-29T18:28:02Z)
CXXCrafter: An LLM-Based Agent for Automated C/C++ Open Source Software Building [14.687126587793028]
C/C++プロジェクトは、ダウンストリームアプリケーションの進行を妨げるため、実際は難しいことがしばしば証明される。 CXXCrafterと呼ばれる自動ビルドシステムを開発し、依存関係の解決などの課題に対処します。オープンソースソフトウェアに対する我々の評価は、CXXCrafterがプロジェクト構築において78%の成功率を達成したことを示している。
論文参考訳（メタデータ） (2025-05-27T11:54:56Z)
Attestable Builds: Compiling Verifiable Binaries on Untrusted Systems using Trusted Execution Environments [2.4650753804485417]
我々は、ソフトウェアアーティファクトに強力なソース対バイナリ対応を提供する新しいパラダイムである、検証可能なビルドを提示する。我々のシステムは、最新の信頼できる実行環境(TEE)とサンドボックス化されたビルドコンテナを使用して、特定のアーティファクトが特定のソースコードスナップショットから正しく構築されていることを確実に保証します。
論文参考訳（メタデータ） (2025-05-05T10:00:04Z)
CrashFixer: A crash resolution agent for the Linux kernel [58.152358195983155]
この作業は、システムレベルのLinuxカーネルバグのベンチマークと、Linuxカーネルで実験を実行するプラットフォームを共有するkGymの上に構築されている。 CrashFixerはLinuxカーネルのバグに適応する最初のLCMベースのソフトウェア修復エージェントである。
論文参考訳（メタデータ） (2025-04-29T04:18:51Z)
KGym: A Platform and Dataset to Benchmark Large Language Models on Linux Kernel Crash Resolution [59.20933707301566]
大規模言語モデル(LLM)は、ますます現実的なソフトウェア工学(SE)タスクにおいて一貫して改善されている。現実世界のソフトウェアスタックでは、Linuxカーネルのような基本的なシステムソフトウェアの開発にSEの取り組みが費やされています。このような大規模システムレベルのソフトウェアを開発する際にMLモデルが有用かどうかを評価するため、kGymとkBenchを紹介する。
論文参考訳（メタデータ） (2024-07-02T21:44:22Z)
In industrial embedded software, are some compilation errors easier to localize and fix than others? [1.627308316856397]
製品ソースコードから4つのプロジェクトから40000以上のビルドを収集し、コンパイルエラーを14のエラータイプに分類しました。最も一般的な5つは、すべてのコンパイルエラーの99%であることを示す。私たちの研究は、最も一般的な産業的なコンパイルエラーを修正するのに必要な人的労力に関する洞察も提供しています。
論文参考訳（メタデータ） (2024-04-23T08:20:18Z)
DebugBench: Evaluating Debugging Capability of Large Language Models [80.73121177868357]
DebugBench - LLM(Large Language Models)のベンチマーク。 C++、Java、Pythonの4つの主要なバグカテゴリと18のマイナータイプをカバーする。ゼロショットシナリオで2つの商用および4つのオープンソースモデルを評価する。
論文参考訳（メタデータ） (2024-01-09T15:46:38Z)
The Devil Is in the Command Line: Associating the Compiler Flags With the Binary and Build Metadata [0.0]
コンパイラフラグの望ましくない組み合わせによる欠陥は、非自明なソフトウェアプロジェクトでは一般的である。コンパイラがどのようにコンパイルされ、ソフトウェアシステムがリンクされたかの問い合わせ可能なデータベースは、早期に欠陥を検出するのに役立ちます。
論文参考訳（メタデータ） (2023-12-20T22:27:32Z)
Dcc --help: Generating Context-Aware Compiler Error Explanations with Large Language Models [53.04357141450459]
dcc --helpはCS1とCS2のコースにデプロイされ、2565人の学生が10週間で64,000回以上このツールを使っている。 LLMが生成した説明は、コンパイル時間の90%と実行時の75%で概念的に正確であるが、コードに解決策を提供しない命令を無視することが多かった。
論文参考訳（メタデータ） (2023-08-23T02:36:19Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。