論文の概要: FailureMem: A Failure-Aware Multimodal Framework for Autonomous Software Repair
- arxiv url: http://arxiv.org/abs/2603.17826v1
- Date: Wed, 18 Mar 2026 15:24:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-19 18:32:57.782305
- Title: FailureMem: A Failure-Aware Multimodal Framework for Autonomous Software Repair
- Title(参考訳): FailureMem: 自動ソフトウェア修復のための障害対応マルチモーダルフレームワーク
- Authors: Ruize Ma, Yilei Jiang, Shilin Zhang, Zheng Ma, Yi Feng, Vincent Ng, Zhi Wang, Xiangyu Yue, Chuanyi Li, Lewei Lu,
- Abstract要約: MAPR(Multimodal Automated Program repair)は、ソースコード、テキストのイシュー記述、GUIスクリーンショットなどのビジュアルアーティファクトを共同で推論することを要求することで、従来のプログラム修復を拡張している。
我々は,3つの主要なメカニズムを統合したマルチモーダル修復フレームワークであるFailureMemを提案する。これは,構造的ローカライゼーションとフレキシブルな推論とをバランスさせるハイブリッドワークフローエージェントアーキテクチャ,領域レベルの視覚的接地を可能にするアクティブな認識ツール,過去の修復の試みを再利用可能なガイダンスに変換するFailure Memory Bankである。
- 参考スコア(独自算出の注目度): 45.42550492783294
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multimodal Automated Program Repair (MAPR) extends traditional program repair by requiring models to jointly reason over source code, textual issue descriptions, and visual artifacts such as GUI screenshots. While recent LLM-based repair systems have shown promising results, existing approaches face several limitations: rigid workflow pipelines restrict exploration during debugging, visual reasoning is often performed over full-page screenshots without localized grounding, and failed repair attempts are rarely transformed into reusable knowledge. To address these challenges, we propose FailureMem, a multimodal repair framework that integrates three key mechanisms: a hybrid workflow-agent architecture that balances structured localization with flexible reasoning, active perception tools that enable region-level visual grounding, and a Failure Memory Bank that converts past repair attempts into reusable guidance. Experiments on SWE-bench Multimodal demonstrate FailureMem improves the resolved rate over GUIRepair by 3.7%.
- Abstract(参考訳): MAPR(Multimodal Automated Program repair)は、ソースコード、テキストのイシュー記述、GUIスクリーンショットなどのビジュアルアーティファクトを共同で推論することを要求することで、従来のプログラム修復を拡張している。
最近のLLMベースの修復システムは有望な結果を示しているが、既存のアプローチにはいくつかの制限がある。 厳密なワークフローパイプラインはデバッグ中の探索を制限する。
これらの課題に対処するため,我々は,構造化ローカライゼーションとフレキシブル推論とのバランスをとるハイブリッドワークフローエージェントアーキテクチャ,領域レベルの視覚的接地を可能にするアクティブな認識ツール,過去の修復の試みを再利用可能なガイダンスに変換するフェールメモリバンクという,3つの主要なメカニズムを統合したマルチモーダル修復フレームワークであるFailureMemを提案する。
SWE-bench Multimodalの実験では、FailureMemはGUIRepairの解決率を3.7%改善した。
関連論文リスト
- Architecture-Aware Multi-Design Generation for Repository-Level Feature Addition [53.50448142467294]
RAIMは、リポジトリレベルの機能追加のための、多設計およびアーキテクチャ対応のフレームワークである。
複数の多様な実装設計を生成することで、線形パッチから切り離される。
NoCode-bench Verifiedデータセットの実験では、RAIMが新しい最先端のパフォーマンスを確立することが示されている。
論文 参考訳(メタデータ) (2026-03-02T12:50:40Z) - SVRepair: Structured Visual Reasoning for Automated Program Repair [17.545585659174773]
大規模言語モデル(LLM)は、最近、APR(Automated Program repair)の強力な可能性を示している。
構造化された視覚表現を持つマルチモーダルAPRフレームワークである textbfSVRepair を提案する。
SVRepairはまず視覚言語モデルであるtextbfStructured Visual Representation (SVR) を微調整し、不均一な視覚的アーティファクトをアンフェマティックなシーングラフに変換する。
論文 参考訳(メタデータ) (2026-02-05T06:26:46Z) - ScratchEval : A Multimodal Evaluation Framework for LLMs in Block-Based Programming [3.935975887408409]
スクラッチプログラムは、深くネストした非線形構造、イベント駆動のスプライト、およびコードとマルチメディアアセット間の密結合を示す。
ScratchEvalは、ScratchプログラムのLLMベースの修復を評価するために設計された最初の実行可能ベンチマークである。
このベンチマークは、自動プロジェクトマイニングとトリガーアウトカムセマンティクスのエキスパートバリデーションを組み合わせた、ヒューマン・イン・ザ・ループパイプラインを通じて構築されている。
論文 参考訳(メタデータ) (2026-01-31T14:44:22Z) - Iterative Structured Pruning for Large Language Models with Multi-Domain Calibration [73.40887151631088]
大規模言語モデル(LLM)は、自然言語処理タスクの幅広い範囲で顕著な成功を収めている。
その拡大を続けるスケールは、かなりの計算オーバーヘッド、メモリフットプリント、推論レイテンシなど、現実世界のデプロイメントに重大な障壁をもたらす。
本研究では,アーキテクチャコンポーネント全体を排除し,標準ハードウェアアクセラレーションとの互換性を維持する構造的プルーニングについて検討する。
論文 参考訳(メタデータ) (2026-01-06T03:09:31Z) - VULCAN: Tool-Augmented Multi Agents for Iterative 3D Object Arrangement [66.13644883379087]
MLLMを用いた3次元オブジェクト配置における3つの課題に対処する。
まず、MLLMの弱い視覚的基盤に対処するために、MPPベースのAPIを導入する。
第2に、MLLMの3Dシーン理解を、特殊な視覚ツール群で強化する。
第3に,反復的かつエラーを起こしやすい更新を管理するために,協調的なマルチエージェントフレームワークを提案する。
論文 参考訳(メタデータ) (2025-12-26T19:22:39Z) - DoVer: Intervention-Driven Auto Debugging for LLM Multi-Agent Systems [48.971606069204825]
DoVerは、大規模言語モデル(LLM)ベースのマルチエージェントシステムのための介入駆動デバッグフレームワークである。
ターゲットの介入を通じて、アクティブな検証によって仮説生成を増強する。
DoVerは失敗試験の18~28%を成功させ、最大16%のマイルストーンを達成し、失敗仮説の30~60%を検証または否定する。
論文 参考訳(メタデータ) (2025-12-07T09:23:48Z) - Semantics-Aligned, Curriculum-Driven, and Reasoning-Enhanced Vulnerability Repair Framework [15.17681731375364]
SeCuRepairは、セマンティクスに準拠し、カリキュラム駆動で、脆弱性修復のための推論強化フレームワークである。
コアとなるSeCuRepairは、理由と脆弱性の修正方法をモデルに明記する必要がある、合理的に編集されたパラダイムを採用している。
SeCuRepairはまた、従来の教師付き微調整を超えて、セマンティックス対応の強化学習を採用している。
論文 参考訳(メタデータ) (2025-10-01T15:09:27Z) - Seeing is Fixing: Cross-Modal Reasoning with Multimodal LLMs for Visual Software Issue Fixing [41.75392938686494]
大規模言語モデル-(LLM)ベースの自動プログラム修正(APR)技術は、現実のGitHubの課題を解決する上で有望な結果を示している。
これらの自律システムは、視覚情報の解釈と活用の制限により、マルチモーダルな問題のシナリオを解決するのに苦労する。
GUIRepairは,視覚情報を理解し,取得することで,多モーダルな問題シナリオを解決するための多モーダルな推論手法である。
論文 参考訳(メタデータ) (2025-06-19T08:42:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。