Fugu-MT 論文翻訳(概要): Adversarial Reasoning for Repair Based on Inferred Program Intent

論文の概要: Adversarial Reasoning for Repair Based on Inferred Program Intent

arxiv url: http://arxiv.org/abs/2505.13008v1
Date: Mon, 19 May 2025 11:51:56 GMT
ステータス: 翻訳完了
システム内更新日: 2025-05-20 14:57:11.569998
Title: Adversarial Reasoning for Repair Based on Inferred Program Intent
Title（参考訳）: 推定プログラムインテントに基づく補修のための逆推論
Authors: He Ye, Aidan Z. H. Yang, Chang Hu, Yanlin Wang, Tao Zhang, Claire Le Goues,
Abstract要約: 本稿では,批判的・敵対的推論に基づくAdverIntent-Agentという手法を提案する。当社のアプローチは、複数のAPRパッチの生成から、複数の潜在的プログラム意図の推測に焦点を移すという斬新なアプローチです。 AdverIntent-AgentはDefects4J 2.0とHumanEval-Javaの2つのベンチマークで評価された。
参考スコア（独自算出の注目度）: 12.923634025700826
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Automated program repair (APR) has shown promising results, particularly with the use of neural networks. Currently, most APR tools focus on code transformations specified by test suites, rather than reasoning about the program intent and the high-level bug specification. Without a proper understanding of program intent, these tools tend to generate patches that overfit incomplete test suites and fail to reflect the developers intentions. However, reasoning about program intent is challenging. In our work, we propose an approach called AdverIntent-Agent, based on critique and adversarial reasoning. Our approach is novel to shift the focus from generating multiple APR patches to inferring multiple potential program intents. Ideally, we aim to infer intents that are, to some extent, adversarial to each other, maximizing the probability that at least one aligns closely with the developers original intent. AdverIntent-Agent is a multi-agent approach consisting of three agents: a reasoning agent, a test agent, and a repair agent. First, the reasoning agent generates adversarial program intents along with the corresponding faulty statements. Next, the test agent produces adversarial test cases that align with each inferred intent, constructing oracles that use the same inputs but have different expected outputs. Finally, the repair agent uses dynamic and precise LLM prompts to generate patches that satisfy both the inferred program intent and the generated tests. AdverIntent-Agent was evaluated on two benchmarks: Defects4J 2.0 and HumanEval-Java. AdverIntent-Agent correctly repaired 77 and 105 bugs in both benchmarks, respectively.
Abstract（参考訳）: 自動プログラム修復(APR)は、特にニューラルネットワークの使用によって、有望な結果を示している。現在、ほとんどのAPRツールは、プログラム意図と高レベルのバグ仕様を推論するのではなく、テストスイートによって指定されたコード変換に焦点を当てている。プログラム意図の適切な理解がなければ、これらのツールは不完全なテストスイートに過度に適合するパッチを生成し、開発者の意図を反映しない傾向にある。しかし、プログラム意図に関する推論は困難である。本研究では,批判的・敵対的推論に基づくAdverIntent-Agentという手法を提案する。当社のアプローチは、複数のAPRパッチの生成から、複数の潜在的プログラム意図の推測に焦点を移すという斬新なアプローチです。理想的には、少なくとも1つが開発者本来の意図と密接に一致する確率を最大化して、ある程度、互いに敵対する意図を推測することを目的としています。 AdverIntent-Agentは、推論エージェント、テストエージェント、修復エージェントの3つのエージェントからなるマルチエージェントアプローチである。まず、推論エージェントは、対応する欠陥文とともに逆プログラム意図を生成する。次に、テストエージェントは、同一の入力を使用するが期待される出力が異なるオラクルを構成する、各推論意図に一致した逆テストケースを生成する。最後に、この修復エージェントは、動的かつ正確なLCMプロンプトを使用して、推論されたプログラム意図と生成されたテストの両方を満たすパッチを生成する。 AdverIntent-AgentはDefects4J 2.0とHumanEval-Javaの2つのベンチマークで評価された。 AdverIntent-Agentは両ベンチマークでそれぞれ77と105のバグを正しく修正した。

関連論文リスト

Do AI models help produce verified bug fixes? [62.985237003585674]
大規模言語モデルは、ソフトウェアバグの修正に使用される。本稿では,プログラマが大規模言語モデルを用いて,自身のスキルを補完する方法について検討する。その結果は、プログラムバグに対する保証された修正を提供するAIとLLMの適切な役割への第一歩となる。
論文参考訳（メタデータ） (2025-07-21T17:30:16Z)
IntenTest: Stress Testing for Intent Integrity in API-Calling LLM Agents [9.46115420774436]
LLMエージェントの意図的整合性違反を明らかにするための,API中心のストレステストフレームワークであるIntenTestを紹介した。 IntenTestはツールキットのドキュメンテーションに基づいて現実的なタスクを生成し、ターゲットの突然変異を適用して微妙なエージェントエラーを露呈する。 IntenTestは、意図的整合性違反を効果的に発見し、エラー検出率とクエリ効率の両方において、ベースラインを著しく上回ります。
論文参考訳（メタデータ） (2025-06-09T08:09:08Z)
AgentXploit: End-to-End Redteaming of Black-Box AI Agents [54.29555239363013]
本稿では,間接的なインジェクション脆弱性を自動的に検出し,悪用するための汎用的なブラックボックスファジィングフレームワークであるAgentXploitを提案する。我々は、AgentXploitをAgentDojoとVWA-advの2つの公開ベンチマークで評価し、o3-miniとGPT-4oに基づくエージェントに対して71%と70%の成功率を達成した。攻撃を現実世界の環境に適用し、悪質なサイトを含む任意のURLに誘導するエージェントをうまく誘導する。
論文参考訳（メタデータ） (2025-05-09T07:40:17Z)
Towards Adaptive Software Agents for Debugging [0.40964539027092917]
本稿では,エージェントの数とその役割を動的に決定する適応型エージェント設計を提案する。最初の評価では、適応設計では、生成されるエージェントの数はバグのあるコードの複雑さに依存することが示されている。治療効果は, ワンショットプロンプトよりも平均11%改善した。
論文参考訳（メタデータ） (2025-04-25T12:48:08Z)
AdvQDet: Detecting Query-Based Adversarial Attacks with Adversarial Contrastive Prompt Tuning [93.77763753231338]
CLIP画像エンコーダを微調整し、2つの中間対向クエリに対して同様の埋め込みを抽出するために、ACPT(Adversarial Contrastive Prompt Tuning)を提案する。我々は,ACPTが7つの最先端クエリベースの攻撃を検出できることを示す。また,ACPTは3種類のアダプティブアタックに対して堅牢であることを示す。
論文参考訳（メタデータ） (2024-08-04T09:53:50Z)
Dissecting Adversarial Robustness of Multimodal LM Agents [70.2077308846307]
我々は、VisualWebArena上に現実的な脅威モデルを用いて、200の敵タスクと評価スクリプトを手動で作成する。我々は,クロボックスフロンティアLMを用いた最新のエージェントを,リフレクションやツリーサーチを行うエージェントを含む,壊すことに成功している。 AREを使用して、新しいコンポーネントの追加に伴うロバスト性の変化を厳格に評価しています。
論文参考訳（メタデータ） (2024-06-18T17:32:48Z)
A Unified Debugging Approach via LLM-Based Multi-Agent Synergy [39.11825182386288]
FixAgentはマルチエージェントのシナジーによる統合デバッグのためのエンドツーエンドフレームワークである。 1.25$times$ 2.56$times$レポレベルのベンチマークであるDefects4Jのバグを修正した。
論文参考訳（メタデータ） (2024-04-26T04:55:35Z)
ContrastRepair: Enhancing Conversation-Based Automated Program Repair via Contrastive Test Case Pairs [23.419180504723546]
ContrastRepairは、対照的なテストペアを提供することで、会話駆動型APRを強化する、新しいAPRアプローチである。 Defects4j、QuixBugs、HumanEval-Javaなど、複数のベンチマークデータセット上でContrastRepairを評価する。
論文参考訳（メタデータ） (2024-03-04T12:15:28Z)
Malicious Agent Detection for Robust Multi-Agent Collaborative Perception [52.261231738242266]
多エージェント協調(MAC)知覚は、単エージェント認識よりも敵攻撃に対して脆弱である。 MAC知覚に特異的な反応防御であるMADE(Malicious Agent Detection)を提案する。我々は、ベンチマーク3DデータセットV2X-simとリアルタイムデータセットDAIR-V2Xで包括的な評価を行う。
論文参考訳（メタデータ） (2023-10-18T11:36:42Z)
Invalidator: Automated Patch Correctness Assessment via Semantic and Syntactic Reasoning [6.269370220586248]
本稿では,意味論的および統語論的推論により,APR生成パッチの正当性を自動的に評価する手法を提案する。我々は、Defects4Jの現実世界のプログラムで生成された885パッチのデータセットについて実験を行った。実験の結果,INVALIDATORは79%のオーバーフィッティングパッチを正しく分類し,最高のベースラインで検出されたパッチを23%上回った。
論文参考訳（メタデータ） (2023-01-03T14:16:32Z)
Fault-Aware Neural Code Rankers [64.41888054066861]
サンプルプログラムの正しさを予測できる故障認識型ニューラルネットワークローダを提案する。我々のフォールト・アウェア・ローダは、様々なコード生成モデルのpass@1精度を大幅に向上させることができる。
論文参考訳（メタデータ） (2022-06-04T22:01:05Z)
Efficient Intent Detection with Dual Sentence Encoders [53.16532285820849]
本稿では,USE や ConveRT などの事前訓練された二重文エンコーダによるインテント検出手法を提案する。提案するインテント検出器の有用性と適用性を示し,完全なBERT-Largeモデルに基づくインテント検出器よりも優れた性能を示す。コードだけでなく、新しい挑戦的な単一ドメイン意図検出データセットもリリースしています。
論文参考訳（メタデータ） (2020-03-10T15:33:54Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。