論文の概要: TraceView: Interactive Visualization of Agentic Program Repair Trajectories
- arxiv url: http://arxiv.org/abs/2606.22110v1
- Date: Sat, 20 Jun 2026 15:47:15 GMT
- ステータス: 情報取得中
- システム内更新日: 2026-06-24 20:19:33.636014
- Title: TraceView: Interactive Visualization of Agentic Program Repair Trajectories
- Title(参考訳): TraceView: エージェントプログラム修復軌道のインタラクティブな可視化
- Authors: Amirali Sajadi, Tu Nguyen, Kimmie Huynh, Esteban Parra, Preetha Chatterjee,
- Abstract要約: LLMベースの自動プログラム修復(APR)エージェントは、人間の介入を最小限に抑えてソフトウェアバグを修正するパッチを生成する。
最終パッチの結果は、修復の試みが成功したか失敗したかを示しているが、エージェントがその結果にどのように到達したかは示していない。
本稿では,APRシステムからの修復軌道のラベル付けと可視化を行うインタラクティブツールであるTraceViewを提案する。
- 参考スコア(独自算出の注目度): 5.167916226638202
- License:
- Abstract: LLM-based automated program repair (APR) agents generate patches to fix software bugs with minimal human intervention. These agents often produce long trajectories of reasoning, tool use, and feedback to produce candidate patches. Final patch outcomes show whether a repair attempt succeeded or failed, but they do not show how the agent reached that outcome, or where the process became repetitive or misaligned with the task. This makes agentic repair failures difficult to diagnose, reproduce, and prevent. To help developers address these challenges, we present TraceView, an interactive tool for labeling and visualizing repair trajectories from APR systems. TraceView organizes raw and pre-labeled agentic runs with Thought, Action, and Result components to support semantic relation labeling and diagnosis, and renders the resulting trajectory as graph views. Furthermore, TraceView provides relation filters, patch outcome summaries, metrics, and node-level evidence panels to help users inspect how reasoning, actions, and feedback connect across the various steps of an agentic repair attempt. We evaluate TraceView with five researchers through a survey-based user study. Participants reported that TraceView made trajectories easier to scan and that its overview-to-detail workflow helped them better understand repair behavior. The TraceView source code is available at https://github.com/SOAR-Lab/agent-traj-visualization. A screencast of TraceView is available at https://youtu.be/9ZCh7Ifj2AQ.
- Abstract(参考訳): LLMベースの自動プログラム修復(APR)エージェントは、人間の介入を最小限に抑えてソフトウェアバグを修正するパッチを生成する。
これらのエージェントは、しばしば、推論、ツール使用、フィードバックの長い軌跡を生成して、候補パッチを生成する。
最終パッチの結果は、修復の試みが成功したか失敗したかを示しているが、エージェントがその結果にどのように到達したか、プロセスが反復的になったか、タスクと不一致になったかは示していない。
これにより、エージェントによる修復障害の診断、再生、予防が困難になる。
開発者がこれらの課題に対処するために,APRシステムからの修復トラジェクトリのラベル付けと視覚化を行うインタラクティブツールであるTraceViewを紹介した。
TraceViewは、Thought、Action、Resultコンポーネントで生とラベル付けされたエージェント実行を整理し、セマンティックな関係のラベル付けと診断をサポートし、結果の軌跡をグラフビューとして描画する。
さらに、TraceViewは、関係フィルタ、パッチ結果の要約、メトリクス、ノードレベルのエビデンスパネルを提供し、ユーザがエージェント的修復の試みのさまざまなステップ間で、推論、アクション、フィードバックがどのように接続されているかを調べるのに役立つ。
調査に基づくユーザスタディにより,TraceViewを5人の研究者で評価した。
参加者は、TraceViewがトラジェクトリをスキャンしやすくし、その概要と詳細ワークフローが修復の振る舞いをよりよく理解するのに役立つと報告した。
TraceViewのソースコードはhttps://github.com/SOAR-Lab/agent-traj-visualizationで公開されている。
TraceViewのスクリーンキャストはhttps://youtu.be/9ZCh7Ifj2AQ.comで公開されている。
関連論文リスト
- TraceGraph: Shared Decision Landscapes for Diagnosing and Improving Agent Trajectories [61.51984029109709]
グラフベースのフレームワークであるTraceGraphを紹介した。
各タスクに対して、TraceGraphは、モデルIDが導入される前に、プールされたロールアウトから観測可能なアクション・オブザーブレーション状態のグラフを構築する。
次に、結果インフォームされた生産的なコアとトラップリージョンをオーバーレイし、各ロールアウトを3つのイベント – アクセス、トラップ露出、修復 – で要約する。
論文 参考訳(メタデータ) (2026-05-29T13:40:31Z) - CodeTracer: Towards Traceable Agent States [40.51936201889185]
異種実行アーティファクトを解析し,抽出器を進化させるトレースアーキテクチャであるCodeTracerを提案する。
CodeTracerは、永続的なメモリを持つ階層的なトレースツリーとして、完全な状態遷移履歴を再構築する。
障害発生元とその下流チェーンを特定するために、障害オンセットのローカライゼーションを実行する。
論文 参考訳(メタデータ) (2026-04-13T15:52:03Z) - Love Me, Love My Label: Rethinking the Role of Labels in Prompt Retrieval for Visual In-Context Learning [79.61386774847357]
ビジュアル・イン・コンテキスト・ラーニング(VICL)は、視覚基礎モデルを実証的なプロンプトで操作することで複数のタスクを処理できるようにする。
このようなプロンプトの選択はVICLのパフォーマンスに大きく影響し、重要な課題として際立っている。
我々は,ラベル選択におけるラベルの役割を強調するLaPR(Label-aware Prompt Retrieval)というフレームワークを開発した。
論文 参考訳(メタデータ) (2026-04-04T09:18:31Z) - TraceCoder: A Trace-Driven Multi-Agent Framework for Automated Debugging of LLM-Generated Code [11.207330722400764]
人間の観察・分析・修復過程をエミュレートするフレームワークであるTraceCoderを提案する。
このフレームワークはまずコードを診断プローブで測定し、粒度の細かいランタイムトレースをキャプチャする。
その後、これらのトレースについて因果解析を行い、失敗の根本原因を正確に特定する。
論文 参考訳(メタデータ) (2026-02-06T16:59:48Z) - SVRepair: Structured Visual Reasoning for Automated Program Repair [17.545585659174773]
大規模言語モデル(LLM)は、最近、APR(Automated Program repair)の強力な可能性を示している。
構造化された視覚表現を持つマルチモーダルAPRフレームワークである textbfSVRepair を提案する。
SVRepairはまず視覚言語モデルであるtextbfStructured Visual Representation (SVR) を微調整し、不均一な視覚的アーティファクトをアンフェマティックなシーングラフに変換する。
論文 参考訳(メタデータ) (2026-02-05T06:26:46Z) - InspectCoder: Dynamic Analysis-Enabled Self Repair through interactive LLM-Debugger Collaboration [71.18377595277018]
大きな言語モデル(LLM)は、診断が難しい複雑なロジックエラーを伴うバグの多いコードを生成することが多い。
対話型デバッガ制御による動的解析を LLM に委ねる初のエージェントプログラム修復システムである InspectCoder を提案する。
論文 参考訳(メタデータ) (2025-10-21T06:26:29Z) - VDebugger: Harnessing Execution Feedback for Debugging Visual Programs [103.61860743476933]
V Debuggerは、視覚プログラムのローカライズとデバッギングのために、段階的に実行を追跡することで訓練された、批評家とリファインダーのフレームワークである。
Vデバッガは、詳細な実行フィードバックを活用してプログラムエラーを特定し、修正する。
6つのデータセットの評価は、Vデバッガの有効性を示し、ダウンストリームタスクの精度が最大3.2%向上したことを示している。
論文 参考訳(メタデータ) (2024-06-19T11:09:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。