論文の概要: TRACE: Trajectory Reasoning through Adaptive Cross-Step Evidence Aggregation for LLM Agents
- arxiv url: http://arxiv.org/abs/2606.07054v1
- Date: Fri, 05 Jun 2026 08:54:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-08 14:33:29.650648
- Title: TRACE: Trajectory Reasoning through Adaptive Cross-Step Evidence Aggregation for LLM Agents
- Title(参考訳): TRACE:LSM剤の適応的クロスステップエビデンスアグリゲーションによる軌道推論
- Authors: Vijitha Mittapalli, Shreyaa Jayant Dani, Satya Srujana Pilli, Snigdha Ansu, Mohammadreza Teymoorianfard, Franck Dernoncourt, Hongjie Chen, Yu Wang, Ryan A. Rossi, Nesreen K. Ahmed,
- Abstract要約: LLMエージェントは、個々の良性行動のシーケンスを通じて、隠れた悪意のある目的を追求することができる。
既存のアプローチでは、1つのパスで完全な軌跡を評価するか、独立して評価されたウィンドウに分割する。
本研究では,長期LLMエージェントトラジェクトリのモニタリングフレームワークであるTRACEを提案する。
- 参考スコア(独自算出の注目度): 62.969415789328025
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Autonomous LLM agents can pursue hidden malicious objectives through sequences of individually benign actions, making sabotage difficult to detect using standard trajectory-level monitoring. Existing approaches either evaluate complete trajectories in a single pass or partition them into independently scored windows, limiting their ability to connect evidence across temporally distant actions. We propose TRACE, a monitoring framework for long-horizon LLM agent trajectories. TRACE operates through a TIJ (Triage-Inspect-Judge) loop that identifies high-signal regions, performs targeted inspection while maintaining accumulated evidence across reasoning steps, and synthesizes a trajectory-level verdict. We evaluate TRACE on ten task domains from SHADE-Arena against state-of-the-art baselines. TRACE achieves an aggregate F1 of 0.713 and recall of 0.844, with the largest gains on tasks requiring long-range evidence linking.
- Abstract(参考訳): 自律的なLSMエージェントは、個々の良性行動のシーケンスを通じて隠れた悪意のある目的を追求することができ、標準軌跡レベルの監視を使用してサボタージュを検出するのが困難になる。
既存のアプローチでは、1つのパスで完全な軌跡を評価するか、独立した窓に分割し、時間的に離れた行動で証拠を繋げる能力を制限する。
本研究では,長期LLMエージェントトラジェクトリのモニタリングフレームワークであるTRACEを提案する。
TRACEは、高信号領域を識別するTIJ(Triage-Inspect-Judge)ループを介して動作し、推論ステップ全体にわたって蓄積された証拠を維持しながらターゲット検査を行い、軌道レベルの判定を合成する。
我々は、SHADE-Arenaから10のタスクドメイン上でTRACEを評価し、最先端のベースラインに対して評価する。
TRACEは0.713の集合F1と0.844のリコールを達成し、長距離エビデンスリンクを必要とするタスクで最大の利益を得ている。
関連論文リスト
- Agent-ToM: Learning to Monitor Autonomous LLM Agents via Theory-of-Mind Reasoning [11.914433611519359]
不正行為を隠蔽する自律型大規模言語モデル(LLM)エージェントの監視は、遅延、コンテキスト依存、長期攻撃パターンのために困難である。
自律エージェントのセキュリティ分析を前提とした学習監視フレームワークである textbfAgent-ToM を提案する。
論文 参考訳(メタデータ) (2026-05-22T20:57:20Z) - Beyond Input Guardrails: Reconstructing Cross-Agent Semantic Flows for Execution-Aware Attack Detection [32.301679396929536]
静的な入力フィルタリングから実行対応分析へ、防御パラダイムをシフトするフレームワークであるSysNameを提案する。
SysNameは断片化された操作プリミティブを連続した行動軌跡に合成し、システムアクティビティの全体像を可能にする。
実証的な評価により、SysNameは10以上の異なる複合攻撃ベクトルを効果的に検出し、それぞれノードレベルとパスレベルのエンドツーエンド攻撃検出に対して85.3%と66.7%のF1スコアを達成した。
論文 参考訳(メタデータ) (2026-03-04T01:59:16Z) - DRAFT: Task Decoupled Latent Reasoning for Agent Safety [59.46137757545185]
DRAFT(Task Decoupled Latent Reasoning for Agent Safety)を提案する。
エクストラクターは、完全な軌跡をコンパクトな連続的な潜伏ドラフトに蒸留し、リゾナーはドラフトと元の軌跡に共同で参加して安全性を予測する。
DRAFTの精度は63.27%(LoRA)から91.18%に向上した。
論文 参考訳(メタデータ) (2026-02-11T07:45:14Z) - TrajAD: Trajectory Anomaly Detection for Trustworthy LLM Agents [47.147717604167376]
効率的なロールバック・アンド・リトライを実現するために必要な軌道異常検出
汎用LSMはこれらの異常を識別し、ローカライズするのに苦労する。
細粒度プロセス監視を訓練した特殊検証器であるTrajADを提案する。
論文 参考訳(メタデータ) (2026-02-06T07:13:49Z) - RE-TRAC: REcursive TRAjectory Compression for Deep Search Agents [144.5598958575922]
Re-TRACはクロス軌道探索を行うエージェントフレームワークである。
Re-TRAC は BrowseComp とフロンティア LLM で連続して ReAct を 15-20% 上回っていることを示す。
論文 参考訳(メタデータ) (2026-02-02T18:58:07Z) - Tracking by Detection and Query: An Efficient End-to-End Framework for Multi-Object Tracking [23.800994163971502]
マルチオブジェクトトラッキング(MOT)は、トラッキング・バイ・検出(TBD)とトラッキング・バイ・クエリ(TBQ)の2つのパラダイムによって支配されている。
本稿では,両パラダイムの長所を効果的に組み合わせたTBDQ-Netを提案する。
提案手法は,MOT調整アソシエータと事前学習した高性能検出器を効率よく統合する。
論文 参考訳(メタデータ) (2024-11-09T14:38:08Z) - MotionTrack: Learning Robust Short-term and Long-term Motions for
Multi-Object Tracking [56.92165669843006]
本研究では,短時間から長期間の軌跡を関連づける統合フレームワークで,堅牢な短期・長期動作を学習するMotionTrackを提案する。
密集した群集に対して,各ターゲットの複雑な動きを推定できる,短時間の軌跡から相互作用認識動作を学習するための新しい対話モジュールを設計する。
極端なオクルージョンのために、ターゲットの履歴軌跡から信頼できる長期動作を学習するための新しいRefind Moduleを構築し、中断された軌跡とそれに対応する検出とを関連付けることができる。
論文 参考訳(メタデータ) (2023-03-18T12:38:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。