論文の概要: Trajectory Guard -- A Lightweight, Sequence-Aware Model for Real-Time Anomaly Detection in Agentic AI
- arxiv url: http://arxiv.org/abs/2601.00516v1
- Date: Fri, 02 Jan 2026 00:27:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-05 15:04:33.489384
- Title: Trajectory Guard -- A Lightweight, Sequence-Aware Model for Real-Time Anomaly Detection in Agentic AI
- Title(参考訳): Trajectory Guard - エージェントAIにおけるリアルタイム異常検出のための軽量シーケンス認識モデル
- Authors: Laksh Advani,
- Abstract要約: トラジェクトリガードはシームズ・リカレント・オートエンコーダであり、コントラスト学習によるタスク・トラジェクトリアライメントと、再構成によるシーケンシャル・アライメントを共同で学習するハイブリッド・ロス機能を備えている。
32ミリ秒のレイテンシで、当社のアプローチは LLM Judge のベースラインよりも17-27倍高速で動作し、実運用環境におけるリアルタイムの安全性検証を可能にします。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Autonomous LLM agents generate multi-step action plans that can fail due to contextual misalignment or structural incoherence. Existing anomaly detection methods are ill-suited for this challenge: mean-pooling embeddings dilutes anomalous steps, while contrastive-only approaches ignore sequential structure. Standard unsupervised methods on pre-trained embeddings achieve F1-scores no higher than 0.69. We introduce Trajectory Guard, a Siamese Recurrent Autoencoder with a hybrid loss function that jointly learns task-trajectory alignment via contrastive learning and sequential validity via reconstruction. This dual objective enables unified detection of both "wrong plan for this task" and "malformed plan structure." On benchmarks spanning synthetic perturbations and real-world failures from security audits (RAS-Eval) and multi-agent systems (Who\&When), we achieve F1-scores of 0.88-0.94 on balanced sets and recall of 0.86-0.92 on imbalanced external benchmarks. At 32 ms inference latency, our approach runs 17-27$\times$ faster than LLM Judge baselines, enabling real-time safety verification in production deployments.
- Abstract(参考訳): 自律的なLLMエージェントは、文脈的ミスアライメントや構造的不整合によって失敗する可能性のある多段階のアクションプランを生成する。
平均プール埋め込みは異常なステップを希釈するが、対照的なアプローチはシーケンシャルな構造を無視する。
事前訓練された埋め込みに関する標準的な教師なしの手法は、F1スコアが0.69以上に達することはない。
そこで我々は,シームズ・リカレント・オートエンコーダであるトラジェクトリ・ガードを導入し,コントラスト学習によるタスク・トラジェクトリ・アライメントと,再構成によるシーケンシャル・アライメントを共同で学習するハイブリッド・ロス関数を導入した。
この二重目的は、"このタスクの間違った計画"と"不正な計画構造"の両方を統一的に検出することを可能にする。
セキュリティ監査 (RAS-Eval) とマルチエージェントシステム (Who\&When) からの合成摂動と実世界の障害を対象とするベンチマークでは、バランスの取れたセットでF1スコアが0.88-0.94、不均衡な外部ベンチマークで0.86-0.92を達成する。
32ミリ秒の推論レイテンシで、当社のアプローチは LLM Judge のベースラインよりも17-27$\times$高速に動作し、実運用環境におけるリアルタイムの安全性検証を可能にします。
関連論文リスト
- On GRPO Collapse in Search-R1: The Lazy Likelihood-Displacement Death Spiral [59.14787085809595]
この障害を引き起こす中核的なメカニズムとしてLazy Likelihood Displacement(LLD)を同定する。
LDDは早期に出現し、自己強化性LDDデススパイラル(LDD Death Spiral)を引き起こす。
本稿では,GRPO のための軽量な確率保存正則化 LLDS を提案する。
論文 参考訳(メタデータ) (2025-12-03T19:41:15Z) - Hierarchical Spatio-Temporal Attention Network with Adaptive Risk-Aware Decision for Forward Collision Warning in Complex Scenarios [7.238050152381639]
本稿では,階層型時空間注意ネットワークと動的リスク閾値調整アルゴリズムを併用した前方衝突警報フレームワークを提案する。
マルチシナリオデータセットでテストされ、完全なシステムは高い有効性を示し、F1スコアは0.912、偽警報率は8.2%、警告リード時間は2.8秒である。
論文 参考訳(メタデータ) (2025-11-25T05:57:29Z) - High-Level Multi-Robot Trajectory Planning And Spurious Behavior Detection [41.75258434978792]
本稿では,LTL(Linear Temporal Logic)公式として指定された計画の急激な実行を特定することの課題について述べる。
我々はNets-within-Nets(NWN)パラダイムに基づく構造化データ生成フレームワークを提案する。
本稿では,トランスフォーマーを用いた異常検出パイプラインを提案する。
論文 参考訳(メタデータ) (2025-10-20T07:47:51Z) - Metacognitive Self-Correction for Multi-Agent System via Prototype-Guided Next-Execution Reconstruction [58.51530390018909]
大規模言語モデルに基づくマルチエージェントシステムは、協調的な問題解決において優れているが、エラーのカスケードには脆弱である。
我々は,MASにリアルタイム,教師なし,ステップレベルの誤り検出と自己補正を付与するメタ認知フレームワークMASCを提案する。
論文 参考訳(メタデータ) (2025-10-16T05:35:37Z) - Building a Foundational Guardrail for General Agentic Systems via Synthetic Data [76.18834864749606]
LLMエージェントは、計画段階で介入するマルチステップタスクを計画できる。
既存のガードレールは主にポスト・エグゼクティブ(英語版)を運用しており、スケーリングが困難であり、計画レベルで制御可能な監督を行う余地がほとんどない。
我々は、良性軌道を合成し、カテゴリーラベル付きリスクを困難に注入し、自動報酬モデルを介して出力をフィルタリングする制御可能なエンジンであるAuraGenを紹介する。
論文 参考訳(メタデータ) (2025-10-10T18:42:32Z) - Alignment Tipping Process: How Self-Evolution Pushes LLM Agents Off the Rails [103.05296856071931]
本稿では,自己進化型大規模言語モデル(LLM)エージェントに特有の,アライメント・ティッピング・プロセス(ATP)を同定する。
ATPは、連続的な相互作用によってエージェントが訓練中に確立されたアライメント制約を放棄し、強化された自己関心の戦略を支持するときに生じる。
実験の結果、アライメントの利点は自己進化の下で急速に低下し、最初は整合性のない状態に収束したモデルであることが判明した。
論文 参考訳(メタデータ) (2025-10-06T14:48:39Z) - Unsupervised Conformal Inference: Bootstrapping and Alignment to Control LLM Uncertainty [49.19257648205146]
生成のための教師なし共形推論フレームワークを提案する。
我々のゲートは、分断されたUPPよりも厳密で安定した閾値を提供する。
その結果は、ラベルのない、API互換の、テスト時間フィルタリングのゲートになる。
論文 参考訳(メタデータ) (2025-09-26T23:40:47Z) - Dual-Mode Deep Anomaly Detection for Medical Manufacturing: Structural Similarity and Feature Distance [2.467339701756281]
本稿では,2つの注意誘導型オートエンコーダアーキテクチャを提案する。
1つ目は、軽量でリアルタイムな欠陥検出を可能にする構造的類似性に基づくスコアリングアプローチである。
第二に、Mahalanobis を用いた特徴距離ベースの戦略を、遅延特性の低減に応用する。
論文 参考訳(メタデータ) (2025-09-06T18:17:40Z) - Anomalous Decision Discovery using Inverse Reinforcement Learning [3.3675535571071746]
異常検出は、知覚システムを通じて異常な行動を特定することによって、自律走行車(AV)において重要な役割を果たす。
現在のアプローチは、しばしば定義済みのしきい値や教師付き学習パラダイムに依存するが、目に見えないシナリオに直面すると効果が低下する。
異常検出のための新しいIRLフレームワークである Trajectory-Reward Guided Adaptive Pre-training (TRAP) を提案する。
論文 参考訳(メタデータ) (2025-07-06T17:01:02Z) - Uncertainty-aware Unsupervised Multi-Object Tracking [33.53331700312752]
教師なしマルチオブジェクトトラッカーは、信頼できる機能埋め込みの学習に劣る。
最近の自己監督技術は採用されているが、時間的関係を捉えられなかった。
本稿では、不確実性問題は避けられないが、不確実性自体を活用して学習された一貫性を向上させることができると論じる。
論文 参考訳(メタデータ) (2023-07-28T09:03:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。