論文の概要: Unsupervised Cycle Detection in Agentic Applications
- arxiv url: http://arxiv.org/abs/2511.10650v1
- Date: Fri, 31 Oct 2025 13:27:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-23 18:31:12.212943
- Title: Unsupervised Cycle Detection in Agentic Applications
- Title(参考訳): エージェント応用における教師なしサイクル検出
- Authors: Felix George, Harshit Kumar, Divya Pathak, Kaustabha Ray, Mudit Verma, Pratibha Moogi,
- Abstract要約: 大規模言語モデルを利用したエージェントアプリケーションは、非決定的な振る舞いを示し、隠れた実行サイクルを形成する。
従来の可観測性プラットフォームは、これらのコストのかかる非効率性を検出することができません。
構造解析と意味解析を組み合わせた教師なしサイクル検出フレームワークを提案する。
- 参考スコア(独自算出の注目度): 7.001329254828447
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Agentic applications powered by Large Language Models exhibit non-deterministic behaviors that can form hidden execution cycles, silently consuming resources without triggering explicit errors. Traditional observability platforms fail to detect these costly inefficiencies. We present an unsupervised cycle detection framework that combines structural and semantic analysis. Our approach first applies computationally efficient temporal call stack analysis to identify explicit loops and then leverages semantic similarity analysis to uncover subtle cycles characterized by redundant content generation. Evaluated on 1575 trajectories from a LangGraph-based stock market application, our hybrid approach achieves an F1 score of 0.72 (precision: 0.62, recall: 0.86), significantly outperforming individual structural (F1: 0.08) and semantic methods (F1: 0.28). While these results are encouraging, there remains substantial scope for improvement, and future work is needed to refine the approach and address its current limitations.
- Abstract(参考訳): 大規模言語モデルを利用したエージェントアプリケーションは、明示的なエラーを引き起こすことなく、隠された実行サイクルを形成し、リソースを静かに消費する非決定的な振る舞いを示す。
従来の可観測性プラットフォームは、これらのコストのかかる非効率性を検出することができません。
構造解析と意味解析を組み合わせた教師なしサイクル検出フレームワークを提案する。
提案手法はまず,計算効率のよい時間的コールスタック解析を用いて明示的なループを同定し,意味的類似性解析を用いて冗長なコンテンツ生成を特徴とする微妙なサイクルを明らかにする。
LangGraphベースの株式市場アプリケーションから1575のトラジェクトリを評価し,F1スコアが0.72(精度:0.62,リコール:0.86)となり,個々の構造(F1:0.08)と意味的手法(F1:0.28)を著しく上回る結果を得た。
これらの結果は奨励されているが、改善のかなりの範囲は残っており、アプローチを洗練し、現在の制限に対処するためには、今後の作業が必要である。
関連論文リスト
- Efficient Thought Space Exploration through Strategic Intervention [54.35208611253168]
本稿では,この知見を2つの相乗的コンポーネントを通して操作するHint-Practice Reasoning(HPR)フレームワークを提案する。
フレームワークの中核となる革新は、動的に介入点を識別する分散不整合低減(DIR)である。
算術的および常識的推論ベンチマークによる実験は、HPRの最先端の効率-精度トレードオフを実証している。
論文 参考訳(メタデータ) (2025-11-13T07:26:01Z) - SAVANT: Semantic Analysis with Vision-Augmented Anomaly deTection [6.806105013817923]
SAVANTは、異常運転シナリオの検出において高精度なリコールを実現する構造化推論フレームワークである。
9,640以上の実世界の画像を高精度にラベル付けすることで、SAVANTは異常検出における重要なデータ不足問題に対処する。
論文 参考訳(メタデータ) (2025-10-20T19:14:29Z) - GRETEL: A Goal-driven Retrieval and Execution-based Trial Framework for LLM Tool Selection Enhancing [6.790345342526922]
GRETELは、サンドボックス化された計画実行評価サイクルを通じてセマンティックに検索された候補を処理するエージェントワークフローを実装している。
ToolBenchベンチマークに関する包括的な評価は、すべてのメトリクスで大幅に改善されていることを示しています。
論文 参考訳(メタデータ) (2025-10-10T00:12:51Z) - GRID: Graph-based Reasoning for Intervention and Discovery in Built Environments [0.31096636737010974]
商業ビルにおける手動のHVAC故障診断には、インシデント毎に8~12時間かかり、診断精度は60%に過ぎません。
本稿では,制約に基づく探索,ニューラル構造方程式モデリング,言語モデルなどを組み合わせた3段階の因果探索パイプラインGRIDについて述べる。
このフレームワークは制約ベースの手法、ニューラルアーキテクチャ、ドメイン固有の言語モデルを統合し、分析を構築する際の観察と因果的なギャップに対処する。
論文 参考訳(メタデータ) (2025-09-19T20:19:48Z) - Time Is a Feature: Exploiting Temporal Dynamics in Diffusion Language Models [57.474294329887236]
拡散大言語モデル (dLLMs) は反復的 denoising を通じてテキストを生成する。
現在のデコード戦略は、最終的な出力に有利なリッチな中間予測を捨てている。
時間的整合性を利用する2つの相補的手法を導入する。
論文 参考訳(メタデータ) (2025-08-12T17:59:57Z) - Anomalous Decision Discovery using Inverse Reinforcement Learning [3.3675535571071746]
異常検出は、知覚システムを通じて異常な行動を特定することによって、自律走行車(AV)において重要な役割を果たす。
現在のアプローチは、しばしば定義済みのしきい値や教師付き学習パラダイムに依存するが、目に見えないシナリオに直面すると効果が低下する。
異常検出のための新しいIRLフレームワークである Trajectory-Reward Guided Adaptive Pre-training (TRAP) を提案する。
論文 参考訳(メタデータ) (2025-07-06T17:01:02Z) - On-device Anomaly Detection in Conveyor Belt Operations [6.402381955787955]
本研究では,正常化と異常化の2つの新手法を提案する。
提案手法は閾値に基づくデューティサイクル検出機構を利用するパターン認識システムである。
この方法は、推論中にエネルギー消費が13.3と20.6のテキストムJの効率的なリアルタイム操作を示す。
論文 参考訳(メタデータ) (2024-11-16T07:46:28Z) - Finding Transformer Circuits with Edge Pruning [71.12127707678961]
自動回路発見の効率的かつスケーラブルなソリューションとしてエッジプルーニングを提案する。
本手法は,従来の手法に比べてエッジ数の半分未満のGPT-2の回路を探索する。
その効率のおかげで、Edge PruningをCodeLlama-13Bにスケールしました。
論文 参考訳(メタデータ) (2024-06-24T16:40:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。