論文の概要: Counterfactual-based Agent Influence Ranker for Agentic AI Workflows
- arxiv url: http://arxiv.org/abs/2510.25612v1
- Date: Wed, 29 Oct 2025 15:17:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-30 15:50:45.783978
- Title: Counterfactual-based Agent Influence Ranker for Agentic AI Workflows
- Title(参考訳): エージェントAIワークフローのためのファクトファクトベースのエージェント影響ランクラ
- Authors: Amit Giloni, Chiara Picardi, Roy Betser, Shamik Bose, Aishvariya Priya Rathina Sabapathy, Roman Vainshtein,
- Abstract要約: Agentic AI(AAW)は、複数のLDMベースのエージェントを組み立てて、共通の目標に向かって協調して作業する。
AAWの最終出力に対する各エージェントの影響を評価する方法は存在しない。
本稿では,AAWの出力に対する各エージェントの影響レベルを評価するための最初の方法として,CAIR(Counterfactual-based Agent Influence Ranker)を提案する。
- 参考スコア(独自算出の注目度): 4.971684462894703
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: An Agentic AI Workflow (AAW), also known as an LLM-based multi-agent system, is an autonomous system that assembles several LLM-based agents to work collaboratively towards a shared goal. The high autonomy, widespread adoption, and growing interest in such AAWs highlight the need for a deeper understanding of their operations, from both quality and security aspects. To this day, there are no existing methods to assess the influence of each agent on the AAW's final output. Adopting techniques from related fields is not feasible since existing methods perform only static structural analysis, which is unsuitable for inference time execution. We present Counterfactual-based Agent Influence Ranker (CAIR) - the first method for assessing the influence level of each agent on the AAW's output and determining which agents are the most influential. By performing counterfactual analysis, CAIR provides a task-agnostic analysis that can be used both offline and at inference time. We evaluate CAIR using an AAWs dataset of our creation, containing 30 different use cases with 230 different functionalities. Our evaluation showed that CAIR produces consistent rankings, outperforms baseline methods, and can easily enhance the effectiveness and relevancy of downstream tasks.
- Abstract(参考訳): Agentic AI Workflow(AAW)は、LLMベースのマルチエージェントシステムとしても知られ、複数のLLMベースのエージェントを組み立てて、共通の目標に向けて協調して作業する自律システムである。
高い自律性、広範な採用、そしてそのようなAAWへの関心の高まりは、品質とセキュリティの両面から、彼らの運用をより深く理解する必要があることを強調している。
現在、各エージェントがAAWの最終出力に与える影響を評価する方法が存在しない。
既存のメソッドは静的構造解析のみを実行するため、関連するフィールドからのテクニックの採用は不可能であり、推論時間の実行には適さない。
本稿では,AAWの出力に対する各エージェントの影響レベルを評価し,どのエージェントが最も影響力があるかを決定するための,CAIR(Counterfactual-based Agent Influence Ranker)を提案する。
カウンターファクト分析を行うことで、CAIRはタスクに依存しない分析を提供し、オフラインでも推論時にも使用することができる。
AAWsデータセットを用いてCAIRを評価し、230の異なる機能を持つ30のユースケースを含む。
評価の結果,CAIRは一貫したランキングを生成し,ベースライン法を上回り,下流タスクの有効性と妥当性を容易に向上させることができることがわかった。
関連論文リスト
- Understanding Action Effects through Instrumental Empowerment in Multi-Agent Reinforcement Learning [39.74025439412935]
本研究は,政策分布の分析のみでエージェント行動に対する有意義な洞察を抽出できるかどうかを考察する。
知的エージェントが収束器質的価値を追求する傾向にある現象にインスパイアされた我々は、ICV(Intended Cooperation Values)を導入する。
ICVは、その決定(不確実性)と選好の整合性を評価することで、チームメイトの方針に対するエージェントの作用を測定する。
論文 参考訳(メタデータ) (2025-08-21T15:35:59Z) - Credit Assignment and Efficient Exploration based on Influence Scope in Multi-agent Reinforcement Learning [2.8111817372725785]
スパース・リワードシナリオにおける協調エージェントの訓練は、マルチエージェント強化学習(MARL)に重大な課題をもたらす
本研究では,個々のエージェントの影響を受けうる状態の次元/属性の特定の値を取ることで,エージェントのスコープ(ISA)が状態に与える影響を計算するアルゴリズムを提案する。
エージェントの行動と状態属性の相互依存は、各エージェントの信用割り当てを計算し、各エージェントの探索空間を除くために使用される。
論文 参考訳(メタデータ) (2025-05-13T14:49:26Z) - On the Role of Feedback in Test-Time Scaling of Agentic AI Workflows [71.92083784393418]
エージェントAI(自律的な計画と行動を行うシステム)は広く普及しているが、複雑なタスクにおけるタスクの成功率は低いままである。
推論時のアライメントは、サンプリング、評価、フィードバックの3つのコンポーネントに依存します。
本稿では,様々な形態の批判から抽出されたフィードバックを繰り返し挿入するIterative Agent Decoding(IAD)を紹介する。
論文 参考訳(メタデータ) (2025-04-02T17:40:47Z) - From Novice to Expert: LLM Agent Policy Optimization via Step-wise Reinforcement Learning [62.54484062185869]
本稿では,エージェントの強化学習プロセスの最適化にステップワイド報酬を利用するStepAgentを紹介する。
エージェント反射とポリシー調整を容易にする暗黙の逆・逆の強化学習手法を提案する。
論文 参考訳(メタデータ) (2024-11-06T10:35:11Z) - Learning to Use Tools via Cooperative and Interactive Agents [58.77710337157665]
ツール学習は、外部ツールを使用してユーティリティを拡張するエージェントとして、大きな言語モデル(LLM)を促進する。
ツール選択,ツール実行,アクションキャリブレーションの3つの特別なエージェントを個別にコーディネートする,協調型対話型エージェントフレームワークであるConAgentsを提案する。
3つのデータセットに対する実験により、LLMは、ConAgentsを装備した場合、大幅に改善されたベースラインよりも優れた性能を示した。
論文 参考訳(メタデータ) (2024-03-05T15:08:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。