論文の概要: AgentXRay: White-Boxing Agentic Systems via Workflow Reconstruction
- arxiv url: http://arxiv.org/abs/2602.05353v1
- Date: Thu, 05 Feb 2026 06:24:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-06 18:49:08.78535
- Title: AgentXRay: White-Boxing Agentic Systems via Workflow Reconstruction
- Title(参考訳): AgentXRay:ワークフロー再構築によるホワイトボックスエージェントシステム
- Authors: Ruijie Shi, Houbin Zhang, Yuecheng Han, Yuheng Wang, Jingru Fan, Runde Yang, Yufan Dang, Huatao Li, Dewen Liu, Yuan Cheng, Chen Qian,
- Abstract要約: 本稿では,明示的で解釈可能なスタンドインワークフローの合成を目的とした新しいタスクであるエージェント再構成(AWR)を紹介する。
本稿では、AWRを個別のエージェントロールに対する最適化指標として定式化する検索ベースのフレームワークであるAgentXRayを提案する。
我々は,AgentXRayが未処理の検索と比較して高いプロキシ類似性を実現し,トークンの消費を減らすことを実証した。
- 参考スコア(独自算出の注目度): 18.58136299119322
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large Language Models have shown strong capabilities in complex problem solving, yet many agentic systems remain difficult to interpret and control due to opaque internal workflows. While some frameworks offer explicit architectures for collaboration, many deployed agentic systems operate as black boxes to users. We address this by introducing Agentic Workflow Reconstruction (AWR), a new task aiming to synthesize an explicit, interpretable stand-in workflow that approximates a black-box system using only input--output access. We propose AgentXRay, a search-based framework that formulates AWR as a combinatorial optimization problem over discrete agent roles and tool invocations in a chain-structured workflow space. Unlike model distillation, AgentXRay produces editable white-box workflows that match target outputs under an observable, output-based proxy metric, without accessing model parameters. To navigate the vast search space, AgentXRay employs Monte Carlo Tree Search enhanced by a scoring-based Red-Black Pruning mechanism, which dynamically integrates proxy quality with search depth. Experiments across diverse domains demonstrate that AgentXRay achieves higher proxy similarity and reduces token consumption compared to unpruned search, enabling deeper workflow exploration under fixed iteration budgets.
- Abstract(参考訳): 大規模言語モデルは複雑な問題解決において強力な能力を示してきたが、多くのエージェントシステムは不透明な内部ワークフローのために解釈と制御が難しいままである。
いくつかのフレームワークは協調のために明示的なアーキテクチャを提供するが、多くのデプロイされたエージェントシステムはユーザーにブラックボックスとして動作する。
エージェントワークフロー再構築(AWR)は,入力-出力アクセスのみを使用してブラックボックスシステムに近似した,明示的で解釈可能なスタンドインワークフローの合成を目的とした新しいタスクである。
本稿では,AWRを個別のエージェントロールと,チェーン構成のワークフロー空間におけるツール呼び出しに対する組合せ最適化問題として定式化する検索ベースフレームワークであるAgentXRayを提案する。
モデル蒸留とは異なり、AgentXRayは、モデルパラメータにアクセスすることなく、オブザーバブルな出力ベースのプロキシメトリックの下でターゲット出力と一致する編集可能なホワイトボックスワークフローを生成する。
広大な検索空間をナビゲートするために、AgentXRayはモンテカルロツリーサーチを採用し、スコアベースのRed-Black Pruningメカニズムによって強化され、プロキシ品質と検索深度を動的に統合する。
さまざまなドメインでの実験では、AgentXRayは未実行の検索に比べてプロキシの類似性が向上し、トークンの消費が減少し、固定されたイテレーション予算の下でより深いワークフロー探索を可能にすることが示されている。
関連論文リスト
- AgentArk: Distilling Multi-Agent Intelligence into a Single LLM Agent [57.10083973844841]
AgentArkは、マルチエージェントダイナミクスを単一のモデルの重みに蒸留する新しいフレームワークである。
各種モデル,タスク,スケーリング,シナリオの3つの階層的蒸留戦略について検討する。
シミュレーションからトレーニングへ計算の負担をシフトさせることで、蒸留されたモデルは、複数のエージェントの強い推論と自己補正性能を示しながら、一つのエージェントの効率を保ちます。
論文 参考訳(メタデータ) (2026-02-03T19:18:28Z) - ComAgent: Multi-LLM based Agentic AI Empowered Intelligent Wireless Networks [62.031889234230725]
6Gネットワークは複雑な層間最適化に依存している。
数学の定式化に高レベルの意図を手動で翻訳することは、まだボトルネックである。
我々はマルチLLMエージェントAIフレームワークであるComAgentを紹介する。
論文 参考訳(メタデータ) (2026-01-27T13:43:59Z) - Beyond Monolithic Architectures: A Multi-Agent Search and Knowledge Optimization Framework for Agentic Search [56.78490647843876]
エージェント検索は、大規模言語モデル(LLM)が推論とツールの使用をインターリーブできるようにすることによって、複雑な情報を探すための有望なパラダイムとして登場した。
本稿では,bfM-ASKを提案する。bfM-ASK,bfM-ASK,bfM-ASK,bfM-ASK,bfM-ASK,bfM-ASK,bfM-ASK,bfM-ASK。
論文 参考訳(メタデータ) (2026-01-08T08:13:27Z) - BOAD: Discovering Hierarchical Software Engineering Agents via Bandit Optimization [41.08366028094234]
大規模言語モデル(LLM)は、現実世界のソフトウェア工学の問題を一般化するのに苦労する。
既存のシステムはワークフロー全体の問題を処理するために、単一のエージェントに依存することが多い。
人間の技術者が複雑な問題を分解する方法に触発され、我々はSWEエージェントをオーケストラとして構成し、特殊なサブエージェントをコーディネートすることを提案する。
論文 参考訳(メタデータ) (2025-12-29T17:41:11Z) - ArchPilot: A Proxy-Guided Multi-Agent Approach for Machine Learning Engineering [18.83090180326138]
ArchPilotは、アーキテクチャ生成、プロキシベースの評価、適応検索を統一されたフレームワークに統合するマルチエージェントシステムである。
コストのかかるフルトレーニングの実行に最小限依存した、強力な候補を優先し、限られた予算下で効率的なMLエンジニアリングを促進する。
論文 参考訳(メタデータ) (2025-11-06T02:14:59Z) - AgentRouter: A Knowledge-Graph-Guided LLM Router for Collaborative Multi-Agent Question Answering [51.07491603393163]
tAgentは知識グラフ誘導ルーティング問題としてマルチエージェントQAを定式化するフレームワークである。
エージェントアウトプットのソフトな監督と重み付けされた集約を活用することで、エージェントは多様なエージェントの相補的な強みを捉える、原則化された協調スキームを学ぶ。
論文 参考訳(メタデータ) (2025-10-06T23:20:49Z) - InfiAgent: Self-Evolving Pyramid Agent Framework for Infinite Scenarios [28.65914611521654]
InfiAgentはピラミッドのようなDAGベースのMulti-Agent Frameworkで、textbfinfiniteのシナリオに適用できる。
InfiAgentはADAS(類似の自動生成エージェントフレームワーク)と比較して9.9%高いパフォーマンスを実現している
論文 参考訳(メタデータ) (2025-09-26T15:44:09Z) - AgentSwift: Efficient LLM Agent Design via Value-guided Hierarchical Search [58.98450205734779]
大規模言語モデル(LLM)エージェントは、多様なドメインにまたがる強力な機能を示している。
既存のエージェントサーチ手法には3つの大きな制限がある。
これらの課題に対処するための包括的なフレームワークを導入します。
論文 参考訳(メタデータ) (2025-06-06T12:07:23Z) - ComfyBench: Benchmarking LLM-based Agents in ComfyUI for Autonomously Designing Collaborative AI Systems [80.69865295743149]
この研究は、LLMベースのエージェントを使用して、協調AIシステムを自律的に設計する試みである。
ComfyBenchをベースとしたComfyAgentは,エージェントが自律的に協調的なAIシステムを生成して設計できるようにするフレームワークである。
ComfyAgentは、o1-previewに匹敵する解像度を達成し、ComfyBenchの他のエージェントをはるかに上回っているが、ComfyAgentはクリエイティブタスクの15%しか解決していない。
論文 参考訳(メタデータ) (2024-09-02T17:44:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。