論文の概要: WirelessAgent++: Automated Agentic Workflow Design and Benchmarking for Wireless Networks
- arxiv url: http://arxiv.org/abs/2603.00501v1
- Date: Sat, 28 Feb 2026 06:52:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-03 19:50:56.230098
- Title: WirelessAgent++: Automated Agentic Workflow Design and Benchmarking for Wireless Networks
- Title(参考訳): WirelessAgent++: 無線ネットワークのためのエージェントワークフロー設計とベンチマークを自動化する
- Authors: Jingwen Tong, Zijian Li, Fang Liu, Wei Guo, Jun Zhang,
- Abstract要約: 各種無線タスクのためのエージェントアルゴリズム設計を自動化するフレームワークである WirelessAgent++ を提案する。
各ワークフローをモジュラー演算子で構成される実行可能なコードとして扱うことで、WirelessAgent++はプログラム検索問題としてエージェント設計をキャストする。
我々は、Wapが自律的に優れた結果を発見し、テストスコアが78.37%$ (WCHW)、90.95%$ (WCNS)、97.07%$ (WCMSA)、総検索コストが5ドル以下であることを示した。
- 参考スコア(独自算出の注目度): 14.835558349382604
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The integration of large language models (LLMs) into wireless networks has sparked growing interest in building autonomous AI agents for wireless tasks. However, existing approaches rely heavily on manually crafted prompts and static agentic workflows, a process that is labor-intensive, unscalable, and often suboptimal. In this paper, we propose WirelessAgent++, a framework that automates the design of agentic workflows for various wireless tasks. By treating each workflow as an executable code composed of modular operators, WirelessAgent++ casts agent design as a program search problem and solves it with a domain-adapted Monte Carlo Tree Search (MCTS) algorithm. Moreover, we establish WirelessBench, a standardized multi-dimensional benchmark suite comprising Wireless Communication Homework (WCHW), Network Slicing (WCNS), and Mobile Service Assurance (WCMSA), covering knowledge reasoning, code-augmented tool use, and multi-step decision-making. Experiments demonstrate that \wap{} autonomously discovers superior workflows, achieving test scores of $78.37\%$ (WCHW), $90.95\%$ (WCNS), and $97.07\%$ (WCMSA), with a total search cost below $\$ 5$ per task. Notably, our approach outperforms state-of-the-art prompting baselines by up to $31\%$ and general-purpose workflow optimizers by $11.1\%$, validating its effectiveness in generating robust, self-evolving wireless agents. The code is available at https://github.com/jwentong/WirelessAgent-R2.
- Abstract(参考訳): 大規模言語モデル(LLM)を無線ネットワークに統合することで、無線タスクのための自律型AIエージェント構築への関心が高まっている。
しかし、既存のアプローチは手作業によるプロンプトや静的エージェントワークフローに大きく依存している。
本稿では,各種無線タスクのためのエージェントワークフロー設計を自動化するフレームワークである WirelessAgent++ を提案する。
WirelessAgent++は,各ワークフローをモジュール演算子で構成される実行可能なコードとして扱うことで,エージェント設計をプログラム探索問題として扱い,ドメイン適応型のモンテカルロ木探索(MCTS)アルゴリズムで解決する。
さらに,Wireth Communication Homework (WCHW), Network Slicing (WCNS), Mobile Service Assurance (WCMSA) で構成される標準化された多次元ベンチマークスイートである WirelessBench を構築し,知識推論,コード拡張ツールの使用,多段階意思決定について検討した。
実験では、‘wap{} は優れたワークフローを自律的に発見し、テストスコアが 78.37 %$ (WCHW)、90.95 %$ (WCNS)、979.07 %$ (WCMSA) となる。
特に、我々のアプローチは、最先端のプロンプトベースラインを最大311\%、汎用ワークフローオプティマイザを111.1\%で上回り、堅牢で自己進化する無線エージェントを生成する効果を検証する。
コードはhttps://github.com/jwentong/WirelessAgent-R2で公開されている。
関連論文リスト
- SWE-Bench Mobile: Can Large Language Model Agents Develop Industry-Level Mobile Applications? [21.241252187534055]
SWE-Bench Mobileは、実運用iOSから派生した現実的なソフトウェアエンジニアリングタスクのコーディングエージェントを評価するためのベンチマークである。
孤立した問題やバグ修正に焦点を当てた既存のベンチマークとは異なり、SWE-Bench Mobileは産業開発における完全な複雑さを捉えている。
論文 参考訳(メタデータ) (2026-02-10T08:51:11Z) - ComAgent: Multi-LLM based Agentic AI Empowered Intelligent Wireless Networks [62.031889234230725]
6Gネットワークは複雑な層間最適化に依存している。
数学の定式化に高レベルの意図を手動で翻訳することは、まだボトルネックである。
我々はマルチLLMエージェントAIフレームワークであるComAgentを紹介する。
論文 参考訳(メタデータ) (2026-01-27T13:43:59Z) - Toward Super Agent System with Hybrid AI Routers [19.22599167969104]
スーパーエージェントは、要約、コーディング、研究など、多様なユーザニーズを満たすことができる。
本稿では,ハイブリッドAIルータを用いたスーパーエージェントシステムの設計について述べる。
マルチモダリティモデルとエッジハードウェアの進歩により、ほとんどの計算はローカルで処理でき、クラウドのコラボレーションは必要なだけである、と私たちは考えています。
論文 参考訳(メタデータ) (2025-04-11T00:54:56Z) - SCoTT: Strategic Chain-of-Thought Tasking for Wireless-Aware Robot Navigation in Digital Twins [78.53885607559958]
無線対応経路計画フレームワークであるSCoTTを提案する。
SCoTT は DP-WA* の2% 以内で経路ゲインを達成し, 連続的に短い軌道を生成できることを示す。
また,ガゼボシミュレーションにおいて,SCoTTをROSノードとして配置することにより,本手法の実用性を示す。
論文 参考訳(メタデータ) (2024-11-27T10:45:49Z) - WirelessAgent: Large Language Model Agents for Intelligent Wireless Networks [16.722524706176767]
無線ネットワークは、規模と複雑さの増大により、ますます課題に直面している。
これらの課題は、特に今後の6Gネットワークにおいて、高度なAI駆動戦略の必要性を浮き彫りにしている。
我々は、無線ネットワークにおける複雑なタスクを管理できるAIエージェントを開発するための新しいアプローチであるWirelessAgentを紹介する。
論文 参考訳(メタデータ) (2024-09-12T11:48:01Z) - Agent Workflow Memory [71.81385627556398]
本稿では、一般的に再利用されるルーチンを誘導するAgent Memoryを紹介する。
AWMはベースラインの結果を24.6%、相対的な成功率51.1%で大幅に改善する。
オンラインAWMは、クロスタスク、ウェブサイト、ドメイン評価を強力に一般化する。
論文 参考訳(メタデータ) (2024-09-11T17:21:00Z) - ComfyBench: Benchmarking LLM-based Agents in ComfyUI for Autonomously Designing Collaborative AI Systems [80.69865295743149]
この研究は、LLMベースのエージェントを使用して、協調AIシステムを自律的に設計する試みである。
ComfyBenchをベースとしたComfyAgentは,エージェントが自律的に協調的なAIシステムを生成して設計できるようにするフレームワークである。
ComfyAgentは、o1-previewに匹敵する解像度を達成し、ComfyBenchの他のエージェントをはるかに上回っているが、ComfyAgentはクリエイティブタスクの15%しか解決していない。
論文 参考訳(メタデータ) (2024-09-02T17:44:10Z) - Spider2-V: How Far Are Multimodal Agents From Automating Data Science and Engineering Workflows? [73.81908518992161]
我々は、プロのデータサイエンスとエンジニアリングに焦点を当てた最初のマルチモーダルエージェントベンチマークであるSpider2-Vを紹介する。
Spider2-Vは、本物のコンピュータ環境における現実世界のタスクを特徴とし、20のエンタープライズレベルのプロフェッショナルアプリケーションを組み込んでいる。
これらのタスクは、エンタープライズデータソフトウェアシステムにおいて、コードを書き、GUIを管理することで、マルチモーダルエージェントがデータ関連のタスクを実行する能力を評価する。
論文 参考訳(メタデータ) (2024-07-15T17:54:37Z) - A Dynamic LLM-Powered Agent Network for Task-Oriented Agent Collaboration [55.35849138235116]
本稿では,様々なタスクやドメインに対する動的コミュニケーション構造において,候補からエージェントのチームを自動的に選択する手法を提案する。
具体的には, LLMを利用したエージェント協調のための動的LLMパワーエージェントネットワーク(textDyLAN$)というフレームワークを構築した。
我々は、コード生成、意思決定、一般的な推論、算術的推論タスクにおいて、適度な計算コストで、DyLANが強力なベースラインを上回ることを実証する。
論文 参考訳(メタデータ) (2023-10-03T16:05:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。