論文の概要: Agentic AI for Bilevel Long-Term Optimization of Policy-Driven Physical Layer Systems
- arxiv url: http://arxiv.org/abs/2606.24416v1
- Date: Tue, 23 Jun 2026 10:53:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-24 22:16:48.904949
- Title: Agentic AI for Bilevel Long-Term Optimization of Policy-Driven Physical Layer Systems
- Title(参考訳): 政策駆動型物理層システムの二段階長期最適化のためのエージェントAI
- Authors: Bingnan Xiao, Chenhao Yang, Wei Ni, Xin Wang, Tony Q. S. Quek,
- Abstract要約: Agentic-Oは、適応的な物理層問題設定に適用可能なネストされた双方向最適化フレームワークである。
Agentic-Oは動的演算子ポリシーに強い適応性を示し、従来の手法と比較してシステムの長期性能を57.2%向上させる。
- 参考スコア(独自算出の注目度): 56.931625543734306
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Network operators' changing policies, service requirements, and stringent real-time constraints render existing methods designed with fixed objectives and constraints ineffective. This paper presents Agentic long-term performance optimization (Agentic-LTPO), a nested bilevel optimization framework that can be applied to adaptive physical layer problem configuration. The key idea is to employ agentic AI to generate upper-level configurations in a bilevel optimization structure, where evolving operator policies, environment summaries, and historical experiences are translated into structured lower-level optimization problem configurations. The lower level solves the problems with updated configurations for real-time physical-layer decisions. Considering cell-free MIMO beamforming as a use case, we embody Agentic-LTPO by designing a new multi-agent decision process with retrieval-augmented experience-based verification in the upper level, together with a closed-form beamformer in the lower level. Experiments demonstrate that Agentic-LTPO exhibits strong adaptability to dynamic operator policies and effectively enhances the system's long-term performance by 57.2% compared to traditional methods.
- Abstract(参考訳): ネットワークオペレータのポリシー変更、サービス要件、厳格なリアルタイム制約は、固定された目的と制約で設計された既存のメソッドを非効率にレンダリングします。
本稿では,Agentic-LTPO(Agentic-LTPO)を提案する。
鍵となる考え方は、エージェントAIを使用して、進化するオペレータポリシー、環境サマリ、過去の経験を構造化された下位レベルの最適化問題構成に変換する、双方向最適化構造で上位設定を生成することである。
低レベルは、リアルタイム物理層決定のための更新された設定の問題を解決する。
セルフリーMIMOビームフォーミングをユースケースとして,我々は,下層におけるクローズドフォームビームフォーマとともに,上層における検索強化経験ベース検証による新しいマルチエージェント決定プロセスを設計し,エージェントLTPOを具現化する。
実験によると、エージェント-LTPOは動的演算子ポリシーに強い適応性を示し、従来の手法と比較してシステムの長期性能を57.2%向上させる。
関連論文リスト
- Democratizing Large-Scale Re-Optimization with LLM-Guided Model Patches [14.24802309734814]
本稿では,大規模言語モデル(LLM)がORエキスパートとして機能するエージェント的再最適化フレームワークを提案する。
提案フレームワークは,デプロイされた最適化モデルの対話的かつ連続的な適応を可能にする。
論文 参考訳(メタデータ) (2026-05-18T17:28:25Z) - Agent-GWO: Collaborative Agents for Dynamic Prompt Optimization in Large Language Models [69.55139736609367]
Agent-GWOは複雑な推論のための動的プロンプト最適化フレームワークである。
本稿では,Agent-GWOが既存のプロンプト最適化手法よりも精度と安定性を一貫して向上することを示す。
論文 参考訳(メタデータ) (2026-04-14T07:35:37Z) - ATLAS : Adaptive Self-Evolutionary Research Agent with Task-Distributed Multi-LLM Supporters [6.13905106667213]
ATLASは、軽量な研究エージェントを反復的に開発するタスク分散フレームワークである。
我々のコアアルゴリズムであるEvolving Direct Preference Optimization (EvoDPO)は、位相インデックス付き参照ポリシーを適応的に更新する。
その結果,ATLASは静的単一エージェントベースラインの安定性と性能を向上させることがわかった。
論文 参考訳(メタデータ) (2026-02-02T19:23:33Z) - Hierarchical Optimization via LLM-Guided Objective Evolution for Mobility-on-Demand Systems [9.979671028876464]
動的階層システムにおいて,大規模言語モデル(LLM)と数学的最適化を統合した新しいフレームワークを提案する。
このフレームワーク内では、LLMはメタ最適化として機能し、制約執行とリアルタイム決定実行に責任を負う低レベルのセマンティクスを生成する。
ニューヨークとシカゴの両方のタクシーデータに基づく実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2025-10-12T14:56:19Z) - Direct Preference Optimization for Primitive-Enabled Hierarchical Reinforcement Learning [75.9729413703531]
DIPPERは階層的な政策学習を二段階最適化問題として定式化する新しいHRLフレームワークである。
DIPPERは、スパース報酬シナリオにおいて、最先端のベースラインよりも最大40%改善されていることを示す。
論文 参考訳(メタデータ) (2024-11-01T04:58:40Z) - A Primal-Dual-Assisted Penalty Approach to Bilevel Optimization with Coupled Constraints [66.61399765513383]
We developed a BLOCC algorithm to tackle BiLevel Optimization problems with Coupled Constraints。
2つのよく知られた実世界のアプリケーションでその効果を実証する。
論文 参考訳(メタデータ) (2024-06-14T15:59:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。