論文の概要: ORAN-GUIDE: RAG-Driven Prompt Learning for LLM-Augmented Reinforcement Learning in O-RAN Network Slicing
- arxiv url: http://arxiv.org/abs/2506.00576v1
- Date: Sat, 31 May 2025 14:21:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-04 21:47:33.209011
- Title: ORAN-GUIDE: RAG-Driven Prompt Learning for LLM-Augmented Reinforcement Learning in O-RAN Network Slicing
- Title(参考訳): ORAN-GUIDE:O-RANネットワークスライシングにおけるLLM強化学習のためのRAG-Driven Prompt Learning
- Authors: Fatemeh Lotfi, Hossein Rajoli, Fatemeh Afghah,
- Abstract要約: マルチエージェント(MARL)をタスク関連で意味的にリッチな状態表現で拡張するデュアルLLMフレームワークである textitORAN-GUIDE を提案する。
その結果、ORAN-GUIDEは標準MARLおよび単一LLMベースライン上でのサンプル効率、ポリシー収束、性能一般化を改善することが示された。
- 参考スコア(独自算出の注目度): 5.62872273155603
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Advanced wireless networks must support highly dynamic and heterogeneous service demands. Open Radio Access Network (O-RAN) architecture enables this flexibility by adopting modular, disaggregated components, such as the RAN Intelligent Controller (RIC), Centralized Unit (CU), and Distributed Unit (DU), that can support intelligent control via machine learning (ML). While deep reinforcement learning (DRL) is a powerful tool for managing dynamic resource allocation and slicing, it often struggles to process raw, unstructured input like RF features, QoS metrics, and traffic trends. These limitations hinder policy generalization and decision efficiency in partially observable and evolving environments. To address this, we propose \textit{ORAN-GUIDE}, a dual-LLM framework that enhances multi-agent RL (MARL) with task-relevant, semantically enriched state representations. The architecture employs a domain-specific language model, ORANSight, pretrained on O-RAN control and configuration data, to generate structured, context-aware prompts. These prompts are fused with learnable tokens and passed to a frozen GPT-based encoder that outputs high-level semantic representations for DRL agents. This design adopts a retrieval-augmented generation (RAG) style pipeline tailored for technical decision-making in wireless systems. Experimental results show that ORAN-GUIDE improves sample efficiency, policy convergence, and performance generalization over standard MARL and single-LLM baselines.
- Abstract(参考訳): 高度な無線ネットワークは、非常にダイナミックで異質なサービス要求をサポートする必要がある。
Open Radio Access Network(O-RAN)アーキテクチャは、RAN Intelligent Controller(RIC)、Centralized Unit(CU)、Distributed Unit(DU)といった、機械学習(ML)によるインテリジェントな制御をサポートするモジュール化された分離されたコンポーネントを採用することで、この柔軟性を実現する。
深層強化学習(DRL)は動的リソース割り当てとスライシングを管理する強力なツールだが、RF機能やQoSメトリクス、トラフィックトレンドといった生の未構造化インプットを処理するのに苦労することが多い。
これらの制限は、部分的に観察可能で進化する環境における政策の一般化と意思決定効率を妨げる。
そこで本研究では,マルチエージェントRL (MARL) をタスク関連で意味的にリッチな状態表現で拡張する,デュアルLLMフレームワークである \textit{ORAN-GUIDE} を提案する。
このアーキテクチャはドメイン固有の言語モデルであるORANSightを採用しており、O-RAN制御と構成データに基づいて事前訓練を行い、構造化されたコンテキスト認識プロンプトを生成する。
これらのプロンプトは学習可能なトークンで融合され、凍ったGPTベースのエンコーダに渡され、DRLエージェントの高レベルなセマンティック表現を出力する。
この設計では、無線システムにおける技術的意思決定に適した、検索拡張世代(RAG)スタイルのパイプラインを採用する。
実験結果から,ORAN-GUIDEは標準MARLおよび単一LLMベースライン上でのサンプル効率,ポリシ収束,性能一般化を改善することが示された。
関連論文リスト
- Prompt-Tuned LLM-Augmented DRL for Dynamic O-RAN Network Slicing [5.62872273155603]
大規模言語モデル(LLM)は、無秩序なネットワークフィードバックを意味のある潜在表現に構造化する。
O-RANスライシングでは、SNR、パワーレベル、スループットといった概念が意味的に関連している。
学習可能なプロンプトをLLM拡張DRLフレームワークに統合した文脈化に基づく適応手法を提案する。
論文 参考訳(メタデータ) (2025-05-31T14:12:56Z) - MLE-Dojo: Interactive Environments for Empowering LLM Agents in Machine Learning Engineering [57.156093929365255]
自律型大規模言語モデル(LLM)エージェントを体系的に強化し、評価し、改善するためのガイムスタイルのフレームワーク。
MLE-Dojoは、現実的なエンジニアリングシナリオを反映した、多様でオープンなMLEタスクを慎重にキュレートする。
完全に実行可能な環境は、教師付き微調整と強化学習の両方を通して包括的なエージェントトレーニングをサポートする。
論文 参考訳(メタデータ) (2025-05-12T17:35:43Z) - LLM-hRIC: LLM-empowered Hierarchical RAN Intelligent Control for O-RAN [56.94324843095396]
本稿では、無線アクセスネットワーク(O-RAN)におけるRCC間の協調性を改善するため、LLM-hRIC(LLM-hRIC)フレームワークを紹介する。
このフレームワークは,グローバルネットワーク情報を用いたリアルタイムRIC(non-RT RIC)の戦略的ガイダンスを提供する。
RL搭載の近RT RICは実装者として機能し、このガイダンスとローカルリアルタイムデータを組み合わせて近RT決定を行う。
論文 参考訳(メタデータ) (2025-04-25T04:18:23Z) - Glider: Global and Local Instruction-Driven Expert Router [83.785832410832]
モデルMoErging」手法は、保持タスクのパフォーマンスを犠牲にして、未確認タスクへの一般化を優先する。
マルチスケールルーティング機構を統合したGLIDER(Global and Local Instruction Driven Expert Router)を提案する。
GLIDERは、ホールドアウトタスクの強い一般化を維持しながら、ホールドイン性能を大幅に改善する。
論文 参考訳(メタデータ) (2024-10-09T17:59:14Z) - Meta Reinforcement Learning Approach for Adaptive Resource Optimization in O-RAN [6.326120268549892]
Open Radio Access Network (O-RAN) は、前例のない効率性と適応性を持つ現代のネットワークの変動要求に対処する。
本稿では,モデルに依存しないメタラーニング(MAML)にインスパイアされたメタ深層強化学習(Meta-DRL)戦略を提案する。
論文 参考訳(メタデータ) (2024-09-30T23:04:30Z) - R-SFLLM: Jamming Resilient Framework for Split Federated Learning with Large Language Models [83.77114091471822]
Split Federated Learning (SFL)は、分散機械学習(ML)における計算効率のパラダイムである。
SFLの課題は、特に無線チャネル上に展開する場合、送信されたモデルパラメータが相手のジャミングに感受性を持つことである。
これは、言語理解に不可欠である大規模言語モデル(LLM)における単語埋め込みパラメータに対して特に顕著である。
無線ネットワーク上でのLLM(R-SFLLM)を用いたレジリエンスSFLのための物理層フレームワークを開発した。
論文 参考訳(メタデータ) (2024-07-16T12:21:29Z) - Semantic Routing for Enhanced Performance of LLM-Assisted Intent-Based 5G Core Network Management and Orchestration [10.981422497762837]
大規模言語モデル(LLM)は人工知能(AI)アプリケーションで急速に普及している。
本稿では,5Gコアネットワークの意図に基づく管理とオーケストレーションにおける性能向上を目的としたセマンティックルーティングを提案する。
論文 参考訳(メタデータ) (2024-04-24T13:34:20Z) - A Bayesian Framework of Deep Reinforcement Learning for Joint O-RAN/MEC
Orchestration [12.914011030970814]
マルチアクセスエッジコンピューティング(MEC)は、コモディティプラットフォーム上でOpen Radio Access Network(O-RAN)と一緒に実装することで、低コストなデプロイメントを実現する。
本稿では,ベイジアンディープ強化学習(RL)を用いたO-RAN/MEC協調オーケストレーションを提案する。
論文 参考訳(メタデータ) (2023-12-26T18:04:49Z) - Sparsity-Aware Intelligent Massive Random Access Control in Open RAN: A
Reinforcement Learning Based Approach [61.74489383629319]
新たなOpen Radio Access Network(O-RAN)におけるデバイスの大量ランダムアクセスは、アクセス制御と管理に大きな課題をもたらします。
閉ループアクセス制御の強化学習(RL)支援方式を提案する。
深部RL支援SAUDは、連続的かつ高次元の状態と行動空間を持つ複雑な環境を解決するために提案されている。
論文 参考訳(メタデータ) (2023-03-05T12:25:49Z) - Evolutionary Deep Reinforcement Learning for Dynamic Slice Management in
O-RAN [11.464582983164991]
新しいオープン無線アクセスネットワーク(O-RAN)は、フレキシブルな設計、分離された仮想およびプログラマブルなコンポーネント、インテリジェントクローズループ制御などの特徴を区別する。
O-RANスライシングは、状況の変化に直面したネットワーク品質保証(QoS)のための重要な戦略として検討されている。
本稿では,ネットワークスライスを知的に管理できる新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2022-08-30T17:00:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。