論文の概要: Domain Adaptation of Reinforcement Learning Agents based on Network
Service Proximity
- arxiv url: http://arxiv.org/abs/2303.01013v1
- Date: Thu, 2 Mar 2023 06:57:35 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-03 15:41:31.151346
- Title: Domain Adaptation of Reinforcement Learning Agents based on Network
Service Proximity
- Title(参考訳): ネットワークサービス近接度に基づく強化学習エージェントのドメイン適応
- Authors: Kaushik Dey, Satheesh K. Perepu, Pallab Dasgupta, Abir Das
- Abstract要約: 6Gネットワークの今後の採用により、新しいタイプのサービスが期待されている。
特定のサービスタイプのニーズを管理するために訓練されたRLエージェントは、ドメイン適応なしで異なるサービスタイプを管理するのに理想的ではないかもしれない。
我々は、最も近いサービスのRLエージェントが、ドメイン適応の明確に定義されたプロセスを通じて、新しいサービスタイプに迅速に適応することを示します。
- 参考スコア(独自算出の注目度): 7.701606434020316
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The dynamic and evolutionary nature of service requirements in wireless
networks has motivated the telecom industry to consider intelligent
self-adapting Reinforcement Learning (RL) agents for controlling the growing
portfolio of network services. Infusion of many new types of services is
anticipated with future adoption of 6G networks, and sometimes these services
will be defined by applications that are external to the network. An RL agent
trained for managing the needs of a specific service type may not be ideal for
managing a different service type without domain adaptation. We provide a
simple heuristic for evaluating a measure of proximity between a new service
and existing services, and show that the RL agent of the most proximal service
rapidly adapts to the new service type through a well defined process of domain
adaptation. Our approach enables a trained source policy to adapt to new
situations with changed dynamics without retraining a new policy, thereby
achieving significant computing and cost-effectiveness. Such domain adaptation
techniques may soon provide a foundation for more generalized RL-based service
management under the face of rapidly evolving service types.
- Abstract(参考訳): 無線ネットワークにおけるサービス要求の動的かつ進化的な性質は、ネットワークサービスのポートフォリオの増大を制御するためのインテリジェントな自己適応型強化学習(RL)エージェントを検討するテレコム産業を動機付けている。
多くの新しいタイプのサービスの注入は、将来6Gネットワークが採用されると予想され、時にこれらのサービスは、ネットワーク外部のアプリケーションによって定義される。
特定のサービスタイプのニーズを管理するために訓練されたrlエージェントは、ドメイン適応なしで異なるサービスタイプを管理するのに理想的ではありません。
我々は、新しいサービスと既存のサービス間の近接度を評価するための簡単なヒューリスティックを提供し、最も近いサービスのRLエージェントが、ドメイン適応の明確に定義されたプロセスを通じて、新しいサービスタイプに迅速に適応することを示す。
当社のアプローチでは,学習したソースポリシを,新たなポリシを再トレーニングすることなく,動的に変化する新たな状況に適応させることによって,大幅なコンピューティングとコスト効率の向上を実現します。
このようなドメイン適応技術は、急速に進化するサービスタイプに直面した、より一般化されたRLベースのサービス管理の基礎を提供するかもしれない。
関連論文リスト
- Towards Intelligent Network Management: Leveraging AI for Network
Service Detection [0.0]
本研究では,高度なネットワークトラフィック分類システムを構築するために機械学習手法を活用することに焦点を当てた。
我々は,様々なネットワークサービスタイプをリアルタイムに識別する,新しいデータ駆動型アプローチを提案する。
本システムは,ネットワークサービスを識別する際,顕著な精度を示す。
論文 参考訳(メタデータ) (2023-10-14T16:06:11Z) - Attention-based Open RAN Slice Management using Deep Reinforcement
Learning [6.177038245239758]
本稿では,O-RAN分散化モジュールと分散エージェント協調を利用した,革新的アテンションベースディープRL(ADRL)技術を提案する。
シミュレーションの結果,他のDRLベースライン法と比較してネットワーク性能が大幅に向上した。
論文 参考訳(メタデータ) (2023-06-15T20:37:19Z) - Evolutionary Deep Reinforcement Learning for Dynamic Slice Management in
O-RAN [11.464582983164991]
新しいオープン無線アクセスネットワーク(O-RAN)は、フレキシブルな設計、分離された仮想およびプログラマブルなコンポーネント、インテリジェントクローズループ制御などの特徴を区別する。
O-RANスライシングは、状況の変化に直面したネットワーク品質保証(QoS)のための重要な戦略として検討されている。
本稿では,ネットワークスライスを知的に管理できる新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2022-08-30T17:00:53Z) - Artificial Intelligence Empowered Multiple Access for Ultra Reliable and
Low Latency THz Wireless Networks [76.89730672544216]
テラヘルツ(THz)無線ネットワークは、第5世代(B5G)以上の時代を触媒すると予想されている。
いくつかのB5Gアプリケーションの超信頼性と低レイテンシ要求を満たすためには、新しいモビリティ管理アプローチが必要である。
本稿では、インテリジェントなユーザアソシエーションとリソースアロケーションを実現するとともに、フレキシブルで適応的なモビリティ管理を可能にする、全体論的MAC層アプローチを提案する。
論文 参考訳(メタデータ) (2022-08-17T03:00:24Z) - On-Demand Resource Management for 6G Wireless Networks Using
Knowledge-Assisted Dynamic Neural Networks [13.318287511072354]
本稿では,オーケストレーション決定プロセスにおける計算遅延に着目し,オンデマンド無線リソースオーケストレーション問題について検討する。
動的ニューラルネットワーク(DyNN)に基づく手法を提案し,サービス要求に応じてモデルの複雑性を調整する。
知識を活用することで、DyNNの幅をタイムリーに選択でき、さらにオーケストレーションの性能を向上させることができる。
論文 参考訳(メタデータ) (2022-08-02T23:40:03Z) - A Broad Study of Pre-training for Domain Generalization and Adaptation [69.38359595534807]
ドメイン適応と一般化のための事前学習の幅広い研究と詳細な分析を行う。
我々は、単に最先端のバックボーンを使用することで、既存の最先端のドメイン適応ベースラインより優れていることを観察する。
論文 参考訳(メタデータ) (2022-03-22T15:38:36Z) - Semantic-Aware Collaborative Deep Reinforcement Learning Over Wireless
Cellular Networks [82.02891936174221]
複数のエージェントが無線ネットワーク上で協調できるコラボレーティブディープ強化学習(CDRL)アルゴリズムは有望なアプローチである。
本稿では,リソース制約のある無線セルネットワーク上で,意味的にリンクされたDRLタスクを持つ未学習エージェントのグループを効率的に協調させる,新しい意味認識型CDRL手法を提案する。
論文 参考訳(メタデータ) (2021-11-23T18:24:47Z) - Offline Contextual Bandits for Wireless Network Optimization [107.24086150482843]
本稿では,ユーザ要求の変化に応じて,ネットワーク内の各セルの構成パラメータを自動的に調整するポリシの学習方法について検討する。
私たちのソリューションは、オフライン学習のための既存の方法を組み合わせて、この文脈で生じる重要な課題を克服する原則的な方法でそれらを適応します。
論文 参考訳(メタデータ) (2021-11-11T11:31:20Z) - Reinforcement Learning-based Dynamic Service Placement in Vehicular
Networks [4.010371060637208]
さまざまなタイプのサービスの要求におけるトラフィックモビリティパターンとダイナミックスの複雑さは、サービスの配置を困難なタスクにしました。
トラフィックモビリティやサービスのダイナミクスを考慮していないため、典型的な静的配置ソリューションは効果的ではありません。
本稿では,エッジサーバに最適なサービス配置を見つけるために,強化学習に基づく動的(RL-Dynamic)サービス配置フレームワークを提案する。
論文 参考訳(メタデータ) (2021-05-31T15:01:35Z) - Adaptive Serverless Learning [114.36410688552579]
本研究では,データから学習率を動的に計算できる適応型分散学習手法を提案する。
提案アルゴリズムは, 作業者数に対して線形高速化が可能であることを示す。
通信効率のオーバーヘッドを低減するため,通信効率のよい分散訓練手法を提案する。
論文 参考訳(メタデータ) (2020-08-24T13:23:02Z) - Dynamics Generalization via Information Bottleneck in Deep Reinforcement
Learning [90.93035276307239]
本稿では,RLエージェントのより優れた一般化を実現するために,情報理論正則化目標とアニーリングに基づく最適化手法を提案する。
迷路ナビゲーションからロボットタスクまで、さまざまな領域において、我々のアプローチの極端な一般化の利点を実証する。
この研究は、タスク解決のために冗長な情報を徐々に取り除き、RLの一般化を改善するための原則化された方法を提供する。
論文 参考訳(メタデータ) (2020-08-03T02:24:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。