論文の概要: Meta-Reinforcement Learning for Trajectory Design in Wireless UAV
Networks
- arxiv url: http://arxiv.org/abs/2005.12394v1
- Date: Mon, 25 May 2020 20:43:59 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-29 05:45:49.402598
- Title: Meta-Reinforcement Learning for Trajectory Design in Wireless UAV
Networks
- Title(参考訳): 無線UAVネットワークにおける軌道設計のためのメタ強化学習
- Authors: Ye Hu, Mingzhe Chen, Walid Saad, H. Vincent Poor, and Shuguang Cui
- Abstract要約: ドローン基地局(DBS)は、要求が動的で予測不可能な地上ユーザーへのアップリンク接続を提供するために派遣される。
この場合、DBSの軌道は動的ユーザアクセス要求を満たすように適応的に調整されなければならない。
新たな環境に遭遇したDBSの軌道に適応するために,メタラーニングアルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 151.65541208130995
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, the design of an optimal trajectory for an energy-constrained
drone operating in dynamic network environments is studied. In the considered
model, a drone base station (DBS) is dispatched to provide uplink connectivity
to ground users whose demand is dynamic and unpredictable. In this case, the
DBS's trajectory must be adaptively adjusted to satisfy the dynamic user access
requests. To this end, a meta-learning algorithm is proposed in order to adapt
the DBS's trajectory when it encounters novel environments, by tuning a
reinforcement learning (RL) solution. The meta-learning algorithm provides a
solution that adapts the DBS in novel environments quickly based on limited
former experiences. The meta-tuned RL is shown to yield a faster convergence to
the optimal coverage in unseen environments with a considerably low computation
complexity, compared to the baseline policy gradient algorithm. Simulation
results show that, the proposed meta-learning solution yields a 25% improvement
in the convergence speed, and about 10% improvement in the DBS' communication
performance, compared to a baseline policy gradient algorithm. Meanwhile, the
probability that the DBS serves over 50% of user requests increases about 27%,
compared to the baseline policy gradient algorithm.
- Abstract(参考訳): 本稿では,動的ネットワーク環境で動作するエネルギー制約ドローンの最適軌道の設計について検討する。
考慮されたモデルでは、要求が動的で予測不可能である地上ユーザーにアップリンク接続を提供するために、ドローン基地局(dbs)が派遣される。
この場合、DBSの軌道は動的ユーザアクセス要求を満たすように適応的に調整されなければならない。
この目的のために, 強化学習(RL)ソリューションをチューニングすることにより, 新たな環境に遭遇したDBSの軌道に適応するメタ学習アルゴリズムを提案する。
メタ学習アルゴリズムは、限られた以前の経験に基づいて、新しい環境でDBSを迅速に適応するソリューションを提供する。
メタチューニングされたRLは、基本方針勾配アルゴリズムと比較して計算の複雑さがかなり低い未確認環境において、最適カバレッジにより早く収束することを示した。
シミュレーションの結果,提案したメタ学習ソリューションは,基本方針勾配アルゴリズムと比較して収束速度が25%向上し,DBSの通信性能が約10%向上していることがわかった。
一方、DBSが50%以上のユーザリクエストを処理する確率は、基本方針勾配アルゴリズムと比較して約27%増加する。
関連論文リスト
- A Deep Reinforcement Learning Approach for Adaptive Traffic Routing in
Next-gen Networks [1.1586742546971471]
次世代ネットワークは、トラフィックダイナミクスに基づいたネットワーク構成を自動化し、適応的に調整する必要がある。
交通政策を決定する伝統的な手法は、通常は手作りのプログラミング最適化とアルゴリズムに基づいている。
我々は適応的なトラフィックルーティングのための深層強化学習(DRL)アプローチを開発する。
論文 参考訳(メタデータ) (2024-02-07T01:48:29Z) - Hybrid-Task Meta-Learning: A Graph Neural Network Approach for Scalable and Transferable Bandwidth Allocation [46.342827102556896]
ユーザ数に応じてスケーラブルで,異なる通信シナリオに転送可能な,ディープラーニングベースの帯域割り当てポリシを開発する。
スケーラビリティをサポートするために、帯域割り当てポリシーはグラフニューラルネットワーク(GNN)によって表現される。
我々は,GNNの初期パラメータを異なる通信シナリオで学習するハイブリッドタスクメタ学習アルゴリズムを開発した。
論文 参考訳(メタデータ) (2023-12-23T04:25:12Z) - Adaptive Resource Allocation for Virtualized Base Stations in O-RAN with
Online Learning [60.17407932691429]
基地局(vBS)を備えたオープンラジオアクセスネットワークシステムは、柔軟性の向上、コスト削減、ベンダーの多様性、相互運用性のメリットを提供する。
本研究では,予期せぬ「混み合う」環境下であっても,効率的なスループットとvBSエネルギー消費のバランスをとるオンライン学習アルゴリズムを提案する。
提案手法は, 課題のある環境においても, 平均最適性ギャップをゼロにすることで, サブ線形後悔を実現する。
論文 参考訳(メタデータ) (2023-09-04T17:30:21Z) - Dynamic Channel Access via Meta-Reinforcement Learning [0.8223798883838329]
モデル非依存型メタラーニング(MAML)の手法を取り入れたメタDRLフレームワークを提案する。
同じ分布から引き出された異なるタスクに適応するためには、勾配降下がわずかに必要であることが示される。
論文 参考訳(メタデータ) (2021-12-24T15:04:43Z) - JUMBO: Scalable Multi-task Bayesian Optimization using Offline Data [86.8949732640035]
追加データをクエリすることで制限をサイドステップするMBOアルゴリズムであるJUMBOを提案する。
GP-UCBに類似した条件下では, 応答が得られないことを示す。
実世界の2つの最適化問題に対する既存手法に対する性能改善を実証的に示す。
論文 参考訳(メタデータ) (2021-06-02T05:03:38Z) - Learning to Continuously Optimize Wireless Resource in a Dynamic
Environment: A Bilevel Optimization Perspective [52.497514255040514]
この研究は、データ駆動メソッドが動的環境でリソース割り当て戦略を継続的に学び、最適化することを可能にする新しいアプローチを開発しています。
学習モデルが新たなエピソードに段階的に適応できるように、連続学習の概念を無線システム設計に組み込むことを提案する。
我々の設計は、異なるデータサンプルにまたがる公平性を保証する、新しい二段階最適化定式化に基づいている。
論文 参考訳(メタデータ) (2021-05-03T07:23:39Z) - Distributed Multi-agent Meta Learning for Trajectory Design in Wireless
Drone Networks [151.27147513363502]
本稿では,動的無線ネットワーク環境で動作するエネルギー制約型ドローン群に対する軌道設計の問題点について検討する。
値ベース強化学習(VDRL)ソリューションとメタトレイン機構を提案する。
論文 参考訳(メタデータ) (2020-12-06T01:30:12Z) - Optimization-driven Deep Reinforcement Learning for Robust Beamforming
in IRS-assisted Wireless Communications [54.610318402371185]
Intelligent Reflecting Surface (IRS)は、マルチアンテナアクセスポイント(AP)から受信機へのダウンリンク情報伝達を支援する有望な技術である。
我々は、APのアクティブビームフォーミングとIRSのパッシブビームフォーミングを共同最適化することで、APの送信電力を最小化する。
過去の経験からビームフォーミング戦略に適応できる深層強化学習(DRL)手法を提案する。
論文 参考訳(メタデータ) (2020-05-25T01:42:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。