論文の概要: Path Design and Resource Management for NOMA enhanced Indoor Intelligent
Robots
- arxiv url: http://arxiv.org/abs/2011.11745v2
- Date: Thu, 26 Nov 2020 23:25:46 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-22 03:15:03.140554
- Title: Path Design and Resource Management for NOMA enhanced Indoor Intelligent
Robots
- Title(参考訳): NOMA強化屋内知能ロボットの経路設計と資源管理
- Authors: Ruikang Zhong, Xiao Liu, Yuanwei Liu, Yue Chen and Xianbin Wang
- Abstract要約: 通信可能な屋内知的ロボット(IR)サービスフレームワークを提案する。
室内レイアウトとチャネル状態を決定論的に記述できるレゴモデリング手法が提案されている。
調査対象の無線マップは、強化学習エージェントを訓練するための仮想環境として呼び出される。
- 参考スコア(独自算出の注目度): 58.980293789967575
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A communication enabled indoor intelligent robots (IRs) service framework is
proposed, where non-orthogonal multiple access (NOMA) technique is adopted to
enable highly reliable communications. In cooperation with the ultramodern
indoor channel model recently proposed by the International Telecommunication
Union (ITU), the Lego modeling method is proposed, which can deterministically
describe the indoor layout and channel state in order to construct the radio
map. The investigated radio map is invoked as a virtual environment to train
the reinforcement learning agent, which can save training time and hardware
costs. Build on the proposed communication model, motions of IRs who need to
reach designated mission destinations and their corresponding down-link power
allocation policy are jointly optimized to maximize the mission efficiency and
communication reliability of IRs. In an effort to solve this optimization
problem, a novel reinforcement learning approach named deep transfer
deterministic policy gradient (DT-DPG) algorithm is proposed. Our simulation
results demonstrate that 1) With the aid of NOMA techniques, the communication
reliability of IRs is effectively improved; 2) The radio map is qualified to be
a virtual training environment, and its statistical channel state information
improves training efficiency by about 30%; 3) The proposed DT-DPG algorithm is
superior to the conventional deep deterministic policy gradient (DDPG)
algorithm in terms of optimization performance, training time, and anti-local
optimum ability.
- Abstract(参考訳): 通信可能な屋内知的ロボット(IR)サービスフレームワークを提案し,非直交多重アクセス(NOMA)技術を採用し,信頼性の高い通信を実現する。
国際電気通信連合(ITU)が最近提案した超近代屋内チャネルモデルと協調して,無線地図を構築するために室内レイアウトとチャネル状態を決定論的に記述できるレゴモデリング手法を提案する。
調査対象の無線マップは,トレーニング時間とハードウェアコストを節約できる強化学習エージェントを訓練するための仮想環境として起動される。
提案した通信モデルに基づいて、指定されたミッション目的地に到達するために必要なIRの動きと対応するダウンリンク電力配分ポリシーを共同最適化し、IRのミッション効率と通信信頼性を最大化する。
この最適化問題を解決するために,Deep Transfer Deterministic Policy gradient (DT-DPG)アルゴリズムという新しい強化学習手法を提案する。
我々のシミュレーション結果は
1)NOMA技術により、IRの通信信頼性が効果的に向上する。
2) 無線地図は仮想学習環境に適しており、その統計チャネル状態情報はトレーニング効率を約30%向上させる。
3)提案したDT-DPGアルゴリズムは,最適化性能,トレーニング時間,非局所最適化能力の観点から,従来のDeep Deterministic Policy gradient (DDPG)アルゴリズムよりも優れている。
関連論文リスト
- Enhancing Spectrum Efficiency in 6G Satellite Networks: A GAIL-Powered Policy Learning via Asynchronous Federated Inverse Reinforcement Learning [67.95280175998792]
ビームフォーミング,スペクトルアロケーション,リモートユーザ機器(RUE)アソシエイトを最適化するために,GAILを利用した新しいポリシー学習手法を提案する。
手動チューニングなしで報酬関数を自動的に学習するために、逆RL(IRL)を用いる。
提案手法は従来のRL手法よりも優れており,コンバージェンスと報酬値の14.6%の改善が達成されている。
論文 参考訳(メタデータ) (2024-09-27T13:05:02Z) - Reconfigurable Intelligent Surface Aided Vehicular Edge Computing: Joint Phase-shift Optimization and Multi-User Power Allocation [28.47670676456068]
本稿では、車載通信を支援するための代替通信経路を提供するRIS(Reconfigurable Intelligent Surfaces)について紹介する。
本稿では、RIS位相シフト係数を最適化するDeep Deterministic Policy Gradient(DDPG)アルゴリズムと、車両ユーザ(VU)の電力配分を最適化するMulti-Agent Deep Deterministic Policy Gradient(MADDPG)アルゴリズムを組み合わせたDRLフレームワークを提案する。
シミュレーションの結果,提案手法は従来の集中型DDPG, Twin Delayed Deep Deterministic Policy Gradient (TD3) およびいくつかの典型的なスキームよりも優れていた。
論文 参考訳(メタデータ) (2024-07-18T03:18:59Z) - Emergency Computing: An Adaptive Collaborative Inference Method Based on
Hierarchical Reinforcement Learning [14.929735103723573]
センシング,通信,計算,キャッシュ,インテリジェンスを備えた緊急ネットワーク(E-SC3I)を提案する。
このフレームワークには、緊急コンピューティング、キャッシュ、統合通信とセンシング、インテリジェンス強化のためのメカニズムが含まれている。
本稿では,特に緊急コンピューティングに焦点をあて,階層的強化学習に基づく適応型協調推論手法(ACIM)を提案する。
論文 参考訳(メタデータ) (2024-02-03T13:28:35Z) - Muti-Agent Proximal Policy Optimization For Data Freshness in
UAV-assisted Networks [4.042622147977782]
収集したデータが時間に敏感な場合に注目し,そのタイムラインを維持することが重要である。
我々の目標は、UAVの軌道を最適に設計することであり、グローバル・エイジ・オブ・アップデート(AoU)のような訪問するIoTデバイスのサブセットを最小化することである。
論文 参考訳(メタデータ) (2023-03-15T15:03:09Z) - Transferable Deep Reinforcement Learning Framework for Autonomous
Vehicles with Joint Radar-Data Communications [69.24726496448713]
本稿では,AVの最適決定を支援するために,マルコフ決定プロセス(MDP)に基づくインテリジェントな最適化フレームワークを提案する。
そこで我々は,近年の深層強化学習技術を活用した効果的な学習アルゴリズムを開発し,AVの最適方針を見出す。
提案手法は,従来の深部強化学習手法と比較して,AVによる障害物ミス検出確率を最大67%削減することを示す。
論文 参考訳(メタデータ) (2021-05-28T08:45:37Z) - Reconfigurable Intelligent Surface Assisted Mobile Edge Computing with
Heterogeneous Learning Tasks [53.1636151439562]
モバイルエッジコンピューティング(MEC)は、AIアプリケーションに自然なプラットフォームを提供します。
再構成可能なインテリジェントサーフェス(RIS)の助けを借りて、MECで機械学習タスクを実行するインフラストラクチャを提示します。
具体的には,モバイルユーザの送信パワー,基地局のビームフォーミングベクトル,risの位相シフト行列を共同で最適化することにより,参加ユーザの学習誤差を最小化する。
論文 参考訳(メタデータ) (2020-12-25T07:08:50Z) - Distributional Reinforcement Learning for mmWave Communications with
Intelligent Reflectors on a UAV [119.97450366894718]
無人航空機(UAV)搭載のインテリジェントリフレクタ(IR)を用いた新しい通信フレームワークを提案する。
ダウンリンク和率を最大化するために、最適プリコーディング行列(基地局)と反射係数(IR)を共同で導出する。
論文 参考訳(メタデータ) (2020-11-03T16:50:37Z) - Optimization-driven Deep Reinforcement Learning for Robust Beamforming
in IRS-assisted Wireless Communications [54.610318402371185]
Intelligent Reflecting Surface (IRS)は、マルチアンテナアクセスポイント(AP)から受信機へのダウンリンク情報伝達を支援する有望な技術である。
我々は、APのアクティブビームフォーミングとIRSのパッシブビームフォーミングを共同最適化することで、APの送信電力を最小化する。
過去の経験からビームフォーミング戦略に適応できる深層強化学習(DRL)手法を提案する。
論文 参考訳(メタデータ) (2020-05-25T01:42:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。