論文の概要: Optimization of Link Configuration for Satellite Communication Using Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2501.08220v1
- Date: Tue, 14 Jan 2025 16:04:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-15 13:25:20.384050
- Title: Optimization of Link Configuration for Satellite Communication Using Reinforcement Learning
- Title(参考訳): 強化学習を用いた衛星通信のためのリンク構成最適化
- Authors: Tobias Rohe, Michael Kölle, Jan Matheis, Rüdiger Höpfl, Leo Sünkel, Claudia Linnhoff-Popien,
- Abstract要約: 最適なリンク構成の計画は非常に複雑で、多くのパラメータやメトリクスに依存します。
強化学習アルゴリズムPPOとメタヒューリスティック・シミュレート・アニーリングを比較した。
その結果,Simulated AnnealingはPPOアルゴリズムよりも,この静的問題に対してより良い結果をもたらすことがわかった。
- 参考スコア(独自算出の注目度): 4.118849293881126
- License:
- Abstract: Satellite communication is a key technology in our modern connected world. With increasingly complex hardware, one challenge is to efficiently configure links (connections) on a satellite transponder. Planning an optimal link configuration is extremely complex and depends on many parameters and metrics. The optimal use of the limited resources, bandwidth and power of the transponder is crucial. Such an optimization problem can be approximated using metaheuristic methods such as simulated annealing, but recent research results also show that reinforcement learning can achieve comparable or even better performance in optimization methods. However, there have not yet been any studies on link configuration on satellite transponders. In order to close this research gap, a transponder environment was developed as part of this work. For this environment, the performance of the reinforcement learning algorithm PPO was compared with the metaheuristic simulated annealing in two experiments. The results show that Simulated Annealing delivers better results for this static problem than the PPO algorithm, however, the research in turn also underlines the potential of reinforcement learning for optimization problems.
- Abstract(参考訳): 衛星通信は、現代のコネクテッドワールドにおける重要な技術である。
複雑化するハードウェアでは、衛星トランスポンダ上のリンク(接続)を効率的に設定することが課題である。
最適なリンク構成の計画は非常に複雑で、多くのパラメータやメトリクスに依存します。
トランスポンダの限られた資源、帯域、電力の最適利用は不可欠である。
このような最適化問題は、シミュレーションアニールなどのメタヒューリスティック手法を用いて近似することができるが、最近の研究結果は、強化学習が最適化手法において同等あるいはそれ以上の性能を達成できることも示している。
しかし、衛星トランスポンダのリンク構成についてはまだ研究されていない。
この研究ギャップを埋めるため、この研究の一環としてトランスポンダ環境が開発された。
この環境下では, 強化学習アルゴリズムPPOの性能をメタヒューリスティック・シミュレート・アニーリングと比較した。
その結果,PPOアルゴリズムよりも静的な問題に対して,Simulated Annealingがよりよい結果をもたらすことが示されたが,この研究は最適化問題に対する強化学習の可能性も強調している。
関連論文リスト
- Implementing transferable annealing protocols for combinatorial optimisation on neutral atom quantum processors: a case study on smart-charging of electric vehicles [1.53934570513443]
本稿では,類似した局所構造を持つ問題インスタンス間のパラメータ転送可能性の有望性に基づいて構築する。
本研究は,共有ジオメトリを持つグラフ族上の最大独立集合問題に対して,最適パラメータが自然に集中していることを明らかにする。
本手法を用いて,実データセット上でのスマートチャージ最適化問題に対処する。
論文 参考訳(メタデータ) (2024-11-25T18:41:02Z) - Wireless Federated Learning over UAV-enabled Integrated Sensing and Communication [2.8203310972866382]
本稿では,無人航空機(UAV)を利用した統合型統合学習(FL)における新しい遅延最適化問題について検討する。
ベンチマーク方式と比較して,システム遅延を最大68.54%削減し,高品質な近似解を求めるため,単純かつ効率的な反復アルゴリズムを開発した。
論文 参考訳(メタデータ) (2024-11-01T14:25:24Z) - Morphology and Behavior Co-Optimization of Modular Satellites for Attitude Control [16.673862756035582]
我々は、モジュラー衛星のモルフォロジーと制御を同時に最適化するための、新しい勾配に基づくアプローチを導入する。
我々のモンテカルロシミュレーションは、この共最適化アプローチによって、より優れたミッション性能を持つモジュラー衛星が生まれることを示した。
論文 参考訳(メタデータ) (2024-09-20T02:43:53Z) - UAV-enabled Collaborative Beamforming via Multi-Agent Deep Reinforcement Learning [79.16150966434299]
本稿では,UAVを用いた協調ビームフォーミング多目的最適化問題 (UCBMOP) を定式化し,UAVの伝送速度を最大化し,全UAVのエネルギー消費を最小化する。
ヘテロジニアス・エージェント・信頼領域ポリシー最適化(HATRPO)を基本フレームワークとし,改良されたHATRPOアルゴリズム,すなわちHATRPO-UCBを提案する。
論文 参考訳(メタデータ) (2024-04-11T03:19:22Z) - Collaborative Ground-Space Communications via Evolutionary Multi-objective Deep Reinforcement Learning [113.48727062141764]
地中直接通信を実現するために,分散コラボレーティブビームフォーミング(DCB)に基づくアップリンク通信パラダイムを提案する。
DCBは、低軌道(LEO)衛星と効率的な直接接続を確立することができない端末を分散アンテナとして扱う。
本稿では,進化的多目的深層強化学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-04-11T03:13:02Z) - Can LLMs Configure Software Tools [0.76146285961466]
ソフトウェア工学では、複雑なシステム内での最適なパフォーマンスを確保するためには、ソフトウェアツールの精巧な構成が不可欠である。
本研究では,Large-Language Models (LLMs) を利用したソフトウェア構成プロセスの合理化について検討する。
本研究は,Chat-GPTなどのLCMを用いて,開始条件を特定し,検索空間を狭め,構成効率を向上する手法を提案する。
論文 参考訳(メタデータ) (2023-12-11T05:03:02Z) - Joint User Association, Interference Cancellation and Power Control for
Multi-IRS Assisted UAV Communications [80.35959154762381]
インテリジェント反射面(IRS)支援無人航空機(UAV)通信は、地上基地局の負荷を低コストで軽減することが期待されている。
既存の研究は主に、複数のIRSではなく単一のIRSの配置とリソース割り当てに焦点を当てている。
我々は,共同IRSユーザアソシエーションのための新しい最適化アルゴリズム,UAVの軌道最適化,逐次干渉キャンセル(SIC)復号命令スケジューリング,電力割り当てを提案する。
論文 参考訳(メタデータ) (2023-12-08T01:57:10Z) - Federated Conditional Stochastic Optimization [110.513884892319]
条件付き最適化は、不変学習タスク、AUPRC、AMLなど、幅広い機械学習タスクで見られる。
本稿では,分散フェデレーション学習のためのアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-10-04T01:47:37Z) - MARLIN: Soft Actor-Critic based Reinforcement Learning for Congestion
Control in Real Networks [63.24965775030673]
そこで本研究では,汎用的な渋滞制御(CC)アルゴリズムを設計するための新しい強化学習(RL)手法を提案する。
我々の解であるMARLINは、Soft Actor-Criticアルゴリズムを用いてエントロピーとリターンの両方を最大化する。
我々は,MARLINを実ネットワーク上で訓練し,実ミスマッチを克服した。
論文 参考訳(メタデータ) (2023-02-02T18:27:20Z) - Approaching Globally Optimal Energy Efficiency in Interference Networks
via Machine Learning [22.926877147296594]
本研究は,マルチセル無線ネットワークにおけるエネルギー効率(EE)を最適化する機械学習手法を提案する。
その結果,この手法は分岐計算テストにより最適値に近いEEを達成できることが判明した。
論文 参考訳(メタデータ) (2022-11-25T08:36:34Z) - Path Design and Resource Management for NOMA enhanced Indoor Intelligent
Robots [58.980293789967575]
通信可能な屋内知的ロボット(IR)サービスフレームワークを提案する。
室内レイアウトとチャネル状態を決定論的に記述できるレゴモデリング手法が提案されている。
調査対象の無線マップは、強化学習エージェントを訓練するための仮想環境として呼び出される。
論文 参考訳(メタデータ) (2020-11-23T21:45:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。