論文の概要: RL-EA: A Reinforcement Learning-Based Evolutionary Algorithm Framework
for Electromagnetic Detection Satellite Scheduling Problem
- arxiv url: http://arxiv.org/abs/2206.05694v1
- Date: Sun, 12 Jun 2022 08:53:56 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-14 18:03:57.448531
- Title: RL-EA: A Reinforcement Learning-Based Evolutionary Algorithm Framework
for Electromagnetic Detection Satellite Scheduling Problem
- Title(参考訳): RL-EA:電磁検出衛星スケジューリング問題のための強化学習に基づく進化的アルゴリズムフレームワーク
- Authors: Yanjie Song, Luona Wei, Qing Yang, Jian Wu, Lining Xing, Yingwu Chen
- Abstract要約: 本稿では、EDSSP問題に対する混合整数プログラミングモデルと強化学習(RL-EA)に基づく進化的アルゴリズムフレームワークを提案する。
提案アルゴリズムの計画効果を検討するために,様々なスケール実験を行った。
- 参考スコア(独自算出の注目度): 6.438148195340613
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The study of electromagnetic detection satellite scheduling problem (EDSSP)
has attracted attention due to the detection requirements for a large number of
targets. This paper proposes a mixed-integer programming model for the EDSSP
problem and an evolutionary algorithm framework based on reinforcement learning
(RL-EA). Numerous factors that affect electromagnetic detection are considered
in the model, such as detection mode, bandwidth, and other factors. The
evolutionary algorithm framework based on reinforcement learning uses the
Q-learning framework, and each individual in the population is regarded as an
agent. Based on the proposed framework, a Q-learning-based genetic
algorithm(QGA) is designed. Q-learning is used to guide the population search
process by choosing variation operators. In the algorithm, we design a reward
function to update the Q value. According to the problem characteristics, a new
combination of <state, action> is proposed. The QGA also uses an elite
individual retention strategy to improve search performance. After that, a task
time window selection algorithm is proposed To evaluate the performance of
population evolution. Various scales experiments are used to examine the
planning effect of the proposed algorithm. Through the experimental
verification of multiple instances, it can be seen that the QGA can solve the
EDSSP problem effectively. Compared with the state-of-the-art algorithms, the
QGA algorithm performs better in several aspects.
- Abstract(参考訳): 電磁検出衛星スケジューリング問題(EDSSP)の研究は、多数の目標に対する検出要求により注目されている。
本稿では、EDSSP問題に対する混合整数プログラミングモデルと強化学習(RL-EA)に基づく進化的アルゴリズムフレームワークを提案する。
電磁検出に影響を与える多くの要因は、検出モード、帯域幅、その他の要因など、モデルで考慮されている。
強化学習に基づく進化的アルゴリズムフレームワークは,Q-ラーニングフレームワークを用いており,各個体はエージェントとみなされる。
提案手法に基づいてQ-learning-based genetic algorithm(QGA)を設計する。
Q-learningは、変動演算子を選択することで集団探索プロセスのガイドに使用される。
アルゴリズムでは、q値を更新するための報酬関数を設計する。
問題特性により,<state, action>の新たな組み合わせが提案されている。
QGAはまた、検索性能を改善するためにエリート個人の保持戦略を使用している。
その後,個体群進化の性能を評価するため,タスクタイムウィンドウ選択アルゴリズムが提案されている。
提案アルゴリズムの計画効果を検討するために,様々なスケール実験を行った。
複数のインスタンスの実験的検証を通じて、qgaはedssp問題を効果的に解くことができることが分かる。
最先端のアルゴリズムと比較すると、QGAアルゴリズムはいくつかの面で優れている。
関連論文リスト
- Quantum Subroutine for Variance Estimation: Algorithmic Design and Applications [80.04533958880862]
量子コンピューティングは、アルゴリズムを設計する新しい方法の基礎となる。
どの場の量子スピードアップが達成できるかという新たな課題が生じる。
量子サブルーチンの設計は、従来のサブルーチンよりも効率的で、新しい強力な量子アルゴリズムに固い柱を向ける。
論文 参考訳(メタデータ) (2024-02-26T09:32:07Z) - Multi-Timescale Ensemble Q-learning for Markov Decision Process Policy
Optimization [21.30645601474163]
元々のQ-ラーニングは、非常に大きなネットワークにわたるパフォーマンスと複雑性の課題に悩まされている。
従来のQ-ラーニングに適応したモデルフリーアンサンブル強化学習アルゴリズムを提案する。
計算結果から,提案アルゴリズムは平均ポリシエラーを最大55%,実行時複雑性を最大50%削減できることがわかった。
論文 参考訳(メタデータ) (2024-02-08T08:08:23Z) - Forward-Forward Algorithm for Hyperspectral Image Classification: A
Preliminary Study [0.0]
フォワードフォワードアルゴリズム(FFA)は、ネットワークパラメータを最適化するために局所良性関数を計算する。
本研究では,FFAのハイパースペクトル画像分類への応用について検討した。
論文 参考訳(メタデータ) (2023-07-01T05:39:28Z) - Active RIS-aided EH-NOMA Networks: A Deep Reinforcement Learning
Approach [66.53364438507208]
アクティブな再構成可能なインテリジェントサーフェス(RIS)支援マルチユーザダウンリンク通信システムについて検討した。
非直交多重アクセス(NOMA)はスペクトル効率を向上させるために使用され、活性RISはエネルギー回収(EH)によって駆動される。
ユーザの動的通信状態を予測するために,高度なLSTMベースのアルゴリズムを開発した。
増幅行列と位相シフト行列RISを結合制御するためにDDPGに基づくアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-04-11T13:16:28Z) - Identifying Co-Adaptation of Algorithmic and Implementational
Innovations in Deep Reinforcement Learning: A Taxonomy and Case Study of
Inference-based Algorithms [15.338931971492288]
我々は、アルゴリズムの革新と実装決定を分離するために、一連の推論に基づくアクター批判アルゴリズムに焦点を当てる。
実装の詳細がアルゴリズムの選択に一致すると、パフォーマンスが大幅に低下します。
結果は、どの実装の詳細がアルゴリズムと共適応され、共進化しているかを示す。
論文 参考訳(メタデータ) (2021-03-31T17:55:20Z) - Quantum agents in the Gym: a variational quantum algorithm for deep
Q-learning [0.0]
本稿では、離散的かつ連続的な状態空間に対するRLタスクを解くために使用できるパラメタライズド量子回路(PQC)のトレーニング手法を提案する。
量子Q学習エージェントのどのアーキテクチャ選択が、特定の種類の環境をうまく解決するのに最も重要であるかを検討する。
論文 参考訳(メタデータ) (2021-03-28T08:57:22Z) - Evolving Reinforcement Learning Algorithms [186.62294652057062]
メタラーニング強化学習アルゴリズムの手法を提案する。
学習アルゴリズムはドメインに依存しないため、トレーニング中に見えない新しい環境に一般化することができる。
従来の制御タスク、gridworld型タスク、atariゲームよりも優れた一般化性能を得る2つの学習アルゴリズムに注目した。
論文 参考訳(メタデータ) (2021-01-08T18:55:07Z) - Joint Deep Reinforcement Learning and Unfolding: Beam Selection and
Precoding for mmWave Multiuser MIMO with Lens Arrays [54.43962058166702]
離散レンズアレイを用いたミリ波マルチユーザマルチインプット多重出力(MU-MIMO)システムに注目が集まっている。
本研究では、DLA を用いた mmWave MU-MIMO システムのビームプリコーディング行列の共同設計について検討する。
論文 参考訳(メタデータ) (2021-01-05T03:55:04Z) - A Hybrid PAC Reinforcement Learning Algorithm [5.279475826661642]
本稿では,マルコフ決定過程(MDPs)に対するほぼ正のPAC強化学習(RL)アルゴリズムを提案する。
設計アルゴリズムはDyna-Delayed Q-learning(DDQ)アルゴリズムと呼ばれ、モデルフリーとモデルベースラーニングのアプローチを組み合わせており、どちらの場合も性能が優れている。
論文 参考訳(メタデータ) (2020-09-05T21:32:42Z) - Iterative Algorithm Induced Deep-Unfolding Neural Networks: Precoding
Design for Multiuser MIMO Systems [59.804810122136345]
本稿では,AIIDNN(ディープ・アンフォールディング・ニューラルネット)を一般化した,ディープ・アンフォールディングのためのフレームワークを提案する。
古典的重み付き最小二乗誤差(WMMSE)反復アルゴリズムの構造に基づく効率的なIAIDNNを提案する。
提案したIAIDNNは,計算複雑性を低減した反復WMMSEアルゴリズムの性能を効率よく向上することを示す。
論文 参考訳(メタデータ) (2020-06-15T02:57:57Z) - RIS Enhanced Massive Non-orthogonal Multiple Access Networks: Deployment
and Passive Beamforming Design [116.88396201197533]
再構成可能なインテリジェントサーフェス(RIS)の配置と受動ビームフォーミング設計のための新しいフレームワークを提案する。
エネルギー効率を最大化するために、共同配置、位相シフト設計、および電力配分の問題を定式化する。
リアルタイムデータセットを活用することで,ユーザの遠隔交通需要を予測するために,LSTM(Long Short-term memory)ベースのエコー状態ネットワーク(ESN)アルゴリズムを提案する。
RISの展開と設計の連立問題を解くために,D3QNに基づく位置取得と位相制御アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-01-28T14:37:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。