論文の概要: HEAT:History-Enhanced Dual-phase Actor-Critic Algorithm with A Shared Transformer
- arxiv url: http://arxiv.org/abs/2504.13193v1
- Date: Sun, 13 Apr 2025 10:32:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-28 21:11:47.998936
- Title: HEAT:History-Enhanced Dual-phase Actor-Critic Algorithm with A Shared Transformer
- Title(参考訳): HEAT:共有変圧器を用いた履歴強化2相アクタ臨界アルゴリズム
- Authors: Hong Yang,
- Abstract要約: 本研究では,ネットワーク性能向上のための共有トランスフォーマーアルゴリズム (HEAT) を用いた歴史強調2段階アクター批判アルゴリズムを提案する。
さらに, オープンソースの LoRaWAN ネットワークシミュレータ LoRaWANSim を開発した。
- 参考スコア(独自算出の注目度): 18.079821897367673
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: For a single-gateway LoRaWAN network, this study proposed a history-enhanced two-phase actor-critic algorithm with a shared transformer algorithm (HEAT) to improve network performance. HEAT considers uplink parameters and often neglected downlink parameters, and effectively integrates offline and online reinforcement learning, using historical data and real-time interaction to improve model performance. In addition, this study developed an open source LoRaWAN network simulator LoRaWANSim. The simulator considers the demodulator lock effect and supports multi-channel, multi-demodulator and bidirectional communication. Simulation experiments show that compared with the best results of all compared algorithms, HEAT improves the packet success rate and energy efficiency by 15% and 95%, respectively.
- Abstract(参考訳): 単一ゲートウェイLoRaWANネットワークにおいて,共有トランスフォーマアルゴリズム(HEAT)を用いた履歴強調2相アクタ批判アルゴリズムを提案し,ネットワーク性能を向上した。
HEATはアップリンクパラメータを考慮し、しばしばダウンリンクパラメータを無視し、オフラインとオンラインの強化学習を効果的に統合する。
さらに, オープンソースの LoRaWAN ネットワークシミュレータ LoRaWANSim を開発した。
シミュレータは、復調器ロック効果を考慮し、マルチチャネル、マルチデモジュレータ、双方向通信をサポートする。
シミュレーション実験により、全ての比較アルゴリズムの最良の結果と比較すると、HEATはパケット成功率とエネルギー効率をそれぞれ15%、95%改善することが示された。
関連論文リスト
- Coordinated Power Smoothing Control for Wind Storage Integrated System with Physics-informed Deep Reinforcement Learning [13.266525968718275]
電力平滑化制御(PSC)を用いた風力発電統合システムは, 効率と信頼性を両立させる有望なソリューションとして浮上している。
既存のPSC戦略は、バッテリと風力タービンの複雑な制御相互作用を見落とし、ウェイク効果やバッテリ劣化コストを考慮していない。
本稿では,これらの課題を効果的に解決するために,階層レベルの新しい協調制御フレームワークを考案した。
論文 参考訳(メタデータ) (2024-12-17T11:37:46Z) - Dual-TSST: A Dual-Branch Temporal-Spectral-Spatial Transformer Model for EEG Decoding [2.0721229324537833]
デュアルブランチ時間スペクトル空間変換器(Dual-TSST)を用いた新しいデコードアーキテクチャネットワークを提案する。
提案するDual-TSSTは様々なタスクにおいて優れており,平均精度80.67%の脳波分類性能が期待できる。
本研究は,高性能脳波デコーディングへの新たなアプローチを提供するとともに,将来のCNN-Transformerベースのアプリケーションにも大きな可能性を秘めている。
論文 参考訳(メタデータ) (2024-09-05T05:08:43Z) - A-SDM: Accelerating Stable Diffusion through Model Assembly and Feature Inheritance Strategies [51.7643024367548]
安定拡散モデルは、テキスト・ツー・イメージ(T2I)と画像・ツー・イメージ(I2I)生成のための一般的かつ効果的なモデルである。
本研究では、SDMにおける冗長計算の削減と、チューニング不要とチューニング不要の両方の手法によるモデルの最適化に焦点をあてる。
論文 参考訳(メタデータ) (2024-05-31T21:47:05Z) - Function Approximation for Reinforcement Learning Controller for Energy from Spread Waves [69.9104427437916]
マルチジェネレータ・ウェーブ・エナジー・コンバータ(WEC)は、スプレッド・ウェーブと呼ばれる異なる方向から来る複数の同時波を処理しなければならない。
これらの複雑な装置は、エネルギー捕獲効率、維持を制限する構造的ストレスの低減、高波に対する積極的な保護という複数の目的を持つコントローラを必要とする。
本稿では,システム力学のシーケンシャルな性質をモデル化する上で,ポリシーと批判ネットワークの異なる機能近似について検討する。
論文 参考訳(メタデータ) (2024-04-17T02:04:10Z) - UAV-assisted Semantic Communication with Hybrid Action Reinforcement
Learning [19.48293218551122]
本稿では, セマンティックモデルスケール, チャネル割り当て, 送信電力, UAV軌道に関する決定を行うためのハイブリッドアクション強化学習フレームワークを提案する。
シミュレーションの結果,提案したハイブリッドアクション強化学習フレームワークは,アップリンクセマンティックデータ収集の効率を効果的に向上できることが示された。
論文 参考訳(メタデータ) (2023-08-18T06:30:18Z) - Joint Channel Estimation and Feedback with Masked Token Transformers in
Massive MIMO Systems [74.52117784544758]
本稿では,CSI行列内の固有周波数領域相関を明らかにするエンコーダデコーダに基づくネットワークを提案する。
エンコーダ・デコーダネットワーク全体がチャネル圧縮に使用される。
提案手法は,共同作業における現状のチャネル推定およびフィードバック技術より優れる。
論文 参考訳(メタデータ) (2023-06-08T06:15:17Z) - Model-Driven Deep Learning for Non-Coherent Massive Machine-Type
Communications [37.35929546347294]
大規模機械型通信(mMTC)における1相非コヒーレント方式を用いた共同装置の動作とデータ検出について検討した。
非コヒーレント伝送方式によって導入された相関した疎結合パターンのため、従来のAMPアルゴリズムでは良好な性能が得られない。
本稿では,パイロット活動相関を効果的に活用して検出性能を向上させる深層学習改良AMPネットワーク(DL-mAMPnet)を提案する。
論文 参考訳(メタデータ) (2023-01-02T04:02:32Z) - Over-the-Air Federated Multi-Task Learning via Model Sparsification and
Turbo Compressed Sensing [48.19771515107681]
本稿では,エッジサーバの協調の下で,エッジデバイス上にデプロイされた複数の学習タスクを非直交型フェードチャネルで共有する,オーバー・ザ・エアのFMTLフレームワークを提案する。
OA-FMTLでは、エッジデバイスの局所的な更新はスパース化され、圧縮され、重ね合わせの方法でアップリンクチャネルに送信される。
提案するOA-FMTLフレームワークとM-Turbo-CSアルゴリズムの性能解析を行った。
論文 参考訳(メタデータ) (2022-05-08T08:03:52Z) - CATRO: Channel Pruning via Class-Aware Trace Ratio Optimization [61.71504948770445]
本稿では,CATRO (Class-Aware Trace Ratio Optimization) を用いた新しいチャネルプルーニング手法を提案する。
CATROは、他の最先端チャネルプルーニングアルゴリズムと同等の精度で、同様のコストまたは低コストで高い精度を達成できることを示す。
CATROは、クラス認識の特性のため、様々な分類サブタスクに適応的に効率の良いネットワークを創り出すのに適している。
論文 参考訳(メタデータ) (2021-10-21T06:26:31Z) - Communication-Efficient Distributed Stochastic AUC Maximization with
Deep Neural Networks [50.42141893913188]
本稿では,ニューラルネットワークを用いた大規模AUCのための分散変数について検討する。
我々のモデルは通信ラウンドをはるかに少なくし、理論上はまだ多くの通信ラウンドを必要としています。
いくつかのデータセットに対する実験は、我々の理論の有効性を示し、我々の理論を裏付けるものである。
論文 参考訳(メタデータ) (2020-05-05T18:08:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。