論文の概要: Plasticity-Enhanced Multi-Agent Mixture of Experts for Dynamic Objective Adaptation in UAVs-Assisted Emergency Communication Networks
- arxiv url: http://arxiv.org/abs/2604.09028v1
- Date: Fri, 10 Apr 2026 06:46:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-13 17:57:53.729435
- Title: Plasticity-Enhanced Multi-Agent Mixture of Experts for Dynamic Objective Adaptation in UAVs-Assisted Emergency Communication Networks
- Title(参考訳): UAV支援緊急通信網における動的目的適応のための塑性強化多エージェント混合
- Authors: Wen Qiu, Zhiqiang He, Wei Zhao, Hiroshi Masui,
- Abstract要約: 我々は, 可塑性強化型多剤混合専門家(PE-MAMoE)を提案する。
PE-MAMoEは、各UAVに、ルーターが1ステップごとに1つの専門家を選択する専門家アクターをわずかに混合する。
環境変動と累積雑音エネルギーの両方で追従誤差尺度を示す動的後悔境界を導出する。
- 参考スコア(独自算出の注目度): 5.059907627897051
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Unmanned aerial vehicles serving as aerial base stations can rapidly restore connectivity after disasters, yet abrupt changes in user mobility and traffic demands shift the quality of service trade-offs and induce strong non-stationarity. Deep reinforcement learning policies suffer from plasticity loss under such shifts, as representation collapse and neuron dormancy impair adaptation. We propose plasticity enhanced multi-agent mixture of experts (PE-MAMoE), a centralized training with decentralized execution framework built on multi-agent proximal policy optimization. PE-MAMoE equips each UAV with a sparsely gated mixture of experts actor whose router selects a single specialist per step. A non-parametric Phase Controller injects brief, expert-only stochastic perturbations after phase switches, resets the action log-standard-deviation, anneals entropy and learning rate, and schedules the router temperature, all to re-plasticize the policy without destabilizing safe behaviors. We derive a dynamic regret bound showing the tracking error scales with both environment variation and cumulative noise energy. In a phase-driven simulator with mobile users and 3GPP-style channels, PE-MAMoE improves normalized interquartile mean return by 26.3\% over the best baseline, increases served-user capacity by 12.8\%, and reduces collisions by approximately 75\%. Diagnostics confirm persistently higher expert feature rank and periodic dormant-neuron recovery at regime switches.
- Abstract(参考訳): 航空基地局として機能する無人航空機は、災害後の接続を迅速に回復することができるが、ユーザモビリティや交通需要の急激な変化は、サービストレードオフの品質をシフトさせ、強力な非定常性をもたらす。
深層強化学習政策は、表現崩壊やニューロンの休眠障害など、このような変化の下で可塑性損失に悩まされる。
マルチエージェントポリシー最適化を基盤とした分散実行フレームワークであるPE-MAMoE(PE-MAMoE)の可塑性向上手法を提案する。
PE-MAMoEは、各UAVに、ルーターが1ステップごとに1つの専門家を選択する専門家アクターをわずかに混合する。
非パラメトリック位相制御器は、位相スイッチの後に短時間で専門家のみの確率的摂動を注入し、アクションログ標準偏差をリセットし、エントロピーと学習率をアンニールし、ルータ温度をスケジュールし、全員が安全な動作を不安定にすることなくポリシーを再形成する。
環境変動と累積雑音エネルギーの両方で追従誤差尺度を示す動的後悔境界を導出する。
モバイルユーザと3GPPスタイルのチャネルを備えた位相駆動シミュレータにおいて、PE-MAMoEは、最高ベースラインで26.3\%の正規化間平均戻り値を改善し、サービスユーザ容量を12.8\%増加させ、衝突を約75\%減少させる。
診断は、状態スイッチにおける専門的特徴ランクと周期的休眠性ニューロン回復を持続的に確認する。
関連論文リスト
- Beyond Reward Suppression: Reshaping Steganographic Communication Protocols in MARL via Dynamic Representational Circuit Breaking [0.0]
監視を回避するためのプライベートプロトコルを開発するエージェントによるステガノグラフィーの共謀は、AIの安全性に重大な脅威をもたらす。
既存の防御は行動層や報酬層に限られており、潜伏する通信路での調整を検知できない。
本稿では,動的表現回路ブレーカ(DRCB)について紹介する。
論文 参考訳(メタデータ) (2026-03-07T04:14:38Z) - Dual-Agent Multiple-Model Reinforcement Learning for Event-Triggered Human-Robot Co-Adaptation in Decoupled Task Spaces [3.349003999623489]
本稿では,カスタム6自由度上肢ロボットのための共有制御型リハビリテーションポリシーを提案する。
患者は二進法で一次到達方向を制御し、ロボットは自律的に矯正動作を管理する。
論文 参考訳(メタデータ) (2026-03-06T11:15:10Z) - PASS-Enhanced MEC: Joint Optimization of Task Offloading and Uplink PASS Beamforming [67.78883135636657]
ピンチアンテナシステム (PASS) によるモバイルエッジコンピューティング (MEC) アーキテクチャについて検討した。
PASSは、重要な経路損失と潜在的な信号遮断を効果的に軽減しつつ、短距離ライン・オブ・ライト(LoS)リンクを確立する。
ネットワーク遅延最小化問題を定式化し、アップリンクPASSビームフォーミングとタスクオフロードを共同で最適化する。
論文 参考訳(メタデータ) (2025-10-27T03:04:46Z) - When UAV Swarm Meets IRS: Collaborative Secure Communications in Low-altitude Wireless Networks [68.45202147860537]
低高度無線ネットワーク (LAWN) は、多様なアプリケーションに対して、拡張されたカバレッジ、信頼性、スループットを提供する。
これらのネットワークは、既知のおよび潜在的に未知の盗聴者の両方から重大なセキュリティ上の脆弱性に直面している。
本稿では,Swarm内で選択されたUAVを仮想アンテナアレイとして機能させる,LAWNのための新しいセキュア通信フレームワークを提案する。
論文 参考訳(メタデータ) (2025-10-25T02:02:14Z) - STAR-RIS-assisted Collaborative Beamforming for Low-altitude Wireless Networks [58.13757830013997]
無人航空機(UAV)に基づく無線ネットワークは、都市コミュニケーションに高いモビリティ、柔軟性、カバーを提供する。
閉塞により、密集した環境では信号の減衰が激しい。
この重要な問題に対処するために、UAVの協調ビームの導入と全方向逆方向ビームフォーミングについて検討する。
論文 参考訳(メタデータ) (2025-10-25T01:28:37Z) - Alignment Tipping Process: How Self-Evolution Pushes LLM Agents Off the Rails [103.05296856071931]
本稿では,自己進化型大規模言語モデル(LLM)エージェントに特有の,アライメント・ティッピング・プロセス(ATP)を同定する。
ATPは、連続的な相互作用によってエージェントが訓練中に確立されたアライメント制約を放棄し、強化された自己関心の戦略を支持するときに生じる。
実験の結果、アライメントの利点は自己進化の下で急速に低下し、最初は整合性のない状態に収束したモデルであることが判明した。
論文 参考訳(メタデータ) (2025-10-06T14:48:39Z) - From Static to Adaptive Defense: Federated Multi-Agent Deep Reinforcement Learning-Driven Moving Target Defense Against DoS Attacks in UAV Swarm Networks [23.908450903174725]
UAV群における能動的DoS緩和のための新しい枠組みを提案する。
我々は、リーダースイッチング、ルート突然変異、周波数ホッピングを含む軽量かつ協調的なMTD機構を設計する。
我々のアプローチは最先端のベースラインを大きく上回っている。
論文 参考訳(メタデータ) (2025-06-09T03:33:04Z) - Sparse MoE as the New Dropout: Scaling Dense and Self-Slimmable
Transformers [107.3726071306935]
そこで我々は,SMoE-Dropoutというプラグイン・アンド・プレイ・トレーニング・フレームワークを提案する。
SMoE-Dropoutはランダムで固定されたルータネットワークで構成され、エキスパートを活性化し、トレーニングが進むにつれて、アクティベートされたエキスパート数を徐々に増加させる。
本実験では,SMoE-Dropout の高密度トレーニングベースラインと等価パラメータ数との比較により,SMoE-Dropout の優れた性能と計算精度を実証した。
論文 参考訳(メタデータ) (2023-03-02T22:12:51Z) - Collaborative Intelligent Reflecting Surface Networks with Multi-Agent
Reinforcement Learning [63.83425382922157]
インテリジェント・リフレクション・サーフェス(IRS)は将来の無線ネットワークに広く応用されることが想定されている。
本稿では,エネルギー収穫能力を備えた協調型IRSデバイスを用いたマルチユーザ通信システムについて検討する。
論文 参考訳(メタデータ) (2022-03-26T20:37:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。