論文の概要: DeFRiS: Silo-Cooperative IoT Applications Scheduling via Decentralized Federated Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2603.14729v1
- Date: Mon, 16 Mar 2026 02:02:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-17 16:19:35.99324
- Title: DeFRiS: Silo-Cooperative IoT Applications Scheduling via Decentralized Federated Reinforcement Learning
- Title(参考訳): DeFRiS: 分散フェデレーション強化学習によるシロコラボのIoTアプリケーションスケジューリング
- Authors: Zhiyu Wang, Mohammad Goudarzi, Mingming Gong, Rajkumar Buyya,
- Abstract要約: 本稿では、ロバストでスケーラブルなシロコラボ型IoTアプリケーションスケジューリングのための分散フェデレーション強化学習フレームワークであるDeFRiSを提案する。
DeFRiSは、(i)異種サイロ間のシームレスな知識伝達を可能にするための候補資源スコアを利用したアクション空間非依存ポリシー、(ii)汎用アドバンテージ推定とクリッピングされたポリシー更新を組み合わせたサイロ最適化ローカル学習メカニズム、(iii)類似性認識の知識伝達と異常検出に勾配指紋を利用するDual-Track Non-IIDロバストな分散集約プロトコル、の3つのイノベーションを統合する。
- 参考スコア(独自算出の注目度): 62.347535250646196
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Next-generation IoT applications increasingly span across autonomous administrative entities, necessitating silo-cooperative scheduling to leverage diverse computational resources while preserving data privacy. However, realizing efficient cooperation faces significant challenges arising from infrastructure heterogeneity, Non-IID workload shifts, and the inherent risks of adversarial environments. Existing approaches, relying predominantly on centralized coordination or independent learning, fail to address the incompatibility of state-action spaces across heterogeneous silos and lack robustness against malicious attacks. This paper proposes DeFRiS, a Decentralized Federated Reinforcement Learning framework for robust and scalable Silo-cooperative IoT application scheduling. DeFRiS integrates three synergistic innovations: (i) an action-space-agnostic policy utilizing candidate resource scoring to enable seamless knowledge transfer across heterogeneous silos; (ii) a silo-optimized local learning mechanism combining Generalized Advantage Estimation (GAE) with clipped policy updates to resolve sparse delayed reward challenges; and (iii) a Dual-Track Non-IID robust decentralized aggregation protocol leveraging gradient fingerprints for similarity-aware knowledge transfer and anomaly detection, and gradient tracking for optimization momentum. Extensive experiments on a distributed testbed with 20 heterogeneous silos and realistic IoT workloads demonstrate that DeFRiS significantly outperforms state-of-the-art baselines, reducing average response time by 6.4% and energy consumption by 7.2%, while lowering tail latency risk (CVaR$_{0.95}$) by 10.4% and achieving near-zero deadline violations. Furthermore, DeFRiS achieves over 3 times better performance retention as the system scales and over 8 times better stability in adversarial environments compared to the best-performing baseline.
- Abstract(参考訳): 次世代IoTアプリケーションは、データプライバシを保ちながら、多様な計算リソースを活用するために、サイロ協調スケジューリングを必要とする、自律的な管理エンティティにまたがるものが増えています。
しかし、効率的な協調を実現するには、インフラの不均一性、非IIDのワークロードシフト、および敵対環境の固有のリスクから生じる重大な課題に直面している。
既存のアプローチは、主に中央集権的な調整や独立した学習に依存しているが、異種サイロをまたいだ状態対応空間の不整合に対処できず、悪意のある攻撃に対する堅牢性も欠如している。
本稿では、ロバストでスケーラブルなシロコラボ型IoTアプリケーションスケジューリングのための分散フェデレーション強化学習フレームワークであるDeFRiSを提案する。
DeFRiSは3つの相乗的イノベーションを統合している。
一 異種サイロ間のシームレスな知識伝達を可能にするための候補資源スコアリングを利用した行動空間非依存政策
(II)GAE(Generalized Advantage Estimation)とクリッピングされたポリシー更新を組み合わせたサイロ最適化型局所学習機構
3) 類似性を考慮した知識伝達と異常検出, 最適化モーメントのための勾配追跡に勾配指紋を利用するDual-Track Non-IIDロバストな分散集約プロトコル。
20の異種サイロと現実的なIoTワークロードを備えた分散テストベッドでの大規模な実験では、DeFRiSが最先端のベースラインを著しく上回り、平均応答時間を6.4%削減し、エネルギー消費量を7.2%削減し、テールレイテンシリスク(CVaR$_{0.95}$)を10.4%削減し、ほぼゼロの期限違反を達成したことが示されている。
さらに、DeFRiSはシステム規模がスケールするにつれて性能の保持率が3倍以上向上し、対向環境の安定性は最高の性能のベースラインに比べて8倍以上向上した。
関連論文リスト
- Harnessing Implicit Cooperation: A Multi-Agent Reinforcement Learning Approach Towards Decentralized Local Energy Markets [41.99844472131922]
分散エージェントは、明示的なピアツーピア通信なしで、ローカルエネルギー市場における最適調整を近似することができる。
スティグマイシンシグナリングは複雑なグリッドコーディネートに十分なコンテキストを提供し、高価な集中型通信インフラに代わる堅牢でプライバシー保護の代替を提供する。
論文 参考訳(メタデータ) (2026-02-17T22:22:32Z) - Toward a Sustainable Federated Learning Ecosystem: A Practical Least Core Mechanism for Payoff Allocation [71.86087908416255]
最小コア(LC)概念に基づく配当フレームワークを提案する。
従来の方法とは異なり、LCは最大の不満を最小限に抑えてフェデレーションの凝集を優先する。
統合侵入検知におけるケーススタディは、我々のメカニズムが重要な貢献者や戦略的提携を正しく識別できることを実証している。
論文 参考訳(メタデータ) (2026-02-03T11:10:50Z) - Adaptive Dual-Weighting Framework for Federated Learning via Out-of-Distribution Detection [53.45696787935487]
Federated Learning (FL)は、大規模分散サービスノード間の協調的なモデルトレーニングを可能にする。
実世界のサービス指向デプロイメントでは、異種ユーザ、デバイス、アプリケーションシナリオによって生成されたデータは本質的にIIDではない。
FLoodは、オフ・オブ・ディストリビューション(OOD)検出にインスパイアされた新しいFLフレームワークである。
論文 参考訳(メタデータ) (2026-02-01T05:54:59Z) - Consolidation or Adaptation? PRISM: Disentangling SFT and RL Data via Gradient Concentration [56.074760766965085]
PRISMは、モデルの既存の知識との認知的対立度に基づいてデータを調停する動的認識フレームワークを実現する。
この結果から,内部最適化方式に基づくデータ分離が,スケーラブルでロバストなエージェントアライメントに不可欠であることが示唆された。
論文 参考訳(メタデータ) (2026-01-12T05:43:20Z) - Hierarchical Spatio-Temporal Attention Network with Adaptive Risk-Aware Decision for Forward Collision Warning in Complex Scenarios [7.238050152381639]
本稿では,階層型時空間注意ネットワークと動的リスク閾値調整アルゴリズムを併用した前方衝突警報フレームワークを提案する。
マルチシナリオデータセットでテストされ、完全なシステムは高い有効性を示し、F1スコアは0.912、偽警報率は8.2%、警告リード時間は2.8秒である。
論文 参考訳(メタデータ) (2025-11-25T05:57:29Z) - Federated Anomaly Detection and Mitigation for EV Charging Forecasting Under Cyberattacks [2.733652751545525]
電気自動車(EV)の充電インフラは、運用効率とグリッド安定性を著しく損なうサイバーセキュリティの脅威がエスカレートしている。
既存の予測技術は、堅牢な異常軽減ソリューションとデータ保存プライバシの欠如によって制限されている。
本稿では,データプライバシを同時に保持し,サイバー攻撃を検出し,敵条件下での信頼性の高い需要予測精度を維持する,新しい異常回復型フェデレーション学習フレームワークを提案する。
論文 参考訳(メタデータ) (2025-11-22T08:41:58Z) - FedCure: Mitigating Participation Bias in Semi-Asynchronous Federated Learning with Non-IID Data [25.502321611335343]
FedCureは、革新的な半非同期フェデレーション学習フレームワークである。
連立構築と参加対応スケジューリングを利用して、非IIDデータによる参加バイアスを軽減する。
最先端の4つのベースラインと比較して、精度は最大5.1倍向上する。
論文 参考訳(メタデータ) (2025-11-13T11:56:58Z) - GEPO: Group Expectation Policy Optimization for Stable Heterogeneous Reinforcement Learning [43.46954951944727]
パラメータ学習とロールアウトサンプリングを分離する異種RLアーキテクチャであるHeteroRLを提案する。
コアコンポーネントは、レイテンシに堅牢な非同期RLアルゴリズムであるグループ期待ポリシー最適化(GEPO)である。
GEPOが優れた安定性を実現していることを示す実験は、オンラインから1800年代のレイテンシまで、わずか3%のパフォーマンス低下である。
論文 参考訳(メタデータ) (2025-08-25T09:57:35Z) - NDCG-Consistent Softmax Approximation with Accelerated Convergence [67.10365329542365]
本稿では,ランキングの指標と直接一致した新たな損失定式化を提案する。
提案したRG損失を高効率な Alternating Least Squares (ALS) 最適化手法と統合する。
実世界のデータセットに対する実証的な評価は、我々のアプローチが同等または上位のパフォーマンスを達成することを示す。
論文 参考訳(メタデータ) (2025-06-11T06:59:17Z) - Combining Deep Learning and Optimization for Security-Constrained
Optimal Power Flow [94.24763814458686]
セキュリティに制約のある最適電力フロー(SCOPF)は、電力システムの基本である。
SCOPF問題におけるAPRのモデル化は、複雑な大規模混合整数プログラムをもたらす。
本稿では,ディープラーニングとロバスト最適化を組み合わせた新しい手法を提案する。
論文 参考訳(メタデータ) (2020-07-14T12:38:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。