論文の概要: Satisfaction-Aware Incentive Scheme for Federated Learning in Industrial Metaverse: DRL-Based Stackbelberg Game Approach
- arxiv url: http://arxiv.org/abs/2502.06909v1
- Date: Mon, 10 Feb 2025 03:33:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-12 14:08:39.794549
- Title: Satisfaction-Aware Incentive Scheme for Federated Learning in Industrial Metaverse: DRL-Based Stackbelberg Game Approach
- Title(参考訳): 産業メタバースにおけるフェデレーション学習のための満足度を考慮したインセンティブスキーム:DRLに基づくStackbelbergゲームアプローチ
- Authors: Xiaohuan Li, Shaowen Qin, Xin Tang, Jiawen Kang, Jin Ye, Zhonghua Zhao, Dusit Niyato,
- Abstract要約: Industrial Metaverseはフェデレーション学習とメタコンピューティングを使用して、データのプライバシを確保しながら、モデルを分散的にトレーニングする。
本稿では、データサイズ、年齢情報(AoI)、学習遅延を考慮に入れた満足度関数を設計する。
満足度関数は、モデルトレーニングにおけるノード参加を動機付けるユーティリティ関数に組み込まれる。
- 参考スコア(独自算出の注目度): 52.79672516203574
- License:
- Abstract: Industrial Metaverse leverages the Industrial Internet of Things (IIoT) to integrate data from diverse devices, employing federated learning and meta-computing to train models in a distributed manner while ensuring data privacy. Achieving an immersive experience for industrial Metaverse necessitates maintaining a balance between model quality and training latency. Consequently, a primary challenge in federated learning tasks is optimizing overall system performance by balancing model quality and training latency. This paper designs a satisfaction function that accounts for data size, Age of Information (AoI), and training latency. Additionally, the satisfaction function is incorporated into the utility functions to incentivize node participation in model training. We model the utility functions of servers and nodes as a two-stage Stackelberg game and employ a deep reinforcement learning approach to learn the Stackelberg equilibrium. This approach ensures balanced rewards and enhances the applicability of the incentive scheme for industrial Metaverse. Simulation results demonstrate that, under the same budget constraints, the proposed incentive scheme improves at least 23.7% utility compared to existing schemes without compromising model accuracy.
- Abstract(参考訳): Industrial Metaverseは、Industrial Internet of Things(IIoT)を活用して、さまざまなデバイスからのデータを統合する。
産業用メタバースの没入型エクスペリエンスを実現するには、モデル品質とトレーニングのレイテンシのバランスを維持する必要がある。
その結果、フェデレートされた学習タスクにおける最大の課題は、モデル品質とトレーニングレイテンシのバランスをとることによって、システム全体のパフォーマンスを最適化することである。
本稿では、データサイズ、年齢情報(AoI)、学習遅延を考慮に入れた満足度関数を設計する。
さらに、モデルトレーニングにおけるノード参加を動機付けるユーティリティ機能に満足度関数が組み込まれている。
サーバとノードのユーティリティ機能を2段階のStackelbergゲームとしてモデル化し、Stackelberg平衡の学習に深層強化学習アプローチを用いる。
このアプローチは、バランスの取れた報酬を保証し、産業メタバースに対するインセンティブスキームの適用性を高める。
シミュレーションの結果、同じ予算制約の下では、提案されたインセンティブスキームは、モデル精度を損なうことなく、既存のスキームと比較して少なくとも23.7%の実用性を向上させることが示されている。
関連論文リスト
- A Unified Knowledge-Distillation and Semi-Supervised Learning Framework to Improve Industrial Ads Delivery Systems [19.0143243243314]
産業広告ランキングシステムは従来、ラベル付きインプレッションデータに依存しており、過度な適合、モデルのスケーリングによる漸進的な増加、トレーニングとサービスデータの相違によるバイアスといった課題につながっている。
広告ランク付けのための知識・蒸留・半教師付き学習(UK)のための統一フレームワークを提案する。
論文 参考訳(メタデータ) (2025-02-05T23:14:07Z) - MetaTrading: An Immersion-Aware Model Trading Framework for Vehicular Metaverse Services [94.61039892220037]
本稿では,車載メタバースにおける拡張現実(AR)サービスの学習モデルを支援するために,メタバースユーザ(MU)にインセンティブを与える新しい没入型モデルトレーディングフレームワークを提案する。
動的ネットワーク条件とプライバシの懸念を考慮して、マルチエージェントマルコフ決定プロセスとしてMSPの報酬決定を定式化する。
実験により,提案フレームワークは,実AR関連車両データセット上でのARサービスにおいて,オブジェクト検出と分類のための高価値モデルを効果的に提供できることが示されている。
論文 参考訳(メタデータ) (2024-10-25T16:20:46Z) - Leveraging Foundation Models for Multi-modal Federated Learning with Incomplete Modality [41.79433449873368]
我々は、事前学習完了(FedMVP)を用いた新しいマルチモーダル・コントラスト学習法、フェデレーション・マルチモーダル・コントラストVeトレーニングを提案する。
FedMVPは、大規模な事前トレーニングモデルを統合して、フェデレーショントレーニングを強化する。
実世界の2つの画像テキスト分類データセットよりも優れた性能を示す。
論文 参考訳(メタデータ) (2024-06-16T19:18:06Z) - Model-Based Reinforcement Learning with Multi-Task Offline Pretraining [59.82457030180094]
本稿では,オフラインデータから新しいタスクへ,潜在的に有用なダイナミックスや動作デモを伝達するモデルベースRL法を提案する。
主な考え方は、世界モデルを行動学習のシミュレーターとしてだけでなく、タスクの関連性を測定するツールとして使うことである。
本稿では,Meta-WorldとDeepMind Control Suiteの最先端手法と比較して,我々のアプローチの利点を実証する。
論文 参考訳(メタデータ) (2023-06-06T02:24:41Z) - End-to-End Meta-Bayesian Optimisation with Transformer Neural Processes [52.818579746354665]
本稿では,ニューラルネットワークを一般化し,トランスフォーマーアーキテクチャを用いて獲得関数を学習する,エンド・ツー・エンドの差別化可能な最初のメタBOフレームワークを提案する。
我々は、この強化学習(RL)によるエンドツーエンドのフレームワークを、ラベル付き取得データの欠如に対処できるようにします。
論文 参考訳(メタデータ) (2023-05-25T10:58:46Z) - Stochastic Coded Federated Learning: Theoretical Analysis and Incentive
Mechanism Design [18.675244280002428]
我々は、コード化されたコンピューティング技術を活用する新しいFLフレームワーク、コード付きフェデレーションラーニング(SCFL)を提案する。
SCFLでは、各エッジデバイスがプライバシを保存するコード化されたデータセットをサーバにアップロードする。
SCFLは、与えられた時間内でより良いモデルを学び、ベースライン方式よりも優れたプライバシーとパフォーマンスのトレードオフを実現する。
論文 参考訳(メタデータ) (2022-11-08T09:58:36Z) - Improving GANs with A Dynamic Discriminator [106.54552336711997]
我々は、オンザフライで調整可能な判別器は、そのような時間変化に適応できると論じる。
総合的な実証研究により、提案したトレーニング戦略がDynamicDと呼ばれ、追加のコストやトレーニング目標を発生させることなく、合成性能を向上させることが確認された。
論文 参考訳(メタデータ) (2022-09-20T17:57:33Z) - FedDM: Iterative Distribution Matching for Communication-Efficient
Federated Learning [87.08902493524556]
フェデレートラーニング(FL)は近年、学術や産業から注目を集めている。
我々は,複数の局所的代理関数からグローバルなトレーニング目標を構築するためのFedDMを提案する。
そこで本研究では,各クライアントにデータ集合を構築し,元のデータから得られた損失景観を局所的にマッチングする。
論文 参考訳(メタデータ) (2022-07-20T04:55:18Z) - Adaptive Federated Learning and Digital Twin for Industrial Internet of
Things [15.102870055701123]
産業用IoT(Industrial Internet of Things)は、動的およびリアルタイムな産業用デバイスによって異なる分散インテリジェントサービスを可能にし、Industrial 4.0のメリットを享受する。
我々は,デジタル双生児が産業機器の特徴を捉え,連合学習を支援する,デジタル双生児による産業用IoTの新たなアーキテクチャを検討する。
ディジタル双生児はデバイス状態の実際の値から推定偏差をもたらす可能性があることに気付き、フェデレーション学習において信頼に基づく集約を提案し、そのような偏差の影響を軽減する。
論文 参考訳(メタデータ) (2020-10-25T07:59:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。