論文の概要: Federated Reinforcement Learning for Efficient Mobile Crowdsensing under Incomplete Information
- arxiv url: http://arxiv.org/abs/2605.02705v1
- Date: Mon, 04 May 2026 15:13:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:50.361582
- Title: Federated Reinforcement Learning for Efficient Mobile Crowdsensing under Incomplete Information
- Title(参考訳): 不完全情報に基づく効率的なモバイルクラウドセンシングのためのフェデレーション強化学習
- Authors: Sumedh J. Dongare, Patrick Weber, Andrea Ortiz, Walid Saad, Oliver Hinz, Anja Klein,
- Abstract要約: 移動群集センシング(Mobile crowdsensing, MCS)は, 移動体(MU)上の既存のセンサを用いて, センサタスクを実行する分散センシングアーキテクチャである。
モバイルクラウドセンシングプラットフォーム(MCSP)は、センシングタスクを公開し、MUが金銭と引き換えに参加するかを決定する。
MUは、MCSPが完了したタスク数の最大化に重点を置いている間、彼らの収入を最大化するための効率的なタスク参加戦略を見つけることを目的としている。
FDRL-PPOという完全分散化した深層強化学習アルゴリズムが提案されている。
- 参考スコア(独自算出の注目度): 37.05598500605439
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Mobile crowdsensing (MCS) is a distributed sensing architecture that utilizes existing sensors on mobile units (MUs) to perform sensing tasks. A mobile crowdsensing platform (MCSP) publishes the sensing tasks and the MUs decide whether to participate in exchange for money. The MCS system is dynamic: the task requirements, the MUs' availability, and their available resources change over time. The MUs aim to find an efficient task participation strategy to maximize their income while the MCSP focuses on maximizing the number of completed tasks. As optimal strategies require perfect non-causal information about the MCS system, which is unavailable in realistic scenarios, the main challenge is to find an efficient task participation strategy for the MUs under incomplete information. To this end, a novel fully decentralized federated deep reinforcement learning algorithm, FDRL-PPO, is proposed. FDRL-PPO enables every MU to learn its own task participation strategy based on its experiences, available resources, and preferences, without relying on perfect non-causal information about the MCS system. To replenish their batteries, the MUs rely on energy harvesting. As a result, their available energy varies over time, leading to varying availability and fragmented learning experiences. To mitigate these challenges, the proposed approach leverages federated learning, enabling MUs to collaboratively improve their models without sharing private raw data like their own experiences. By exchanging only learned models, MUs collectively compensate for individual limitations, and find more scalable, robust, and efficient task participation strategies. Comprehensive evaluations on both synthetic and real-world datasets show that FDRL-PPO consistently outperforms benchmark algorithms in terms of task completion ratio, fairness in task completion, energy consumption, and number of conflicting proposals.
- Abstract(参考訳): 移動群集センシング(Mobile crowdsensing, MCS)は, 移動体(MU)上の既存のセンサを用いて, センサタスクを実行する分散センシングアーキテクチャである。
モバイルクラウドセンシングプラットフォーム(MCSP)は、センシングタスクを公開し、MUが金銭と引き換えに参加するかを決定する。
MCSシステムは動的で、タスク要求、MUの可用性、利用可能なリソースは時間とともに変化する。
MUは、MCSPが完了したタスク数の最大化に重点を置いている間、彼らの収入を最大化するための効率的なタスク参加戦略を見つけることを目的としている。
最適戦略は、現実的なシナリオでは利用できないMCSシステムに関する完全な非因果的情報を必要とするため、主要な課題は、不完全な情報の下でMUの効率的なタスク参加戦略を見つけることである。
そこで本研究では,FDRL-PPOという完全分散型深層強化学習アルゴリズムを提案する。
FDRL-PPOは、すべてのMUが、MCSシステムに関する完全な非因果的情報に頼ることなく、その経験、利用可能なリソース、好みに基づいて、独自のタスク参加戦略を学ぶことができる。
電池を補充するため、MUはエネルギー収穫に依存している。
その結果、利用可能なエネルギーは時間とともに変化し、様々な可用性と断片化された学習体験をもたらす。
これらの課題を軽減するため、提案されたアプローチでは、フェデレートされた学習を活用し、MUが自身の経験のようにプライベートな生データを共有することなく、モデルを改善することができる。
学習したモデルのみを交換することで、MUは個々の制限をまとめて補償し、よりスケーラブルで堅牢で効率的なタスク参加戦略を見つける。
FDRL-PPOは, タスク完了率, タスク完了の公平性, エネルギー消費, 競合する提案数の観点から, ベンチマークアルゴリズムを一貫して上回っている。
関連論文リスト
- WebSailor-V2: Bridging the Chasm to Proprietary Agents via Synthetic Data and Scalable Reinforcement Learning [73.91893534088798]
WebSailorは、この重要な機能を組み込むように設計された、完全なポストトレーニング方法論である。
我々のアプローチは、構造化サンプリングと情報難読化によって、新しい、不確実なタスクを生成することである。
WebSailorは複雑な情報検索タスクにおいて、すべてのオープンソースエージェントを著しく上回る。
論文 参考訳(メタデータ) (2025-09-16T17:57:03Z) - Balancing Multimodal Training Through Game-Theoretic Regularization [26.900302082724295]
マルチモーダル学習は、データソース間の依存関係をキャプチャすることで、よりリッチな情報抽出を約束する。
しかし、現在のトレーニング手法は、しばしばモダリティの競争によって性能が低下する。
本稿では、相互情報分解(MI)に触発されたMCR(Multimodal Competition Regularizer)を提案する。
論文 参考訳(メタデータ) (2024-11-11T19:53:05Z) - Decentralized Online Learning in Task Assignment Games for Mobile
Crowdsensing [55.07662765269297]
モバイルクラウドセンシングプラットフォーム(MCSP)は、センサオファーをMCSPに送り返してタスクに参加する意思を示すための、利用可能なモバイルユニット(MU)に順次、センシングタスクを発行する。
安定したタスク割り当ては、MCSPとMUの相反する目標、およびMUの要求する努力と嗜好の不確実性という2つの課題に対処する必要がある。
これらの課題を克服するために,衝突回避型マルチアームバンディットと戦略的自由センシング(CA-MAB-SFS)という,マッチング理論とオンライン学習を組み合わせた新たな分散アプローチを提案する。
論文 参考訳(メタデータ) (2023-09-19T13:07:15Z) - Energy-Efficient Multi-Orchestrator Mobile Edge Learning [54.28419430315478]
Mobile Edge Learning(MEL)は、エッジデバイス上で機械学習(ML)モデルの分散トレーニングを特徴とする、協調学習パラダイムである。
MELでは、異なるデータセットで複数の学習タスクが共存する可能性がある。
本稿では, エネルギー消費, 精度, 解複雑性のトレードオフを容易にする軽量なアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-09-02T07:37:10Z) - Dif-MAML: Decentralized Multi-Agent Meta-Learning [54.39661018886268]
我々は,MAML や Dif-MAML と呼ばれる協調型マルチエージェントメタ学習アルゴリズムを提案する。
提案手法により, エージェントの集合が線形速度で合意に達し, 集約MAMLの定常点に収束できることを示す。
シミュレーションの結果は従来の非協調的な環境と比較して理論的な結果と優れた性能を示している。
論文 参考訳(メタデータ) (2020-10-06T16:51:09Z) - Auxiliary-task Based Deep Reinforcement Learning for Participant
Selection Problem in Mobile Crowdsourcing [30.124365580284888]
モバイルのクラウドソーシングでは、複数の目標を達成するために、求職者からの位置情報対応タスクを参加者に選択する。
異なる MCS システムには異なる目標があり、ある MCS システムでも相反する目標が存在する可能性がある。
複数の目標を達成するために,様々なMCSシステムに適用可能な参加者選択アルゴリズムを設計することが重要である。
論文 参考訳(メタデータ) (2020-08-25T15:02:54Z) - Information Freshness-Aware Task Offloading in Air-Ground Integrated
Edge Computing Systems [49.80033982995667]
本稿では,空域統合マルチアクセスエッジコンピューティングシステムにおける情報更新性を考慮したタスクオフロードの問題について検討する。
サードパーティのリアルタイムアプリケーションサービスプロバイダは、InPからの限られた通信と計算リソースで、加入したモバイルユーザ(MU)にコンピューティングサービスを提供する。
本稿では,各MUに2つの個別の深度Q-networksを適用し,Q-factorと後Q-factorを近似する新しい深度強化学習手法を提案する。
論文 参考訳(メタデータ) (2020-07-15T21:32:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。