論文の概要: Decentralized Online Learning in Task Assignment Games for Mobile
Crowdsensing
- arxiv url: http://arxiv.org/abs/2309.10594v1
- Date: Tue, 19 Sep 2023 13:07:15 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-20 14:34:29.044378
- Title: Decentralized Online Learning in Task Assignment Games for Mobile
Crowdsensing
- Title(参考訳): モバイルクラウドセンシングのためのタスク割り当てゲームにおける分散オンライン学習
- Authors: Bernd Simon, Andrea Ortiz, Walid Saad, Anja Klein
- Abstract要約: モバイルクラウドセンシングプラットフォーム(MCSP)は、センサオファーをMCSPに送り返してタスクに参加する意思を示すための、利用可能なモバイルユニット(MU)に順次、センシングタスクを発行する。
安定したタスク割り当ては、MCSPとMUの相反する目標、およびMUの要求する努力と嗜好の不確実性という2つの課題に対処する必要がある。
これらの課題を克服するために,衝突回避型マルチアームバンディットと戦略的自由センシング(CA-MAB-SFS)という,マッチング理論とオンライン学習を組み合わせた新たな分散アプローチを提案する。
- 参考スコア(独自算出の注目度): 55.07662765269297
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The problem of coordinated data collection is studied for a mobile
crowdsensing (MCS) system. A mobile crowdsensing platform (MCSP) sequentially
publishes sensing tasks to the available mobile units (MUs) that signal their
willingness to participate in a task by sending sensing offers back to the
MCSP. From the received offers, the MCSP decides the task assignment. A stable
task assignment must address two challenges: the MCSP's and MUs' conflicting
goals, and the uncertainty about the MUs' required efforts and preferences. To
overcome these challenges a novel decentralized approach combining matching
theory and online learning, called collision-avoidance multi-armed bandit with
strategic free sensing (CA-MAB-SFS), is proposed. The task assignment problem
is modeled as a matching game considering the MCSP's and MUs' individual goals
while the MUs learn their efforts online. Our innovative "free-sensing"
mechanism significantly improves the MU's learning process while reducing
collisions during task allocation. The stable regret of CA-MAB-SFS, i.e., the
loss of learning, is analytically shown to be bounded by a sublinear function,
ensuring the convergence to a stable optimal solution. Simulation results show
that CA-MAB-SFS increases the MUs' and the MCSP's satisfaction compared to
state-of-the-art methods while reducing the average task completion time by at
least 16%.
- Abstract(参考訳): モバイルクラウドセンシング(MCS)システムにおける協調データ収集の問題点について検討した。
モバイルクラウドセンシングプラットフォーム(MCSP)は、センサオファーをMCSPに送り返してタスクに参加する意思を示すための、利用可能なモバイルユニット(MU)に順次センシングタスクを発行する。
受信されたオファーから、MCSPはタスク割り当てを決定する。
安定したタスク割り当ては、MCSPとMUの相反する目標、およびMUの要求する努力と嗜好の不確実性という2つの課題に対処する必要がある。
これらの課題を克服するために,戦略的自由センシング(ca-mab-sfs)を用いた,マッチング理論とオンライン学習を組み合わせた新しい分散アプローチを提案する。
タスク割り当て問題は、MCSPとMUの個人目標を考慮したマッチングゲームとしてモデル化され、MUはオンラインで彼らの努力を学習する。
革新的"フリーセンシング"機構は,タスク割り当て時の衝突を低減しつつ,muの学習プロセスを大幅に改善する。
CA-MAB-SFSの安定な後悔、すなわち学習の損失は、解析的に部分線型関数によって束縛され、安定な最適解への収束を保証する。
シミュレーションの結果、CA-MAB-SFSは、最先端手法と比較してMUsとMCSPの満足度を高め、平均タスク完了時間を少なくとも16%削減した。
関連論文リスト
- MTLComb: multi-task learning combining regression and classification tasks for joint feature selection [3.708475728683911]
マルチタスク学習(Multi-task learning、MTL)は、複数の通信アルゴリズムの同時学習を可能にする学習パラダイムである。
本稿では、回帰と分類タスクのバランスをとるための最適な重み付けを解析的に決定する、証明可能な損失重み付け手法を提案する。
MTLアルゴリズムとソフトウェアパッケージであるMTLCombを導入し、最適化手順、トレーニングプロトコル、ハイパーパラメータ推定手順を紹介する。
論文 参考訳(メタデータ) (2024-05-16T08:07:25Z) - Cross-head mutual Mean-Teaching for semi-supervised medical image
segmentation [6.738522094694818]
SSMIS(Semi-supervised Medical Image segmentation)は、限られたラベル付きデータと豊富なラベルなしデータを活用することで、大幅な進歩を目撃している。
既存のSOTA(State-of-the-art)手法は、ラベルなしデータのラベルを正確に予測する際の課題に直面する。
強弱データ拡張を組み込んだ新しいクロスヘッド相互学習ネットワーク(CMMT-Net)を提案する。
論文 参考訳(メタデータ) (2023-10-08T09:13:04Z) - Semantically Aligned Task Decomposition in Multi-Agent Reinforcement
Learning [56.26889258704261]
我々は,MARL(SAMA)における意味的アライズされたタスク分解という,新しい「不整合」意思決定手法を提案する。
SAMAは、潜在的な目標を示唆し、適切な目標分解とサブゴールアロケーションを提供するとともに、自己回帰に基づくリプランニングを提供する、チェーン・オブ・シントによる事前訓練された言語モデルを促進する。
SAMAは, 最先端のASG法と比較して, 試料効率に有意な優位性を示す。
論文 参考訳(メタデータ) (2023-05-18T10:37:54Z) - Solving Continuous Control via Q-learning [54.05120662838286]
深いQ-ラーニングの簡単な修正は、アクター批判的手法による問題を大幅に軽減することを示します。
バンバン動作の離散化と値分解、協調マルチエージェント強化学習(MARL)としての単一エージェント制御のフレーミングにより、このシンプルな批判のみのアプローチは、最先端の連続アクター批判法の性能と一致する。
論文 参考訳(メタデータ) (2022-10-22T22:55:50Z) - FedGradNorm: Personalized Federated Gradient-Normalized Multi-Task
Learning [50.756991828015316]
マルチタスク学習(MTL)は、1つの共有ネットワークで複数のタスクを同時に学習する新しいフレームワークである。
本稿では,異なるタスク間の学習速度のバランスをとるために,動的重み付け法を用いてノルムの正規化を行うFedGradNormを提案する。
論文 参考訳(メタデータ) (2022-03-24T17:43:12Z) - Decentralized Multi-Agent Reinforcement Learning for Task Offloading
Under Uncertainty [24.083871784808473]
MARL(Multi-Agent Reinforcement Learning)は、強化学習の課題である。
タスクオフロード問題を解くために、ディープMARLアルゴリズムが適用されている。
報奨信号の摂動は, 完全報奨学習と比較して, 性能の低下を招き得ることを示す。
論文 参考訳(メタデータ) (2021-07-16T20:49:30Z) - Multi-task Over-the-Air Federated Learning: A Non-Orthogonal
Transmission Approach [52.85647632037537]
複数の学習タスクがエッジサーバ(ES)の協調の下でデータ収集および学習モデルのためのエッジデバイスを共有するマルチタスク・オーバーテア・フェデレーション・ラーニング(MOAFL)フレームワークを提案する。
収束解析と数値計算の両方の結果から,MOAFLフレームワークは学習性能を著しく低下させることなく,複数のタスクのアップリンク帯域幅の消費を大幅に削減できることが示された。
論文 参考訳(メタデータ) (2021-06-27T13:09:32Z) - Federated Learning-Based Risk-Aware Decision toMitigate Fake Task
Impacts on CrowdsensingPlatforms [9.925311092487851]
モバイルクラウドセンシング(MCS)は、多数のモバイルスマートデバイスでセンサーを活用することで、分散および非専用センシングの概念を活用します。
MCSプラットフォームに偽の検知タスクを送信した悪意のあるユーザは、参加者のデバイスからリソースを消費しようとするかもしれない。
多数の独立した検出装置と集約エンティティを含む偽タスクを識別する手法が提案されている。
論文 参考訳(メタデータ) (2021-01-04T22:43:24Z) - Auxiliary-task Based Deep Reinforcement Learning for Participant
Selection Problem in Mobile Crowdsourcing [30.124365580284888]
モバイルのクラウドソーシングでは、複数の目標を達成するために、求職者からの位置情報対応タスクを参加者に選択する。
異なる MCS システムには異なる目標があり、ある MCS システムでも相反する目標が存在する可能性がある。
複数の目標を達成するために,様々なMCSシステムに適用可能な参加者選択アルゴリズムを設計することが重要である。
論文 参考訳(メタデータ) (2020-08-25T15:02:54Z) - Information Freshness-Aware Task Offloading in Air-Ground Integrated
Edge Computing Systems [49.80033982995667]
本稿では,空域統合マルチアクセスエッジコンピューティングシステムにおける情報更新性を考慮したタスクオフロードの問題について検討する。
サードパーティのリアルタイムアプリケーションサービスプロバイダは、InPからの限られた通信と計算リソースで、加入したモバイルユーザ(MU)にコンピューティングサービスを提供する。
本稿では,各MUに2つの個別の深度Q-networksを適用し,Q-factorと後Q-factorを近似する新しい深度強化学習手法を提案する。
論文 参考訳(メタデータ) (2020-07-15T21:32:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。