論文の概要: A Semi-supervised Sensing Rate Learning based CMAB Scheme to Combat
COVID-19 by Trustful Data Collection in the Crowd
- arxiv url: http://arxiv.org/abs/2301.08563v1
- Date: Tue, 17 Jan 2023 08:37:20 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-29 13:49:32.898981
- Title: A Semi-supervised Sensing Rate Learning based CMAB Scheme to Combat
COVID-19 by Trustful Data Collection in the Crowd
- Title(参考訳): 半教師付きセンシングレート学習による集団内の信頼データ収集によるcovid-19対策cmab
- Authors: Jianheng Tang, Kejia Fan, Wenxuan Xie, Luomin Zeng, Feijiang Han,
Guosheng Huang, Tian Wang, Anfeng Liu, Shaobo Zhang
- Abstract要約: Mobile CrowdSensing (MCS)は、多くの大規模アプリケーションを低コストで構築するための有望なパラダイムとして認識されている。
信頼性と質の高い労働者の採用は、MCSにとって重要な研究課題である。
従来の研究では、労働者の質が事前に知られているか、収集されたデータを受け取ったらそのプラットフォームが労働者の質を知っていると推測されていた。
- 参考スコア(独自算出の注目度): 13.629569862729811
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Mobile CrowdSensing (MCS), through employing considerable workers to sense
and collect data in a participatory manner, has been recognized as a promising
paradigm for building many large-scale applications in a cost-effective way,
such as combating COVID-19. The recruitment of trustworthy and high-quality
workers is an important research issue for MCS. Previous studies assume that
the qualities of workers are known in advance, or the platform knows the
qualities of workers once it receives their collected data. In reality, to
reduce their costs and thus maximize revenue, many strategic workers do not
perform their sensing tasks honestly and report fake data to the platform. So,
it is very hard for the platform to evaluate the authenticity of the received
data. In this paper, an incentive mechanism named Semi-supervision based
Combinatorial Multi-Armed Bandit reverse Auction (SCMABA) is proposed to solve
the recruitment problem of multiple unknown and strategic workers in MCS.
First, we model the worker recruitment as a multi-armed bandit reverse auction
problem, and design an UCB-based algorithm to separate the exploration and
exploitation, considering the Sensing Rates (SRs) of recruited workers as the
gain of the bandit. Next, a Semi-supervised Sensing Rate Learning (SSRL)
approach is proposed to quickly and accurately obtain the workers' SRs, which
consists of two phases, supervision and self-supervision. Last, SCMABA is
designed organically combining the SRs acquisition mechanism with multi-armed
bandit reverse auction, where supervised SR learning is used in the
exploration, and the self-supervised one is used in the exploitation. We prove
that our SCMABA achieves truthfulness and individual rationality. Additionally,
we exhibit outstanding performances of the SCMABA mechanism through in-depth
simulations of real-world data traces.
- Abstract(参考訳): モバイルクラウドセンシング(MCS)は、大量の労働者を駆使して参加的な方法でデータを収集し、新型コロナウイルスとの戦いのようなコスト効率の高い方法で大規模アプリケーションを構築するための有望なパラダイムとして認識されている。
信頼性と質の高い労働者の採用は、MCSにとって重要な研究課題である。
以前の研究では、労働者の質は事前に分かっているか、あるいは収集されたデータを受け取ると、プラットフォームは労働者の質を知っていると仮定している。
実際、コストを削減し収益を最大化するために、多くの戦略労働者はセンシングタスクを正直に実行せず、プラットフォームに偽のデータを報告します。
したがって、プラットフォームが受信したデータの真正性を評価することは極めて困難である。
本稿では、MCSにおける複数の未知の戦略的労働者の求人問題を解決するために、セミスーパービジョンベースの Combinatorial Multi-Armed Bandit reverse Auction (SCMABA) というインセンティブメカニズムを提案する。
まず,マルチアームバンディット逆オークション問題として労働者採用をモデル化し,採用労働者のセンサレート(SR)をバンディットの利得として考慮し,UCBに基づく探索と搾取を分離するアルゴリズムを設計する。
次に,SSRL(Semi-supervised Sensing Rate Learning)アプローチを提案し,労働者のSRを迅速かつ正確に取得する。
最後に, SCMABAは, SRs獲得機構とマルチアーム・バンドイット・リバース・オークションを有機的に組み合わせて設計し, 探索には教師付きSR学習, 搾取には自己教師付きSR学習を用いる。
我々は、SCMABAが真理性と個人的合理性を達成することを証明している。
さらに,実世界のデータトレースの詳細なシミュレーションを通じて,SCMABA機構の優れた性能を示す。
関連論文リスト
- Analyzing Probabilistic Methods for Evaluating Agent Capabilities [0.6990493129893112]
本稿では,AIエージェントが与えられたタスクを完了した確率をよりよく推定することを目的とした2つの手法を提案する。
マイルストーン法はタスクをサブタスクに分解し、全体の成功率推定を改善する。
専門家のベスト・オブ・N法は、モデルの独立したパフォーマンスのプロキシとして人間のガイダンスを活用する。
論文 参考訳(メタデータ) (2024-09-24T14:35:20Z) - Multi-Agent Reinforcement Learning from Human Feedback: Data Coverage and Algorithmic Techniques [65.55451717632317]
我々は,MARLHF(Multi-Agent Reinforcement Learning from Human Feedback)について検討し,理論的基礎と実証的検証の両方について検討した。
我々は,このタスクを,一般ゲームにおける嗜好のみのオフラインデータセットからナッシュ均衡を識別するものとして定義する。
本研究は,MARLHFの多面的アプローチを基礎として,効果的な嗜好に基づくマルチエージェントシステムの実現を目指している。
論文 参考訳(メタデータ) (2024-09-01T13:14:41Z) - Malicious Agent Detection for Robust Multi-Agent Collaborative Perception [52.261231738242266]
多エージェント協調(MAC)知覚は、単エージェント認識よりも敵攻撃に対して脆弱である。
MAC知覚に特異的な反応防御であるMADE(Malicious Agent Detection)を提案する。
我々は、ベンチマーク3DデータセットV2X-simとリアルタイムデータセットDAIR-V2Xで包括的な評価を行う。
論文 参考訳(メタデータ) (2023-10-18T11:36:42Z) - Pure Exploration in Asynchronous Federated Bandits [57.02106627533004]
マルチアームバンディットとリニアバンディットのフェデレートされた純粋な探索問題について検討し、M$エージェントが中央サーバとの通信を通じて最適なアームを協調的に識別する方法について検討した。
信頼度を固定した純粋探索のための非同期マルチアームバンディットおよび線形バンディットアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-10-17T06:04:00Z) - Robustness Testing for Multi-Agent Reinforcement Learning: State
Perturbations on Critical Agents [2.5204420653245245]
MARL(Multi-Agent Reinforcement Learning)は、スマート交通や無人航空機など、多くの分野に広く応用されている。
本研究は,MARLのための新しいロバストネステストフレームワークを提案する。
論文 参考訳(メタデータ) (2023-06-09T02:26:28Z) - MA2CL:Masked Attentive Contrastive Learning for Multi-Agent
Reinforcement Learning [128.19212716007794]
我々はtextbfMulti-textbfAgent textbfMasked textbfAttentive textbfContrastive textbfLearning (MA2CL) という効果的なフレームワークを提案する。
MA2CLは、潜伏空間におけるマスクされたエージェント観察を再構築することにより、時間的およびエージェントレベルの予測の両方の学習表現を奨励する。
提案手法は,様々なMARLアルゴリズムの性能とサンプル効率を大幅に向上させ,様々な視覚的,状態的シナリオにおいて,他の手法よりも優れる。
論文 参考訳(メタデータ) (2023-06-03T05:32:19Z) - Taming Multi-Agent Reinforcement Learning with Estimator Variance
Reduction [12.94372063457462]
分散実行(CT-DE)による集中トレーニングは、多くの主要なマルチエージェント強化学習(MARL)アルゴリズムの基礎となっている。
特定の状態における共同行動の単一のサンプルから学ぶことに依存しているため、これは重大な欠点に悩まされる。
本稿では,アクター・クリティカルなMARL法に対応する拡張ツールを提案する。
論文 参考訳(メタデータ) (2022-09-02T13:44:00Z) - Federated Multi-Armed Bandits Under Byzantine Attacks [8.974667651758095]
FMAB(Federated Multi-armed Bandits)は、学習者がMABゲームをし、集約されたフィードバックをサーバに伝達し、グローバルな最適なアームを学ぶための新興フレームワークである。
本研究では,学習プロセスを脅かす偽モデル更新を送信できるビザンティンクライアントの存在下でのFMAB問題について検討する。
我々は,ビザンティンの顧客に対応するために,中央値平均オンラインアルゴリズムであるFed-MoM-UCBを提案する。
論文 参考訳(メタデータ) (2022-05-09T09:06:42Z) - Relative Distributed Formation and Obstacle Avoidance with Multi-agent
Reinforcement Learning [20.401609420707867]
マルチエージェント強化学習(MARL)に基づく分散生成・障害物回避手法を提案する。
提案手法は, 障害物回避における生成誤差, 生成収束率, オンパー成功率に関して, ベースラインと比較して高い性能を実現する。
論文 参考訳(メタデータ) (2021-11-14T13:02:45Z) - COVI-AgentSim: an Agent-based Model for Evaluating Methods of Digital
Contact Tracing [68.68882022019272]
COVI-AgentSimは、ウイルス学、病気の進行、社会的接触ネットワーク、移動パターンに基づくエージェントベースのコンパートメンタルシミュレータである。
1)バイナリテスト結果に基づいてバイナリレコメンデーションを割り当てる標準バイナリコンタクトトレース (BCT) と,2) 多様な特徴に基づいてグレードレベルのレコメンデーションを割り当てる特徴ベースコンタクトトレース (FCT) のルールベースの手法である。
論文 参考訳(メタデータ) (2020-10-30T00:47:01Z) - Scalable Multi-Agent Inverse Reinforcement Learning via
Actor-Attention-Critic [54.2180984002807]
マルチエージェント逆逆強化学習 (MA-AIRL) は, 単エージェントAIRLをマルチエージェント問題に適用する最近の手法である。
本稿では,従来の手法よりもサンプル効率が高く,スケーラブルなマルチエージェント逆RLアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-02-24T20:30:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。