論文の概要: Incentivized Truthful Communication for Federated Bandits
- arxiv url: http://arxiv.org/abs/2402.04485v1
- Date: Wed, 7 Feb 2024 00:23:20 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-08 17:18:21.873205
- Title: Incentivized Truthful Communication for Federated Bandits
- Title(参考訳): フェデレート・バンディットに対するインセンティブ付き真理コミュニケーション
- Authors: Zhepei Wei, Chuanhao Li, Tianze Ren, Haifeng Xu, Hongning Wang
- Abstract要約: 我々はTrath-FedBanという名前のインセンティブ互換通信プロトコルを提案する。
Truth-FedBanは、オーバーヘッドなしにサブ線形後悔と通信コストを保証します。
- 参考スコア(独自算出の注目度): 61.759855777522255
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: To enhance the efficiency and practicality of federated bandit learning,
recent advances have introduced incentives to motivate communication among
clients, where a client participates only when the incentive offered by the
server outweighs its participation cost. However, existing incentive mechanisms
naively assume the clients are truthful: they all report their true cost and
thus the higher cost one participating client claims, the more the server has
to pay. Therefore, such mechanisms are vulnerable to strategic clients aiming
to optimize their own utility by misreporting. To address this issue, we
propose an incentive compatible (i.e., truthful) communication protocol, named
Truth-FedBan, where the incentive for each participant is independent of its
self-reported cost, and reporting the true cost is the only way to achieve the
best utility. More importantly, Truth-FedBan still guarantees the sub-linear
regret and communication cost without any overheads. In other words, the core
conceptual contribution of this paper is, for the first time, demonstrating the
possibility of simultaneously achieving incentive compatibility and nearly
optimal regret in federated bandit learning. Extensive numerical studies
further validate the effectiveness of our proposed solution.
- Abstract(参考訳): 近年,フェデレーテッド・バンディット学習の効率性と実践性を高めるため,サーバが提供したインセンティブが参加コストを上回る場合にのみ,クライアント間のコミュニケーションを動機付けるインセンティブが導入されている。
しかし、既存のインセンティブメカニズムは、クライアントが真に真理を仮定している。彼らはみな、真価を報告し、従って、あるクライアントが請求する高いコストは、サーバーが払わなければならないほどである。
したがって、このようなメカニズムは、誤った報告によって自らのユーティリティを最適化しようとする戦略的クライアントに対して脆弱である。
この問題に対処するために,各参加者に対するインセンティブが自己申告コストから独立しており,真のコストを報告することが最善の効用を達成する唯一の方法である,真理フェドバン(true-fedban)と呼ばれるインセンティブ互換(すなわち真理)通信プロトコルを提案する。
さらに重要なのは、Trath-FedBanはオーバーヘッドなしにサブ線形後悔と通信コストを保証します。
言い換えれば,本稿の中核となる概念的貢献は,フェデレーテッド・バンディット学習において,インセンティブの適合性とほぼ最適な後悔を同時に達成できることを初めて示すことである。
広範な数値実験により,提案手法の有効性がさらに検証された。
関連論文リスト
- Incentivized Communication for Federated Bandits [67.4682056391551]
我々は,サーバがインセンティブを提供することでクライアントにデータを共有する動機付けを行う,フェデレートされた盗賊に対するインセンティブ付きコミュニケーション問題を導入する。
本稿では,実証可能な通信とインセンティブコスト保証により,ほぼ最適の後悔を実現する,最初のインセンティブ付き通信プロトコルであるInc-FedUCBを提案する。
論文 参考訳(メタデータ) (2023-09-21T00:59:20Z) - Incentivizing Honesty among Competitors in Collaborative Learning and
Optimization [5.4619385369457225]
協調学習技術は、単一のエンティティのデータでトレーニングされたモデルよりも優れた機械学習モデルを可能にする可能性がある。
多くの場合、このような協調的なスキームの潜在的な参加者は、下流のタスクで競合する。
論文 参考訳(メタデータ) (2023-05-25T17:28:41Z) - Incentive Mechanism Design for Unbiased Federated Learning with
Randomized Client Participation [31.2017942327673]
本稿では,ランダムなクライアント参加を伴うフェデレーション学習(FL)のためのゲーム理論インセンティブ機構を提案する。
我々は,サーバのモデル性能向上とクライアントの利益向上を両立させることを実証した。
論文 参考訳(メタデータ) (2023-04-17T04:05:57Z) - Mechanisms that Incentivize Data Sharing in Federated Learning [90.74337749137432]
我々は、データ共有の利点が完全に損なわれているような、ナイーブなスキームが破滅的なフリーライディングのレベルにどのように結びつくかを示す。
次に,各エージェントが生成するデータ量を最大化する精度形成機構を導入する。
論文 参考訳(メタデータ) (2022-07-10T22:36:52Z) - Communication Efficient Distributed Learning for Kernelized Contextual
Bandits [58.78878127799718]
分散環境でのカーネル化されたコンテキスト帯域の学習における通信効率の課題に対処する。
我々は、エージェントが再現されたカーネルヒルベルト空間で協調的に探索できるようにすることにより、非線形報酬写像を考える。
我々は, 後悔とコミュニケーションの両コストにおいて, アルゴリズムがサブ線形レートを達成できることを厳格に証明した。
論文 参考訳(メタデータ) (2022-06-10T01:39:15Z) - GAC: A Deep Reinforcement Learning Model Toward User Incentivization in
Unknown Social Networks [3.3946853660795884]
本稿では,GAC(Geometric Actor-Critic)と呼ばれるエンドツーエンドの強化学習に基づくフレームワークを提案する。
提案したGACの性能を評価するために,実世界の3つのソーシャルネットワークデータセットを用いた。
論文 参考訳(メタデータ) (2022-03-17T19:41:49Z) - Probabilistically Robust Recourse: Navigating the Trade-offs between
Costs and Robustness in Algorithmic Recourse [34.39887495671287]
本稿では,達成された(反感)と所望のリコース無効率とのギャップを同時に最小化する目的関数を提案する。
我々は,任意のインスタンスに対応するリコース無効化率を特徴付けるために,新しい理論的結果を開発した。
複数の実世界のデータセットを用いた実験により,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2022-03-13T21:39:24Z) - The Efficiency Misnomer [50.69516433266469]
我々は、共通のコスト指標、それらの利点とデメリット、そしてそれらが相互に矛盾する方法について論じる。
コストインジケータの不完全な報告が、どのようにして部分的な結論をもたらすかを示し、異なるモデルの実践的考察の曖昧さや不完全さを図示する。
論文 参考訳(メタデータ) (2021-10-25T12:48:07Z) - Cost-Sensitive Portfolio Selection via Deep Reinforcement Learning [100.73223416589596]
深層強化学習を用いたコスト依存型ポートフォリオ選択手法を提案する。
具体的には、価格系列パターンと資産相関の両方を抽出するために、新しい2ストリームポートフォリオポリシーネットワークを考案した。
蓄積したリターンを最大化し、強化学習によるコストの両立を抑えるため、新たなコスト感受性報酬関数が開発された。
論文 参考訳(メタデータ) (2020-03-06T06:28:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。