論文の概要: Near-Optimal Fair Resource Allocation for Strategic Agents without
Money: A Data-Driven Approach
- arxiv url: http://arxiv.org/abs/2311.10927v1
- Date: Sat, 18 Nov 2023 01:21:54 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-22 13:33:48.197219
- Title: Near-Optimal Fair Resource Allocation for Strategic Agents without
Money: A Data-Driven Approach
- Title(参考訳): お金のない戦略エージェントのための最適資源配分--データ駆動アプローチ
- Authors: Sihan Zeng, Sujay Bhatt, Eleonora Kreacic, Parisa Hassanzadeh, Alec
Koppel, Sumitra Ganesh
- Abstract要約: 本研究では,PFをベンチマークとして,資源分割のためのフェアアロケーション機構の学習に基づく設計について検討する。
本稿では,誤レポートからユーティリティの相対的な利得を測定するメカニズムの「エクスロイタビリティ」の概念を紹介する。
提案するメカニズムであるExPF-Netは,低エクスプロイラビリティを維持しつつ,PF機構に強い近似を与えることを示す。
- 参考スコア(独自算出の注目度): 20.771751014539532
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We study learning-based design of fair allocation mechanisms for divisible
resources, using proportional fairness (PF) as a benchmark. The learning
setting is a significant departure from the classic mechanism design
literature, in that, we need to learn fair mechanisms solely from data. In
particular, we consider the challenging problem of learning one-shot allocation
mechanisms -- without the use of money -- that incentivize strategic agents to
be truthful when reporting their valuations. It is well-known that the
mechanism that directly seeks to optimize PF is not incentive compatible,
meaning that the agents can potentially misreport their preferences to gain
increased allocations. We introduce the notion of "exploitability" of a
mechanism to measure the relative gain in utility from misreport, and make the
following important contributions in the paper: (i) Using sophisticated
techniques inspired by differentiable convex programming literature, we design
a numerically efficient approach for computing the exploitability of the PF
mechanism. This novel contribution enables us to quantify the gap that needs to
be bridged to approximate PF via incentive compatible mechanisms. (ii) Next, we
modify the PF mechanism to introduce a trade-off between fairness and
exploitability. By properly controlling this trade-off using data, we show that
our proposed mechanism, ExPF-Net, provides a strong approximation to the PF
mechanism while maintaining low exploitability. This mechanism, however, comes
with a high computational cost. (iii) To address the computational challenges,
we propose another mechanism ExS-Net, which is end-to-end parameterized by a
neural network. ExS-Net enjoys similar (slightly inferior) performance and
significantly accelerated training and inference time performance. (iv)
Extensive numerical simulations demonstrate the robustness and efficacy of the
proposed mechanisms.
- Abstract(参考訳): 本稿では,PFをベンチマークとして,資源分割のためのフェアアロケーション機構の学習に基づく設計について検討する。
学習設定は、古典的なメカニズム設計の文献から大きく離れているため、データのみから公正なメカニズムを学ぶ必要がある。
特に、戦略エージェントがバリュエーションを報告する際に真実であることにインセンティブを与える、一発の割り当てメカニズムを学ぶことの難しさについて検討する。
PFを直接最適化しようとするメカニズムがインセンティブと互換性がないことはよく知られている。
本論文では,ユーティリティーの相対的利得を誤報から測定するメカニズムの「展開可能性」の概念を紹介し,以下の重要な貢献を行う。
i) 微分可能凸プログラミング文学に触発された高度な手法を用いて, PF機構の操作性を計算する数値的手法を設計する。
この新たな貢献により、インセンティブ互換メカニズムを通じてpfの近似に橋渡しする必要があるギャップを定量化することができる。
(二)次に、公正性と利用可能性のトレードオフを導入するため、PFメカニズムを変更します。
データを用いてこのトレードオフを適切に制御することにより,提案するメカニズムであるExPF-Netが,低エクスプロイラビリティを維持しつつ,PF機構に強い近似を与えることを示す。
しかし、このメカニズムには高い計算コストが伴う。
3) 計算課題に対処するため,ニューラルネットワークによって終端パラメータ化される別のメカニズムであるExS-Netを提案する。
ExS-Netは、類似した(わずかに劣る)パフォーマンスを享受し、トレーニングと推論時間のパフォーマンスを著しく加速する。
(4) 大規模数値シミュレーションにより, 提案手法の堅牢性と有効性を示す。
関連論文リスト
- Deep Learning Meets Mechanism Design: Key Results and Some Novel
Applications [1.2661010067882734]
本稿では、関連する文献から、深層学習を用いたメカニズム設計の技術的詳細について述べる。
本稿では,3つのケーススタディにおいて,このアプローチのパワーを実証する。
論文 参考訳(メタデータ) (2024-01-11T06:09:32Z) - Refined Mechanism Design for Approximately Structured Priors via Active
Regression [50.71772232237571]
我々は、大量の商品を戦略的入札者に販売する収益を最大化する販売業者の問題を考える。
この設定の最適かつほぼ最適のメカニズムは、特徴付けや計算が難しいことで有名である。
論文 参考訳(メタデータ) (2023-10-11T20:34:17Z) - No Bidding, No Regret: Pairwise-Feedback Mechanisms for Digital Goods
and Data Auctions [14.87136964827431]
本研究は, 一般的な繰り返しオークション設定に対処する新しいメカニズムを提案する。
メカニズムの新規性は、入札者から情報を引き出すためにペアワイズ比較を使用することにある。
ヒューマンファクターに焦点が当てられていることは、よりヒューマン・アウェアで効率的なメカニズム設計の発展に寄与する。
論文 参考訳(メタデータ) (2023-06-02T18:29:07Z) - Pessimism meets VCG: Learning Dynamic Mechanism Design via Offline
Reinforcement Learning [114.36124979578896]
オフライン強化学習アルゴリズムを用いて動的メカニズムを設計する。
我々のアルゴリズムは悲観主義の原理に基づいており、オフラインデータセットのカバレッジについて軽度な仮定しか必要としない。
論文 参考訳(メタデータ) (2022-05-05T05:44:26Z) - Learning Dynamic Mechanisms in Unknown Environments: A Reinforcement
Learning Approach [130.9259586568977]
本稿では,複数ラウンドの対話を通して動的ビックレー・クラーク・グローブ(VCG)機構を回復するための新しい学習アルゴリズムを提案する。
当社のアプローチの重要な貢献は、報酬のないオンライン強化学習(RL)を取り入れて、リッチな政策分野の探索を支援することである。
論文 参考訳(メタデータ) (2022-02-25T16:17:23Z) - Online Auction-Based Incentive Mechanism Design for Horizontal Federated
Learning with Budget Constraint [9.503584357135832]
フェデレートされた学習は、データ分離を持つすべての関係者が協力的かつ効率的にモデルをトレーニングすることを可能にする。
高品質なモデルを得るには、より高品質な労働者をデータと計算能力で動機付けるためのインセンティブメカニズムが必要である。
本稿では,予算制約を伴う水平的フェデレーション学習のための,逆オークションに基づくオンラインインセンティブ機構を提案する。
論文 参考訳(メタデータ) (2022-01-22T13:37:52Z) - Learning Revenue-Maximizing Auctions With Differentiable Matching [50.62088223117716]
サンプル評価から,インセンティブに適合し,収益を最大化するオークションを大まかに学習する新しいアーキテクチャを提案する。
我々のアーキテクチャはシンクホーンアルゴリズムを用いて、ネットワークが防御的な収益最大化メカニズムを学習できるように、差別化可能な二部マッチングを実行する。
論文 参考訳(メタデータ) (2021-06-15T04:37:57Z) - VCG Mechanism Design with Unknown Agent Values under Stochastic Bandit
Feedback [104.06766271716774]
本研究では,エージェントが自己の価値を知らない場合に,マルチラウンドの福祉最大化機構設計問題について検討する。
まず、福祉に対する後悔の3つの概念、各エージェントの個々のユーティリティ、メカニズムの3つの概念を定義します。
当社のフレームワークは価格体系を柔軟に制御し、エージェントと販売者の後悔のトレードオフを可能にする。
論文 参考訳(メタデータ) (2020-04-19T18:00:58Z) - Generalization Guarantees for Multi-item Profit Maximization: Pricing,
Auctions, and Randomized Mechanisms [86.81403511861788]
購入者の価値に根ざした分布が存在する場合のマルチイテム利益について検討する。
購入者の値の任意のセットに対して、利益はメカニズムのパラメーターにおいて断片的に線形である。
我々は、まだサンプルベースのメカニズム設計文献にはないメカニズムクラスに対する新しい境界を証明した。
論文 参考訳(メタデータ) (2017-04-29T22:02:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。