論文の概要: Learning Payment-Free Resource Allocation Mechanisms
- arxiv url: http://arxiv.org/abs/2311.10927v3
- Date: Wed, 14 Aug 2024 05:54:52 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-15 18:26:43.797181
- Title: Learning Payment-Free Resource Allocation Mechanisms
- Title(参考訳): 支払い不要な資源配分メカニズムの学習
- Authors: Sihan Zeng, Sujay Bhatt, Eleonora Kreacic, Parisa Hassanzadeh, Alec Koppel, Sumitra Ganesh,
- Abstract要約: ニューラルネットワークを用いた自己関心エージェント間のリソース制限機構の設計について検討する。
支払いなしのメカニズム設計に"マネーバーニング"というアイデアを取り入れた、新たなエンドツーエンドニューラルネットワークアーキテクチャであるExS-Netをコントリビュートしています。
- 参考スコア(独自算出の注目度): 19.60309632660988
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We consider the design of mechanisms that allocate limited resources among self-interested agents using neural networks. Unlike the recent works that leverage machine learning for revenue maximization in auctions, we consider welfare maximization as the key objective in the payment-free setting. Without payment exchange, it is unclear how we can align agents' incentives to achieve the desired objectives of truthfulness and social welfare simultaneously, without resorting to approximations. Our work makes novel contributions by designing an approximate mechanism that desirably trade-off social welfare with truthfulness. Specifically, (i) we contribute a new end-to-end neural network architecture, ExS-Net, that accommodates the idea of "money-burning" for mechanism design without payments; (ii)~we provide a generalization bound that guarantees the mechanism performance when trained under finite samples; and (iii) we provide an experimental demonstration of the merits of the proposed mechanism.
- Abstract(参考訳): ニューラルネットワークを用いた自己関心エージェント間で限られたリソースを割り当てる機構の設計について検討する。
オークションにおける収益の最大化に機械学習を活用している最近の研究とは異なり、福祉の最大化は支払い不要な環境において重要な目標であると考えている。
支払い交換がなければ、エージェントのインセンティブを調整して真理と社会福祉の目的を同時に達成できるかは、近似に頼らずに明らかではない。
本研究は, 社会的福祉と誠実さを両立させる, およそのメカニズムを設計することによって, 新たな貢献を行う。
具体的には
i)新たなエンドツーエンドニューラルネットワークアーキテクチャであるExS-Netにコントリビュートする。
(ii)~有限サンプル下での学習時の機構性能を保証する一般化境界を提供する。
(三)提案機構のメリットを実験的に実証する。
関連論文リスト
- Deep Learning Meets Mechanism Design: Key Results and Some Novel
Applications [1.2661010067882734]
本稿では、関連する文献から、深層学習を用いたメカニズム設計の技術的詳細について述べる。
本稿では,3つのケーススタディにおいて,このアプローチのパワーを実証する。
論文 参考訳(メタデータ) (2024-01-11T06:09:32Z) - Refined Mechanism Design for Approximately Structured Priors via Active
Regression [50.71772232237571]
我々は、大量の商品を戦略的入札者に販売する収益を最大化する販売業者の問題を考える。
この設定の最適かつほぼ最適のメカニズムは、特徴付けや計算が難しいことで有名である。
論文 参考訳(メタデータ) (2023-10-11T20:34:17Z) - No Bidding, No Regret: Pairwise-Feedback Mechanisms for Digital Goods
and Data Auctions [14.87136964827431]
本研究は, 一般的な繰り返しオークション設定に対処する新しいメカニズムを提案する。
メカニズムの新規性は、入札者から情報を引き出すためにペアワイズ比較を使用することにある。
ヒューマンファクターに焦点が当てられていることは、よりヒューマン・アウェアで効率的なメカニズム設計の発展に寄与する。
論文 参考訳(メタデータ) (2023-06-02T18:29:07Z) - Pessimism meets VCG: Learning Dynamic Mechanism Design via Offline
Reinforcement Learning [114.36124979578896]
オフライン強化学習アルゴリズムを用いて動的メカニズムを設計する。
我々のアルゴリズムは悲観主義の原理に基づいており、オフラインデータセットのカバレッジについて軽度な仮定しか必要としない。
論文 参考訳(メタデータ) (2022-05-05T05:44:26Z) - Learning Dynamic Mechanisms in Unknown Environments: A Reinforcement
Learning Approach [130.9259586568977]
本稿では,複数ラウンドの対話を通して動的ビックレー・クラーク・グローブ(VCG)機構を回復するための新しい学習アルゴリズムを提案する。
当社のアプローチの重要な貢献は、報酬のないオンライン強化学習(RL)を取り入れて、リッチな政策分野の探索を支援することである。
論文 参考訳(メタデータ) (2022-02-25T16:17:23Z) - Online Auction-Based Incentive Mechanism Design for Horizontal Federated
Learning with Budget Constraint [9.503584357135832]
フェデレートされた学習は、データ分離を持つすべての関係者が協力的かつ効率的にモデルをトレーニングすることを可能にする。
高品質なモデルを得るには、より高品質な労働者をデータと計算能力で動機付けるためのインセンティブメカニズムが必要である。
本稿では,予算制約を伴う水平的フェデレーション学習のための,逆オークションに基づくオンラインインセンティブ機構を提案する。
論文 参考訳(メタデータ) (2022-01-22T13:37:52Z) - Learning Revenue-Maximizing Auctions With Differentiable Matching [50.62088223117716]
サンプル評価から,インセンティブに適合し,収益を最大化するオークションを大まかに学習する新しいアーキテクチャを提案する。
我々のアーキテクチャはシンクホーンアルゴリズムを用いて、ネットワークが防御的な収益最大化メカニズムを学習できるように、差別化可能な二部マッチングを実行する。
論文 参考訳(メタデータ) (2021-06-15T04:37:57Z) - VCG Mechanism Design with Unknown Agent Values under Stochastic Bandit
Feedback [104.06766271716774]
本研究では,エージェントが自己の価値を知らない場合に,マルチラウンドの福祉最大化機構設計問題について検討する。
まず、福祉に対する後悔の3つの概念、各エージェントの個々のユーティリティ、メカニズムの3つの概念を定義します。
当社のフレームワークは価格体系を柔軟に制御し、エージェントと販売者の後悔のトレードオフを可能にする。
論文 参考訳(メタデータ) (2020-04-19T18:00:58Z) - Generalization Guarantees for Multi-item Profit Maximization: Pricing,
Auctions, and Randomized Mechanisms [86.81403511861788]
購入者の価値に根ざした分布が存在する場合のマルチイテム利益について検討する。
購入者の値の任意のセットに対して、利益はメカニズムのパラメーターにおいて断片的に線形である。
我々は、まだサンプルベースのメカニズム設計文献にはないメカニズムクラスに対する新しい境界を証明した。
論文 参考訳(メタデータ) (2017-04-29T22:02:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。