論文の概要: Learning Strategies in Decentralized Matching Markets under Uncertain
Preferences
- arxiv url: http://arxiv.org/abs/2011.00159v2
- Date: Tue, 23 Nov 2021 07:44:14 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-01 22:46:30.145666
- Title: Learning Strategies in Decentralized Matching Markets under Uncertain
Preferences
- Title(参考訳): 不確実な選好下での分散マッチング市場の学習戦略
- Authors: Xiaowu Dai and Michael I. Jordan
- Abstract要約: エージェントの選好が不明な場合,共有資源の不足の設定における意思決定の問題について検討する。
我々のアプローチは、再生されたカーネルヒルベルト空間における好みの表現に基づいている。
エージェントの期待した利益を最大化する最適な戦略を導出する。
- 参考スコア(独自算出の注目度): 91.3755431537592
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We study the problem of decision-making in the setting of a scarcity of
shared resources when the preferences of agents are unknown a priori and must
be learned from data. Taking the two-sided matching market as a running
example, we focus on the decentralized setting, where agents do not share their
learned preferences with a central authority. Our approach is based on the
representation of preferences in a reproducing kernel Hilbert space, and a
learning algorithm for preferences that accounts for uncertainty due to the
competition among the agents in the market. Under regularity conditions, we
show that our estimator of preferences converges at a minimax optimal rate.
Given this result, we derive optimal strategies that maximize agents' expected
payoffs and we calibrate the uncertain state by taking opportunity costs into
account. We also derive an incentive-compatibility property and show that the
outcome from the learned strategies has a stability property. Finally, we prove
a fairness property that asserts that there exists no justified envy according
to the learned strategies.
- Abstract(参考訳): エージェントの選好が未知であり、データから学ばなければならない場合、共有リソースの不足の設定における意思決定の問題について検討する。
双方向マッチング市場を実例として,エージェントが学習した選好を中央機関と共有しない分散的な設定に注目する。
本手法は,再現カーネルヒルベルト空間における選好表現と,市場におけるエージェント間の競争による不確実性を考慮した選好学習アルゴリズムに基づいている。
正規性条件下では、選好の推定式がミニマックス最適速度で収束することを示す。
この結果から,エージェントの期待した利益を最大化する最適な戦略を導出し,機会コストを考慮した不確実な状態を校正する。
また,インセンティブ・コンパティビリティ特性を導出し,学習戦略の結果が安定性を有することを示す。
最後に、学習戦略に従えば正当性がないと主張する公平性を証明した。
関連論文リスト
- Putting Gale & Shapley to Work: Guaranteeing Stability Through Learning [14.448192914855674]
両面のマッチング市場は、市場の片側からの参加者が好みに応じて反対側からの参加者と一致しなければならない、一連の問題を記述している。
我々は安定解の構造を利用して、安定解を見つける可能性を改善するアルゴリズムを考案する。
論文 参考訳(メタデータ) (2024-10-06T06:47:53Z) - Causal Strategic Learning with Competitive Selection [10.237954203296187]
複数の意思決定者の下で因果戦略学習におけるエージェント選択の問題について検討する。
最適な選択規則は、最適なエージェントを選択することと、エージェントの改善を最大化するためのインセンティブを提供することの間のトレードオフであることを示す。
我々は、真の因果パラメータを回復するために、すべての意思決定者がまとめて採用しなければならない協調プロトコルを提供する。
論文 参考訳(メタデータ) (2023-08-30T18:43:11Z) - Proportional Fairness in Obnoxious Facility Location [70.64736616610202]
この問題に対して,距離に基づく比例フェアネスの概念の階層構造を提案する。
決定論的かつランダムなメカニズムを考察し、比例フェアネスの価格に関する厳密な境界を計算する。
モデルの拡張が2つあることを示す。
論文 参考訳(メタデータ) (2023-01-11T07:30:35Z) - Decentralized, Communication- and Coordination-free Learning in
Structured Matching Markets [2.9833943723592764]
両面マッチング市場における競争環境におけるオンライン学習の問題について検討する。
本稿では、エージェントが安定したマッチングに到達できるように、分散化、通信、調整不要なアルゴリズムのクラスを提案する。
論文 参考訳(メタデータ) (2022-06-06T04:08:04Z) - Monotonic Improvement Guarantees under Non-stationarity for
Decentralized PPO [66.5384483339413]
我々は,MARL(Multi-Agent Reinforcement Learning)における分散政策の最適化のための新しい単調改善保証を提案する。
本研究では,訓練中のエージェント数に基づいて,独立した比率を限定することにより,信頼領域の制約を原則的に効果的に実施可能であることを示す。
論文 参考訳(メタデータ) (2022-01-31T20:39:48Z) - Learning Equilibria in Matching Markets from Bandit Feedback [139.29934476625488]
不確実性の下で安定した市場成果を学習するためのフレームワークとアルゴリズムを開発する。
私たちの研究は、大規模なデータ駆動の市場において、いつ、どのように安定したマッチングが生じるかを明らかにするための第一歩を踏み出します。
論文 参考訳(メタデータ) (2021-08-19T17:59:28Z) - Multi-Stage Decentralized Matching Markets: Uncertain Preferences and
Strategic Behaviors [91.3755431537592]
本稿では、現実世界のマッチング市場で最適な戦略を学ぶためのフレームワークを開発する。
我々は,不確実性レベルが特徴の福祉対フェアネストレードオフが存在することを示す。
シングルステージマッチングと比較して、マルチステージマッチングで参加者がより良くなることを証明します。
論文 参考訳(メタデータ) (2021-02-13T19:25:52Z) - Decentralized Reinforcement Learning: Global Decision-Making via Local
Economic Transactions [80.49176924360499]
我々は、シーケンシャルな意思決定問題を解決するために、単純で専門的で自己関心のあるエージェントの社会を指示する枠組みを確立する。
我々は分散強化学習アルゴリズムのクラスを導出する。
我々は、より効率的な移動学習のための社会固有のモジュラー構造の潜在的な利点を実証する。
論文 参考訳(メタデータ) (2020-07-05T16:41:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。