論文の概要: Bandit Learning in Matching Markets: Utilitarian and Rawlsian Perspectives
- arxiv url: http://arxiv.org/abs/2412.00301v1
- Date: Sat, 30 Nov 2024 01:04:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-04 15:41:45.360344
- Title: Bandit Learning in Matching Markets: Utilitarian and Rawlsian Perspectives
- Title(参考訳): マッチング市場におけるバンドラーニング : 有効性とラウルシアンの視点から
- Authors: Hadi Hosseini, Duohan Zhang,
- Abstract要約: 両面のマッチング市場は多くの現実世界のアプリケーションに大きな影響を与えている。
伝統的なモデルは、しばしば好みが知られていると仮定するが、現代の市場では常にそうであるとは限らない。
- 参考スコア(独自算出の注目度): 14.718999704371312
- License:
- Abstract: Two-sided matching markets have demonstrated significant impact in many real-world applications, including school choice, medical residency placement, electric vehicle charging, ride sharing, and recommender systems. However, traditional models often assume that preferences are known, which is not always the case in modern markets, where preferences are unknown and must be learned. For example, a company may not know its preference over all job applicants a priori in online markets. Recent research has modeled matching markets as multi-armed bandit (MAB) problem and primarily focused on optimizing matching for one side of the market, while often resulting in a pessimal solution for the other side. In this paper, we adopt a welfarist approach for both sides of the market, focusing on two metrics: (1) Utilitarian welfare and (2) Rawlsian welfare, while maintaining market stability. For these metrics, we propose algorithms based on epoch Explore-Then-Commit (ETC) and analyze their regret bounds. Finally, we conduct simulated experiments to evaluate both welfare and market stability.
- Abstract(参考訳): 両面のマッチング市場は、学校選択、医療施設の配置、電気自動車の充電、ライドシェアリング、レコメンデーターシステムなど、多くの現実世界のアプリケーションに大きな影響を与えている。
しかし、伝統的なモデルは、嗜好がよく知られており、必ずしも現代の市場ではそうではなく、嗜好が未知であり、学ばなければならないと仮定することが多い。
例えば、企業は、オンライン市場における全ての求職者に対する優先事項を知らないかもしれない。
近年の研究では、マッチング市場をマルチアーム・バンディット(MAB)問題としてモデル化し、市場の片面のマッチングを最適化することに重点を置いている。
本稿では,(1) 実用的福祉と(2) ラウルシアン福祉の2つの指標に着目し, 市場の安定を維持しながら, 市場両側にウェルファリスト的アプローチを採用する。
これらの指標について,エポック・エクスプローラー・Then-Commit (ETC) に基づくアルゴリズムを提案し,その残差を解析する。
最後に、福祉と市場の安定の両方を評価するための模擬実験を行う。
関連論文リスト
- Putting Gale & Shapley to Work: Guaranteeing Stability Through Learning [14.448192914855674]
両面のマッチング市場は、市場の片側からの参加者が好みに応じて反対側からの参加者と一致しなければならない、一連の問題を記述している。
我々は安定解の構造を利用して、安定解を見つける可能性を改善するアルゴリズムを考案する。
論文 参考訳(メタデータ) (2024-10-06T06:47:53Z) - An IPW-based Unbiased Ranking Metric in Two-sided Markets [3.845857580909374]
本稿では,2つの市場におけるユーザ間のバイアスの複雑な相互作用について論じる。
そこで我々は,2面IPWという新しい推定器を提案し,その位置ベースを両面IPWと呼ぶ。
論文 参考訳(メタデータ) (2023-07-14T01:44:03Z) - Fairness in Matching under Uncertainty [78.39459690570531]
アルゴリズム的な二面市場は、こうした設定における公平性の問題に注意を向けている。
我々は、利益の不確実性を尊重する両面の市場設定において、個々人の公正性の概念を公理化する。
そこで我々は,配当よりも公平なユーティリティ最大化分布を求めるために,線形プログラミングフレームワークを設計する。
論文 参考訳(メタデータ) (2023-02-08T00:30:32Z) - Parity in Markets -- Methods, Costs, and Consequences [109.5267969644294]
我々は、市場デザイナーがフィッシャー市場の税や補助金を使って、市場均衡の結果が一定の制約内に収まることを確実にする方法を示します。
我々は、既存の文献で提案されている様々な公正性制約を市場ケースに適用し、その制約から誰が利益を得るか、誰を失うかを示す。
論文 参考訳(メタデータ) (2022-10-05T22:27:44Z) - Competition, Alignment, and Equilibria in Digital Marketplaces [97.03797129675951]
プラットフォームアクションがバンディットアルゴリズムであり,両プラットフォームがユーザ参加を競うデュオポリー市場について検討する。
私たちの主な発見は、この市場における競争は、市場の結果をユーザーユーティリティと完全に一致させるものではないということです。
論文 参考訳(メタデータ) (2022-08-30T17:43:58Z) - Deep Q-Learning Market Makers in a Multi-Agent Simulated Stock Market [58.720142291102135]
本稿では,エージェント・ベースの観点から,これらのマーケット・メーカーの戦略に関する研究に焦点をあてる。
模擬株式市場における知的市場マーカー作成のための強化学習(Reinforcement Learning, RL)の適用を提案する。
論文 参考訳(メタデータ) (2021-12-08T14:55:21Z) - Learning Equilibria in Matching Markets from Bandit Feedback [139.29934476625488]
不確実性の下で安定した市場成果を学習するためのフレームワークとアルゴリズムを開発する。
私たちの研究は、大規模なデータ駆動の市場において、いつ、どのように安定したマッチングが生じるかを明らかにするための第一歩を踏み出します。
論文 参考訳(メタデータ) (2021-08-19T17:59:28Z) - Learning who is in the market from time series: market participant
discovery through adversarial calibration of multi-agent simulators [0.0]
電子取引市場では、価格またはボリューム時系列のみが直接観測可能である。
本研究では,実物と偽物とを区別できる識別器を2段階に分けて学習する手法を提案する。
論文 参考訳(メタデータ) (2021-08-02T06:53:37Z) - Learning Strategies in Decentralized Matching Markets under Uncertain
Preferences [91.3755431537592]
エージェントの選好が不明な場合,共有資源の不足の設定における意思決定の問題について検討する。
我々のアプローチは、再生されたカーネルヒルベルト空間における好みの表現に基づいている。
エージェントの期待した利益を最大化する最適な戦略を導出する。
論文 参考訳(メタデータ) (2020-10-29T03:08:22Z) - Robust Market Making via Adversarial Reinforcement Learning [5.482532589225552]
敵の強化学習は、敵対的かつ適応的な市場条件に頑健な市場マーキングエージェントを作成するのに有効であることを示す。
我々はARL法が一貫して収束していることを示し、単純化された単一ステージゲームにおいて、収束するプロファイルがナッシュ平衡に対応することをいくつかの特別なケースで証明する。
論文 参考訳(メタデータ) (2020-03-03T22:40:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。