論文の概要: Probably Correct Optimal Stable Matching for Two-Sided Markets Under Uncertainty
- arxiv url: http://arxiv.org/abs/2501.03018v1
- Date: Mon, 06 Jan 2025 13:59:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-07 17:06:30.064427
- Title: Probably Correct Optimal Stable Matching for Two-Sided Markets Under Uncertainty
- Title(参考訳): 不確実性下における二面市場における最適安定マッチングの可能性
- Authors: Andreas Athanasopoulos, Anne-Marie George, Christos Dimitrakakis,
- Abstract要約: 市場左側の好ましくない条件下での安定婚姻モデルの学習課題について考察する。
我々の目的は、左サイド最適である安定したマッチングを素早く識別することであり、バンドイットフィードバックによる純粋な探索問題である。
- 参考スコア(独自算出の注目度): 5.250288418639076
- License:
- Abstract: We consider a learning problem for the stable marriage model under unknown preferences for the left side of the market. We focus on the centralized case, where at each time step, an online platform matches the agents, and obtains a noisy evaluation reflecting their preferences. Our aim is to quickly identify the stable matching that is left-side optimal, rendering this a pure exploration problem with bandit feedback. We specifically aim to find Probably Correct Optimal Stable Matchings and present several bandit algorithms to do so. Our findings provide a foundational understanding of how to efficiently gather and utilize preference information to identify the optimal stable matching in two-sided markets under uncertainty. An experimental analysis on synthetic data complements theoretical results on sample complexities for the proposed methods.
- Abstract(参考訳): 市場左側の好ましくない条件下での安定婚姻モデルの学習課題について考察する。
我々は,各段階ごとにオンラインプラットフォームがエージェントと一致し,その嗜好を反映したノイズ評価が得られる集中型ケースに注目した。
我々の目的は、左サイド最適である安定したマッチングを素早く識別することであり、バンドイットフィードバックによる純粋な探索問題である。
具体的には,確率的正解安定マッチング(Probably correct Optimal Stable Matchings)と,それを行う帯域幅アルゴリズムを提案する。
本研究は,不確実な二国間市場における最適安定マッチングを特定するために,選好情報を効率的に収集し,活用する方法に関する基礎的な理解を提供する。
合成データの実験的解析は, 提案手法のサンプル複素量に関する理論的結果を補完するものである。
関連論文リスト
- Putting Gale & Shapley to Work: Guaranteeing Stability Through Learning [14.448192914855674]
両面のマッチング市場は、市場の片側からの参加者が好みに応じて反対側からの参加者と一致しなければならない、一連の問題を記述している。
我々は安定解の構造を利用して、安定解を見つける可能性を改善するアルゴリズムを考案する。
論文 参考訳(メタデータ) (2024-10-06T06:47:53Z) - Unbalanced Optimal Transport: A Unified Framework for Object Detection [97.74382560746987]
不均衡最適輸送がオブジェクト検出に対する異なるアプローチをどのように統合するかを示す。
非平衡最適輸送を用いた物体検出モデルの訓練が最先端に到達可能であることを示す。
このアプローチはGPUの実装に適しており、大規模なモデルに有利であることが証明されている。
論文 参考訳(メタデータ) (2023-07-05T16:21:52Z) - Bi-objective Ranking and Selection Using Stochastic Kriging [0.0]
両目的のランク付けと選択の問題について検討し,その2つの目的が不確実性をもって観測された。
そこで本研究では,競合する解に対して逐次サンプルを割り当てるバイーシアン双対象ランクと選別法を提案する。
実験結果から,提案手法は標準的なアロケーション手法よりも優れており,また,よく知られた最先端のアルゴリズムも優れていることがわかった。
論文 参考訳(メタデータ) (2022-09-05T23:51:07Z) - Learn to Match with No Regret: Reinforcement Learning in Markov Matching
Markets [151.03738099494765]
我々は、市場の両側でプランナーと戦略エージェントのセットを含むマルコフマッチング市場について検討する。
本稿では,楽観的な値反復と最大重みマッチングを組み合わせた強化学習フレームワークを提案する。
我々は,アルゴリズムがサブ線形後悔を実現することを証明した。
論文 参考訳(メタデータ) (2022-03-07T19:51:25Z) - The Dichotomous Affiliate Stable Matching Problem: Approval-Based
Matching with Applicant-Employer Relations [27.388757379210034]
本稿では,DASM問題(Dichotomous Affiliate Stable Matching)について紹介する。
その結果は,(1)実世界のマッチングランキングが仮定された評価関数に従うことを示すために人間による研究,(2)そのような解を見つけるための効率的で実装が容易なアルゴリズムを提供することによって,常に安定した解が存在することを証明し,(3)線形プログラミングに基づくアプローチと比較して,アルゴリズムの有効性を実験的に検証する。
論文 参考訳(メタデータ) (2022-02-22T18:56:21Z) - Learning Equilibria in Matching Markets from Bandit Feedback [139.29934476625488]
不確実性の下で安定した市場成果を学習するためのフレームワークとアルゴリズムを開発する。
私たちの研究は、大規模なデータ駆動の市場において、いつ、どのように安定したマッチングが生じるかを明らかにするための第一歩を踏み出します。
論文 参考訳(メタデータ) (2021-08-19T17:59:28Z) - Optimality and Stability in Federated Learning: A Game-theoretic
Approach [0.0]
我々は,フェデレーションエージェント(プレーヤ)の平均誤差率によって与えられる最適性の概念を動機付け,定義する。
まず、パラメータ空間のいくつかの領域に対して、すべての安定な配置が最適である(アナーキーの値が 1 に等しい)ことを示す。
しかし、これはすべての設定に当てはまるものではなく、最適よりも高いコストで安定な配置の例が存在する(AnaarchyのPrice of Anarchy larger than 1)。
論文 参考訳(メタデータ) (2021-06-17T15:03:51Z) - Navigating to the Best Policy in Markov Decision Processes [68.8204255655161]
マルコフ決定過程における純粋探索問題について検討する。
エージェントはアクションを逐次選択し、結果のシステム軌道から可能な限り早くベストを目標とする。
論文 参考訳(メタデータ) (2021-06-05T09:16:28Z) - Learning Strategies in Decentralized Matching Markets under Uncertain
Preferences [91.3755431537592]
エージェントの選好が不明な場合,共有資源の不足の設定における意思決定の問題について検討する。
我々のアプローチは、再生されたカーネルヒルベルト空間における好みの表現に基づいている。
エージェントの期待した利益を最大化する最適な戦略を導出する。
論文 参考訳(メタデータ) (2020-10-29T03:08:22Z) - Towards Model-Agnostic Post-Hoc Adjustment for Balancing Ranking
Fairness and Algorithm Utility [54.179859639868646]
Bipartiteランキングは、ラベル付きデータから正の個人よりも上位の個人をランク付けするスコアリング機能を学ぶことを目的としている。
学習したスコアリング機能が、異なる保護グループ間で体系的な格差を引き起こすのではないかという懸念が高まっている。
本稿では、二部構成のランキングシナリオにおいて、それらのバランスをとるためのモデル後処理フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-15T10:08:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。