論文の概要: Bandit Learning in Matching Markets with Interviews
- arxiv url: http://arxiv.org/abs/2602.12224v1
- Date: Thu, 12 Feb 2026 18:03:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-13 21:07:25.969944
- Title: Bandit Learning in Matching Markets with Interviews
- Title(参考訳): 売り込み市場におけるバンドラーニングとインタビュー
- Authors: Amirmahdi Mirfakhar, Xuchuang Wang, Mengfan Xu, Hedyeh Beyhaghi, Mohammad Hajiesmaili,
- Abstract要約: 両面のマッチング市場は双方の好みに頼っているが、しばしば好みを評価するのは現実的ではない。
我々は,インタビューと一致する市場における盗聴学習を,双方に部分的な嗜好情報を示すテキストトローコストヒントとしてモデル化する。
- 参考スコア(独自算出の注目度): 16.603456812107975
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Two-sided matching markets rely on preferences from both sides, yet it is often impractical to evaluate preferences. Participants, therefore, conduct a limited number of interviews, which provide early, noisy impressions and shape final decisions. We study bandit learning in matching markets with interviews, modeling interviews as \textit{low-cost hints} that reveal partial preference information to both sides. Our framework departs from existing work by allowing firm-side uncertainty: firms, like agents, may be unsure of their own preferences and can make early hiring mistakes by hiring less preferred agents. To handle this, we extend the firm's action space to allow \emph{strategic deferral} (choosing not to hire in a round), enabling recovery from suboptimal hires and supporting decentralized learning without coordination. We design novel algorithms for (i) a centralized setting with an omniscient interview allocator and (ii) decentralized settings with two types of firm-side feedback. Across all settings, our algorithms achieve time-independent regret, a substantial improvement over the $O(\log T)$ regret bounds known for learning stable matchings without interviews. Also, under mild structured markets, decentralized performance matches the centralized counterpart up to polynomial factors in the number of agents and firms.
- Abstract(参考訳): 両面のマッチング市場は双方の好みに頼っているが、しばしば好みを評価するのは現実的ではない。
そのため、参加者は限定的なインタビューを行い、初期的で騒々しい印象を与え、最終的な決定を形作る。
我々は,インタビューと一致する市場における盗聴学習を,双方に部分的な嗜好情報を明らかにする「textit{low-cost hints}」としてモデル化する。
私たちのフレームワークは、ファームサイドの不確実性を許容することによって、既存の作業から離れています。
これに対応するために、企業のアクションスペースを拡張して、‘emph{strategic deferral}’(ラウンドで採用しないことを選択)を許可し、最適以下の雇用からの回復を可能にし、調整なしで分散学習を支援する。
我々は新しいアルゴリズムを設計する
一 雑感に満ちたインタビューアロケータによる中央集権的な設定
(ii) ファームサイドフィードバックの2つのタイプの分散設定。
すべての設定において、我々のアルゴリズムは時間に依存しない後悔を達成し、インタビューなしで安定したマッチングを学習したことで知られている$O(\log T)$ regret境界よりも大幅に改善した。
また、緩やかに構造化された市場では、分散化されたパフォーマンスはエージェントや企業の数で多項式要因まで中央集権的なパフォーマンスと一致している。
関連論文リスト
- An External Fairness Evaluation of LinkedIn Talent Search [55.18656975953939]
LinkedInのTalent Searchランキングシステムのバイアスに対する、独立したサードパーティによる監査を行います。
我々は、性別と人種の2つの属性にまたがる潜在的なランキングバイアスに焦点を当てている。
我々の分析は、初期階級の少数派を過小評価していることを示している。
論文 参考訳(メタデータ) (2025-11-13T19:10:49Z) - Putting Gale & Shapley to Work: Guaranteeing Stability Through Learning [14.448192914855674]
両面のマッチング市場は、市場の片側からの参加者が好みに応じて反対側からの参加者と一致しなければならない、一連の問題を記述している。
我々は安定解の構造を利用して、安定解を見つける可能性を改善するアルゴリズムを考案する。
論文 参考訳(メタデータ) (2024-10-06T06:47:53Z) - Decentralized, Communication- and Coordination-free Learning in
Structured Matching Markets [2.9833943723592764]
両面マッチング市場における競争環境におけるオンライン学習の問題について検討する。
本稿では、エージェントが安定したマッチングに到達できるように、分散化、通信、調整不要なアルゴリズムのクラスを提案する。
論文 参考訳(メタデータ) (2022-06-06T04:08:04Z) - Decentralized Competing Bandits in Non-Stationary Matching Markets [46.13741000158631]
非定常(動的)環境下での分散化二面マッチング市場の枠組みを紹介する。
分散非定常競合帯域(textttDNCB)を用いた分散非同期学習アルゴリズムの提案と解析を行う。
我々はこの強調探索を特徴付け、texttDNCBのサブ線形(対数的)後悔を得る。
論文 参考訳(メタデータ) (2022-05-31T21:05:30Z) - The Dichotomous Affiliate Stable Matching Problem: Approval-Based
Matching with Applicant-Employer Relations [27.388757379210034]
本稿では,DASM問題(Dichotomous Affiliate Stable Matching)について紹介する。
その結果は,(1)実世界のマッチングランキングが仮定された評価関数に従うことを示すために人間による研究,(2)そのような解を見つけるための効率的で実装が容易なアルゴリズムを提供することによって,常に安定した解が存在することを証明し,(3)線形プログラミングに基づくアプローチと比較して,アルゴリズムの有効性を実験的に検証する。
論文 参考訳(メタデータ) (2022-02-22T18:56:21Z) - Byzantine-Robust Decentralized Learning via ClippedGossip [61.03711813598128]
ビザンチン・ロバスト・コンセンサス最適化のためのClippedGossipアルゴリズムを提案する。
ClippedGossipの実証実験性能を多数の攻撃下で実証した。
論文 参考訳(メタデータ) (2022-02-03T12:04:36Z) - Learning Equilibria in Matching Markets from Bandit Feedback [139.29934476625488]
不確実性の下で安定した市場成果を学習するためのフレームワークとアルゴリズムを開発する。
私たちの研究は、大規模なデータ駆動の市場において、いつ、どのように安定したマッチングが生じるかを明らかにするための第一歩を踏み出します。
論文 参考訳(メタデータ) (2021-08-19T17:59:28Z) - Bandit Learning in Decentralized Matching Markets [82.39061186055775]
私たちは、一方の市場(プレーヤー)が他方の側(腕)の好みについて事前知識を持っていない両面マッチング市場を研究し、経験からその好みを学ぶ必要があります。
このモデルは、標準のマルチアームバンディットフレームワークを競合する分散型マルチプレイヤー設定に拡張します。
アームの選好が共有されるたびにアルゴリズムがインセンティブ互換であることが示されるが、選好が完全に一般的である場合には必ずしもそうではない。
論文 参考訳(メタデータ) (2020-12-14T08:58:07Z) - Learning Strategies in Decentralized Matching Markets under Uncertain
Preferences [91.3755431537592]
エージェントの選好が不明な場合,共有資源の不足の設定における意思決定の問題について検討する。
我々のアプローチは、再生されたカーネルヒルベルト空間における好みの表現に基づいている。
エージェントの期待した利益を最大化する最適な戦略を導出する。
論文 参考訳(メタデータ) (2020-10-29T03:08:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。