論文の概要: Balancing Fairness and High Match Rates in Reciprocal Recommender Systems: A Nash Social Welfare Approach
- arxiv url: http://arxiv.org/abs/2601.13609v1
- Date: Tue, 20 Jan 2026 05:18:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-21 22:47:23.168007
- Title: Balancing Fairness and High Match Rates in Reciprocal Recommender Systems: A Nash Social Welfare Approach
- Title(参考訳): 相互レコメンダシステムにおける公正性と高いマッチング率のバランス:ナッシュ社会福祉的アプローチ
- Authors: Yoji Tomita, Tomohiko Yokoyama,
- Abstract要約: マッチングプラットフォーム上での相互レコメンデータシステム(RRS)の公平性について検討する。
フェアディビジョンの観点から、推奨されるユーザの機会を定義し、エロフリーネスというフェアネスの概念を確立します。
我々はSinkhornアルゴリズムに基づくSW/NSW/$-SW法に対する計算効率の良い近似アルゴリズムを開発した。
- 参考スコア(独自算出の注目度): 2.165723322157105
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Matching platforms, such as online dating services and job recommendations, have become increasingly prevalent. For the success of these platforms, it is crucial to design reciprocal recommender systems (RRSs) that not only increase the total number of matches but also avoid creating unfairness among users. In this paper, we investigate the fairness of RRSs on matching platforms. From the perspective of fair division, we define the users' opportunities to be recommended and establish the fairness concept of envy-freeness in the allocation of these opportunities. We first introduce the Social Welfare (SW) method, which approximately maximizes the number of matches, and show that it leads to significant unfairness in recommendation opportunities, illustrating the trade-off between fairness and match rates. To address this challenge, we propose the Nash Social Welfare (NSW) method, which alternately optimizes two NSW functions and achieves nearly envy-free recommendations. We further generalize the SW and NSW method to the $α$-SW method, which balances the trade-off between fairness and high match rates. Additionally, we develop a computationally efficient approximation algorithm for the SW/NSW/$α$-SW methods based on the Sinkhorn algorithm. Through extensive experiments on both synthetic datasets and two real-world datasets, we demonstrate the practical effectiveness of our approach.
- Abstract(参考訳): オンラインデートサービスやジョブレコメンデーションといったマッチングプラットフォームがますます普及している。
これらのプラットフォームの成功のためには、マッチングの総数を増やすだけでなく、ユーザ間の不公平さを生じさせないように、相互推薦システム(RRS)を設計することが不可欠である。
本稿では,マッチングプラットフォーム上でのRSの公平性について検討する。
フェアディビジョンの観点から、推奨されるユーザの機会を定義し、これらの機会の割り当てにおいて、うらやましい自由という公平性の概念を確立する。
まず、おおよそ試合数を最大化する社会福祉法(SW法)を導入し、フェアネスとマッチレートのトレードオフを浮き彫りにして、レコメンデーション機会において大きな不公平をもたらすことを示す。
この課題に対処するために,2つのNSW関数を交互に最適化し,ほぼうらやましいレコメンデーションを実現するNash Social Welfare (NSW)法を提案する。
さらに、SW法とNSW法を$α$-SW法に一般化し、フェアネスと高いマッチレートのトレードオフをバランスさせる。
さらに,Sinkhornアルゴリズムに基づくSW/NSW/$α$-SW法に対する計算効率の良い近似アルゴリズムを開発した。
人工データセットと実世界の2つのデータセットに関する広範な実験を通じて、我々のアプローチの実践的効果を実証した。
関連論文リスト
- Optimal Transport under Group Fairness Constraints [16.619285453959332]
我々は、与えられた2つのグループから2つの個人をマッチングする確率が、予め定義された目標を満たすことを要求する、群フェアネスという新しい概念を導入する。
まず,Sinkhornアルゴリズムを改良したtextttFairSinkhornを提案する。
フェアネスとパフォーマンスのトレードオフを示す実証的な結果を示す。
論文 参考訳(メタデータ) (2026-01-12T02:26:32Z) - Fair Reciprocal Recommendation in Matching Markets [0.8287206589886881]
エージェント間の双方向のマッチング市場における相互推薦について検討する。
我々のモデルでは、双方の個人が互いに関心を抱いている場合にのみ、マッチが成功すると考えられる。
フェアディビジョン理論の観点から、そのフェアネス基準、うらやましい自由さを導入する。
論文 参考訳(メタデータ) (2024-09-01T13:33:41Z) - Iterative Nash Policy Optimization: Aligning LLMs with General Preferences via No-Regret Learning [55.65738319966385]
我々は、新しいオンラインアルゴリズム、反復的ナッシュポリシー最適化(INPO)を提案する。
従来の方法とは異なり、INPOは個々の応答に対する期待される勝利率を推定する必要性を回避している。
LLaMA-3-8BベースのSFTモデルで、INPOはAlpacaEval 2.0で42.6%、Arena-Hardで37.8%の勝利率を達成した。
論文 参考訳(メタデータ) (2024-06-30T08:00:34Z) - Getting More Juice Out of the SFT Data: Reward Learning from Human Demonstration Improves SFT for LLM Alignment [65.15914284008973]
我々は、報酬モデルと政策モデルを同時に構築するために、逆強化学習(IRL)技術を活用することを提案する。
提案アルゴリズムはIRL問題の定常解に収束することを示す。
その結果,アライメントプロセス全体を通じて報酬学習を活用することは有益であることが示唆された。
論文 参考訳(メタデータ) (2024-05-28T07:11:05Z) - Interpolating Item and User Fairness in Multi-Sided Recommendations [13.635310806431198]
我々は、新しいフェアレコメンデーションフレームワーク、問題(FAIR)を紹介します。
本稿では,リアルタイム学習とフェアレコメンデーションを同時に行う低レベルのアルゴリズム形式を提案する。
我々は,プラットフォーム収益を維持する上でのフレームワークと手法の有効性を実証するとともに,アイテムとユーザ双方に望ましい公平性を確保した。
論文 参考訳(メタデータ) (2023-06-12T15:00:58Z) - Interactive Learning with Pricing for Optimal and Stable Allocations in
Markets [12.580391999838128]
大規模オンラインレコメンデーションシステムは、ユーザのフィードバックから好みを学習しながら、競合するユーザ間で限られた数のアイテムの割り当てを容易にする必要がある。
我々のフレームワークは、報酬を楽観的に最大化するアロケーションを探索することで、レコメンデーションの品質を高める。
不安定性を最小限に抑えるため、推薦されたアロケーションから逸脱するユーザのインセンティブを測定するため、アルゴリズムはWalrasian equilibriaから派生したスキームに基づいてアイテムを価格設定する。
本手法は, 帯域幅, 最適資源配分, 協調フィルタリングの手法を統合し, サブリニアな社会福祉の後悔と, サブリニアな不安定性を実現するアルゴリズムを得るための最初の手法である。
論文 参考訳(メタデータ) (2022-12-13T20:33:54Z) - Incentive-Aware Recommender Systems in Two-Sided Markets [49.692453629365204]
最適性能を達成しつつエージェントのインセンティブと整合する新しいレコメンデータシステムを提案する。
我々のフレームワークは、このインセンティブを意識したシステムを、両側市場におけるマルチエージェントバンディット問題としてモデル化する。
どちらのアルゴリズムも、エージェントが過剰な露出から保護する、ポストフェアネス基準を満たす。
論文 参考訳(メタデータ) (2022-11-23T22:20:12Z) - Scalable Personalised Item Ranking through Parametric Density Estimation [53.44830012414444]
暗黙のフィードバックから学ぶことは、一流問題の難しい性質のために困難です。
ほとんどの従来の方法は、一級問題に対処するためにペアワイズランキングアプローチとネガティブサンプラーを使用します。
本論文では,ポイントワイズと同等の収束速度を実現する学習対ランクアプローチを提案する。
論文 参考訳(メタデータ) (2021-05-11T03:38:16Z) - Scalable Bayesian Inverse Reinforcement Learning [93.27920030279586]
我々はAVRIL(Adroximate Variational Reward Imitation Learning)を紹介する。
本手法は,逆強化学習問題の誤った性質に対処する。
本手法を従来の制御シミュレーションと並行して実際の医療データに適用し,現在の手法の範囲を超えた環境におけるベイズ報酬推論を実証する。
論文 参考訳(メタデータ) (2021-02-12T12:32:02Z) - Exploration in two-stage recommender systems [79.50534282841618]
2段階のレコメンデータシステムは、スケーラビリティと保守性のために業界で広く採用されている。
このセットアップの鍵となる課題は、各ステージの最適性能が最適なグローバルパフォーマンスを暗示していないことである。
そこで本研究では,ランクとノミネーター間の探索戦略を同期させる手法を提案する。
論文 参考訳(メタデータ) (2020-09-01T16:52:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。