論文の概要: Learning Fair Ranking Policies via Differentiable Optimization of
Ordered Weighted Averages
- arxiv url: http://arxiv.org/abs/2402.05252v1
- Date: Wed, 7 Feb 2024 20:53:53 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-09 17:20:51.975081
- Title: Learning Fair Ranking Policies via Differentiable Optimization of
Ordered Weighted Averages
- Title(参考訳): 順序重み付け平均の微分可能最適化による公正ランキング政策の学習
- Authors: My H. Dinh, James Kotary, Ferdinando Fioretto
- Abstract要約: 本稿では,学習からランクへの学習ループに,効率よく解ける公正ランキングモデルを組み込む方法について述べる。
特に,本論文は,OWA目標の制約された最適化を通じてバックプロパゲーションを行う方法を示す最初のものである。
- 参考スコア(独自算出の注目度): 55.04219793298687
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Learning to Rank (LTR) is one of the most widely used machine learning
applications. It is a key component in platforms with profound societal
impacts, including job search, healthcare information retrieval, and social
media content feeds. Conventional LTR models have been shown to produce biases
results, stimulating a discourse on how to address the disparities introduced
by ranking systems that solely prioritize user relevance. However, while
several models of fair learning to rank have been proposed, they suffer from
deficiencies either in accuracy or efficiency, thus limiting their
applicability to real-world ranking platforms. This paper shows how
efficiently-solvable fair ranking models, based on the optimization of Ordered
Weighted Average (OWA) functions, can be integrated into the training loop of
an LTR model to achieve favorable balances between fairness, user utility, and
runtime efficiency. In particular, this paper is the first to show how to
backpropagate through constrained optimizations of OWA objectives, enabling
their use in integrated prediction and decision models.
- Abstract(参考訳): learning to rank (ltr) は最も広く使われている機械学習アプリケーションの一つである。
これは、仕事の検索、医療情報検索、ソーシャルメディアのコンテンツフィードなど、社会的な影響の大きいプラットフォームにおいて重要な要素である。
従来のLTRモデルではバイアスが生じることが示されており、ユーザ関連性のみを優先するランキングシステムによって導入された格差に対処する方法についての議論が刺激されている。
しかし、いくつかの公正学習モデルが提案されているが、正確性や効率性に欠けており、現実のランキングプラットフォームへの適用性が制限されている。
本稿では,順序重み付け平均(owa)関数の最適化に基づいて,公平性,ユーザユーティリティ,ランタイム効率のバランスを良好にするために,ltrモデルのトレーニングループに統合する手法を提案する。
特に,本論文は,OWA目標の制約された最適化を通じてバックプロパゲーションを行う方法を示す最初のものである。
関連論文リスト
- Optimizing LLMs with Direct Preferences: A Data Efficiency Perspective [4.548047308860141]
本研究では,異なる種類の嗜好データがモデル性能に与える影響について検討する。
収集に費用がかかる大量の好みデータへの依存を減らすことを目的としている。
論文 参考訳(メタデータ) (2024-10-22T00:11:41Z) - Preference Learning Algorithms Do Not Learn Preference Rankings [62.335733662381884]
選好学習は、好ましくない出力よりも、好ましくない出力により高い確率を割り当てるようにモデルを訓練する、という従来の知恵を考察する。
多くの最先端の選好調整モデルでは、一般的な選好データセットでは60%未満のランキング精度が得られている。
論文 参考訳(メタデータ) (2024-05-29T21:29:44Z) - Prior Constraints-based Reward Model Training for Aligning Large Language Models [58.33118716810208]
本稿では,この問題を解決するために,事前制約に基づくリワードモデル(PCRM)のトレーニング手法を提案する。
PCRMは、前回の制約、特に各比較ペアの出力間の長さ比とコサイン類似性を、最適化の規模を調節しスコアマージンを制御するための報酬モデルトレーニングに組み入れている。
実験結果から,PCRMは報酬スコアのスケーリングを効果的に抑制することによりアライメント性能を著しく向上することが示された。
論文 参考訳(メタデータ) (2024-04-01T07:49:11Z) - ChatGPT Based Data Augmentation for Improved Parameter-Efficient Debiasing of LLMs [65.9625653425636]
大型言語モデル(LLM)は有害な社会的バイアスを示す。
そこで本研究では,ChatGPTを用いて合成学習データを生成する手法を提案する。
論文 参考訳(メタデータ) (2024-02-19T01:28:48Z) - Optimizing Group-Fair Plackett-Luce Ranking Models for Relevance and
Ex-Post Fairness [5.349671569838342]
学習からランクへの学習において、関連性のみを最適化することは、特定のカテゴリの項目に表現的害をもたらす可能性がある。
本稿では,与えられた表現制約を満たすランキングに対して,期待される妥当性を最大化する新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-08-25T08:27:43Z) - Confidence Ranking for CTR Prediction [11.071444869776725]
本稿では,最適化目標をランキング関数として設計する,信頼ランキングという新しいフレームワークを提案する。
本実験により、信頼度ランキング損失の導入は、公共および産業データセットのCTR予測タスクにおいて、すべてのベースラインを上回り得ることが示された。
このフレームワークは、JD.comの広告システムに展開され、ファインランクの段階で主要なトラフィックをサービスしている。
論文 参考訳(メタデータ) (2023-06-28T07:31:00Z) - CLIPood: Generalizing CLIP to Out-of-Distributions [73.86353105017076]
対照的に、CLIP(Language-image Pre-training)モデルでは、印象的なゼロショット能力を示しているが、下流タスクにおけるCLIPのさらなる適応は、OODのパフォーマンスを好ましくない劣化させる。
ドメインシフトとオープンクラスの両方が見えないテストデータ上で発生する可能性があるOOD状況にCLIPモデルを適用するための微調整手法であるCLIPoodを提案する。
さまざまなOODシナリオによるさまざまなデータセットの実験は、CLIPoodが既存の一般化テクニックを一貫して上回っていることを示している。
論文 参考訳(メタデータ) (2023-02-02T04:27:54Z) - Learning-To-Ensemble by Contextual Rank Aggregation in E-Commerce [8.067201256886733]
本稿では,アンサンブルモデルを文脈的ランクアグリゲータに置き換えた新しいラーニング・トゥ・エンサンブル・フレームワークRAEGOを提案する。
RA-EGOは当社のオンラインシステムにデプロイされ、収益を大幅に改善しました。
論文 参考訳(メタデータ) (2021-07-19T03:24:06Z) - Towards Model-Agnostic Post-Hoc Adjustment for Balancing Ranking
Fairness and Algorithm Utility [54.179859639868646]
Bipartiteランキングは、ラベル付きデータから正の個人よりも上位の個人をランク付けするスコアリング機能を学ぶことを目的としている。
学習したスコアリング機能が、異なる保護グループ間で体系的な格差を引き起こすのではないかという懸念が高まっている。
本稿では、二部構成のランキングシナリオにおいて、それらのバランスをとるためのモデル後処理フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-15T10:08:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。