論文の概要: Fast online ranking with fairness of exposure
- arxiv url: http://arxiv.org/abs/2209.13019v1
- Date: Tue, 13 Sep 2022 12:35:36 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-02 23:51:01.835358
- Title: Fast online ranking with fairness of exposure
- Title(参考訳): 露出の公平さを伴う高速なオンラインランキング
- Authors: Nicolas Usunier, Virginie Do, Elvis Dohmatob
- Abstract要約: このアルゴリズムは計算が高速で、ソート演算が支配的であり、メモリ効率が良く、理論的な保証も強いことを示します。
ユーザ側のパフォーマンスを最大化する基本方針と比較して,提案アルゴリズムは,計算オーバーヘッドが無視できるような推奨事項に,露出基準の複雑な公平性を組み込むことができる。
- 参考スコア(独自算出の注目度): 29.134493256287072
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: As recommender systems become increasingly central for sorting and
prioritizing the content available online, they have a growing impact on the
opportunities or revenue of their items producers. For instance, they influence
which recruiter a resume is recommended to, or to whom and how much a music
track, video or news article is being exposed. This calls for recommendation
approaches that not only maximize (a proxy of) user satisfaction, but also
consider some notion of fairness in the exposure of items or groups of items.
Formally, such recommendations are usually obtained by maximizing a concave
objective function in the space of randomized rankings. When the total exposure
of an item is defined as the sum of its exposure over users, the optimal
rankings of every users become coupled, which makes the optimization process
challenging. Existing approaches to find these rankings either solve the global
optimization problem in a batch setting, i.e., for all users at once, which
makes them inapplicable at scale, or are based on heuristics that have weak
theoretical guarantees. In this paper, we propose the first efficient online
algorithm to optimize concave objective functions in the space of rankings
which applies to every concave and smooth objective function, such as the ones
found for fairness of exposure. Based on online variants of the Frank-Wolfe
algorithm, we show that our algorithm is computationally fast, generating
rankings on-the-fly with computation cost dominated by the sort operation,
memory efficient, and has strong theoretical guarantees. Compared to baseline
policies that only maximize user-side performance, our algorithm allows to
incorporate complex fairness of exposure criteria in the recommendations with
negligible computational overhead.
- Abstract(参考訳): オンラインコンテンツのソートと優先順位付けのためのレコメンダシステムがますます重要になってきており、商品生産者の機会や収入に影響を与えている。
例えば、リクルーターがどのリクルートを推奨するか、あるいは誰が音楽トラック、ビデオ、ニュース記事がどれだけ露出しているかに影響を与える。
これは、ユーザの満足度を最大化(プロキシ)するだけでなく、アイテムやアイテムのグループを露出する際の公平性も考慮するレコメンデーションアプローチを要求する。
形式的には、そのような推奨は通常、ランダム化されたランクの空間における凹型客観的関数を最大化することによって得られる。
アイテムの全体露出を、ユーザに対する露出の合計として定義すると、各ユーザの最適なランキングが結合され、最適化プロセスが困難になる。
これらのランキングを見つける既存のアプローチは、バッチ設定でグローバル最適化問題を解決するか、すなわち、すべてのユーザに対して一度に解くか、あるいは理論的な保証が弱いヒューリスティックに基づいている。
本稿では,全ての凹凸・滑らかな対象関数,例えば露出の公正性を示す関数に適用されるランク空間における凹凸対象関数を最適化する,最初の効率的なオンラインアルゴリズムを提案する。
frank-wolfeアルゴリズムのオンライン変種に基づき,提案アルゴリズムは計算速度が速く,計算コストがソート処理,メモリ効率,強力な理論保証によりオンザフライでランキングを生成する。
ユーザ側のパフォーマンスを最大化するベースラインポリシーと比較して,本アルゴリズムは,計算オーバーヘッドが無視できるレコメンデーションに,露出基準の複雑な公平さを組み込むことができる。
関連論文リスト
- Adaptively Learning to Select-Rank in Online Platforms [34.258659206323664]
本研究は、異種ユーザの候補プールからアイテムを適応的にランク付けすることの課題に対処する。
本研究では,多様なユーザの好みや項目位置の影響を考慮に入れたユーザ応答モデルを構築した。
シミュレーションと実世界の両方のデータセットで実施された実験は、アルゴリズムがベースラインを上回っていることを示している。
論文 参考訳(メタデータ) (2024-06-07T15:33:48Z) - Localized Zeroth-Order Prompt Optimization [54.964765668688806]
そこで我々は,ZOPO(Localized zeroth-order prompt optimization)という新しいアルゴリズムを提案する。
ZOPOはニューラル・タンジェント・カーネルをベースとしたガウス法を標準ゼロ階次最適化に取り入れ、高速な局所最適探索を高速化する。
注目すべきは、ZOPOは最適化性能とクエリ効率の両方の観点から、既存のベースラインを上回っていることだ。
論文 参考訳(メタデータ) (2024-03-05T14:18:15Z) - Adaptive Neural Ranking Framework: Toward Maximized Business Goal for
Cascade Ranking Systems [33.46891569350896]
カスケードランキングは、オンライン広告とレコメンデーションシステムにおける大規模なトップk選択問題に広く使われている。
それまでの学習からランクへの取り組みは、モデルに完全な順序やトップクオーダを学習させることに重点を置いていた。
我々はこの手法をアダプティブ・ニューラルランキング・フレームワーク (Adaptive Neural Ranking Framework, ARF) と命名する。
論文 参考訳(メタデータ) (2023-10-16T14:43:02Z) - Bipartite Ranking Fairness through a Model Agnostic Ordering Adjustment [54.179859639868646]
本稿では,二部類ランキングにおける公平性を実現するためのモデルに依存しない後処理フレームワークxOrderを提案する。
xOrderは、教師なしおよび教師なしの公正度メトリックを含む、さまざまな分類モデルとランキングフェアネスメトリクスと互換性がある。
提案アルゴリズムを,4つのベンチマークデータセットと2つの実世界の患者電子健康記録リポジトリ上で評価した。
論文 参考訳(メタデータ) (2023-07-27T07:42:44Z) - Optimizing Partial Area Under the Top-k Curve: Theory and Practice [151.5072746015253]
トップk曲線下部分領域(AUTKC)と呼ばれる新しい計量法を開発した。
AUTKCはより優れた識別能力を持ち、ベイズ最適スコア関数は条件付き確率に対して正しいトップKランクを与えることができる。
提案手法を最適化するために,実証的なサロゲートリスク最小化フレームワークを提案する。
論文 参考訳(メタデータ) (2022-09-03T11:09:13Z) - Pessimistic Off-Policy Optimization for Learning to Rank [13.733459243449634]
オフ政治学習は、ポリシーをデプロイせずに最適化するためのフレームワークである。
レコメンデーションシステムでは、ログデータの不均衡のため、これは特に難しい。
我々は、ランク付け学習のための悲観的非政治最適化について研究する。
論文 参考訳(メタデータ) (2022-06-06T12:58:28Z) - Sequential Information Design: Markov Persuasion Process and Its
Efficient Reinforcement Learning [156.5667417159582]
本稿では,逐次情報設計の新たなモデル,すなわちマルコフ説得過程(MPP)を提案する。
MPPのプランニングは、ミオピックレシーバーに同時に説得されるシグナルポリシーを見つけ、送信者の最適な長期累積ユーティリティを誘導する、というユニークな課題に直面している。
我々は,楽観主義と悲観主義の両原理の新たな組み合わせを特徴とする,実証可能な効率のよい非回帰学習アルゴリズム,Optimism-Pessimism Principle for Persuasion Process (OP4) を設計する。
論文 参考訳(メタデータ) (2022-02-22T05:41:43Z) - User Fairness, Item Fairness, and Diversity for Rankings in Two-Sided
Markets [28.537935838669423]
ユーザフェアネス、アイテムフェアネス、多様性は根本的に異なる概念であることを示す。
3つのデシラタを明示的に強制する最初のランク付けアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-10-04T02:53:09Z) - Exploration in two-stage recommender systems [79.50534282841618]
2段階のレコメンデータシステムは、スケーラビリティと保守性のために業界で広く採用されている。
このセットアップの鍵となる課題は、各ステージの最適性能が最適なグローバルパフォーマンスを暗示していないことである。
そこで本研究では,ランクとノミネーター間の探索戦略を同期させる手法を提案する。
論文 参考訳(メタデータ) (2020-09-01T16:52:51Z) - Controlling Fairness and Bias in Dynamic Learning-to-Rank [31.41843594914603]
暗黙のフィードバックデータからランキング関数を学習しながら、グループフェアネスの概念を確実にする学習アルゴリズムを提案する。
このアルゴリズムは、公平さと実用性の両方のために、偏見のない推定器を統合するコントローラの形をとっている。
厳密な理論基盤と収束保証に加えて、アルゴリズムが極めて実用的で堅牢であることが実証的に明らかになった。
論文 参考訳(メタデータ) (2020-05-29T17:57:56Z) - SetRank: A Setwise Bayesian Approach for Collaborative Ranking from
Implicit Feedback [50.13745601531148]
提案手法は,提案システムにおける暗黙的フィードバックの特性に対応するために,協調的ランキング(SeetRank)のためのセッティングワイドベイズ的手法を提案する。
具体的には、SetRankは、新しい設定された選好比較の後方確率を最大化することを目的としている。
また、SetRankの理論解析により、余剰リスクの境界が$sqrtM/N$に比例できることを示す。
論文 参考訳(メタデータ) (2020-02-23T06:40:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。