論文の概要: Lagrangian Inference for Ranking Problems
- arxiv url: http://arxiv.org/abs/2110.00151v1
- Date: Fri, 1 Oct 2021 01:16:25 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-04 14:39:59.464853
- Title: Lagrangian Inference for Ranking Problems
- Title(参考訳): ランク問題に対するラグランジアン推論
- Authors: Yue Liu, Ethan X. Fang, Junwei Lu
- Abstract要約: 両比較の結果のベルヌーイ分布を決定する正の選好スコアが各項目に割り当てられるブラッドリー・テリー・ルーシ(BTL)モデルについて考察する。
提案手法は,BTLモデルの一般的なランク付け特性を推定することを目的としている。
フレームワークを複数のテスト問題に一般化し、偽発見率(FDR)を制御し、上位のK$アイテムを推測する手法を適用する。
- 参考スコア(独自算出の注目度): 18.70913621061314
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a novel combinatorial inference framework to conduct general
uncertainty quantification in ranking problems. We consider the widely adopted
Bradley-Terry-Luce (BTL) model, where each item is assigned a positive
preference score that determines the Bernoulli distributions of pairwise
comparisons' outcomes. Our proposed method aims to infer general ranking
properties of the BTL model. The general ranking properties include the "local"
properties such as if an item is preferred over another and the "global"
properties such as if an item is among the top $K$-ranked items. We further
generalize our inferential framework to multiple testing problems where we
control the false discovery rate (FDR), and apply the method to infer the
top-$K$ ranked items. We also derive the information-theoretic lower bound to
justify the minimax optimality of the proposed method. We conduct extensive
numerical studies using both synthetic and real datasets to back up our theory.
- Abstract(参考訳): ランキング問題において一般不確実性定量化を行うための新しい組合せ推論フレームワークを提案する。
btl(bradley-terry-luce)モデルでは,各項目に正の選好スコアが与えられ,対比較の結果のベルヌーイ分布が決定される。
提案手法はbtlモデルの一般ランキング特性を推定することを目的としている。
一般的なランキングプロパティには、アイテムが他のものよりも好まれるような"ローカル"プロパティと、アイテムが上位の$K$ランクアイテムに含まれるような"グローバル"プロパティが含まれる。
さらに、偽発見率(fdr)を制御する複数のテスト問題に対する推論フレームワークを一般化し、上位$k$のランク付け項目を推測する手法を適用します。
また,提案手法の最小最適性を正当化する情報理論下限も導出する。
我々は合成データと実データの両方を用いて広範な数値研究を行い,理論を裏付ける。
関連論文リスト
- Reward Modeling with Ordinal Feedback: Wisdom of the Crowd [9.034189257088762]
人間の好みから報酬モデル(RM)を学ぶことは、大きな言語モデルを調整する上で重要な要素である。
順序フィードバックの下でRMを学習するためのフレームワークを提案する。
我々は,Rademacher複雑性の低減の観点から,順序フィードバックの統計的利点を証明した。
論文 参考訳(メタデータ) (2024-11-19T20:17:04Z) - Reward-Augmented Data Enhances Direct Preference Alignment of LLMs [56.24431208419858]
報奨条件付き大言語モデル(LLM)を導入し、データセット内の応答品質のスペクトル全体から学習する。
そこで本稿では,品質スコアに優先ペアを条件付け,報酬を加算したデータセットを構築する,効果的なデータレバーベリング手法を提案する。
論文 参考訳(メタデータ) (2024-10-10T16:01:51Z) - Covariate Assisted Entity Ranking with Sparse Intrinsic Scores [3.2839905453386162]
我々は,新しいモデル同定条件を導入し,正規化された最大推定値の統計率について検討する。
また,本手法を潜在固有スコアを持たないモデルに対する適合性テストに適用する。
論文 参考訳(メタデータ) (2024-07-09T19:58:54Z) - Optimal Multi-Distribution Learning [88.3008613028333]
マルチディストリビューション学習は、$k$の異なるデータ分散における最悪のリスクを最小限に抑える共有モデルを学ぶことを目指している。
本稿では, (d+k)/varepsilon2の順に, サンプルの複雑さを伴って, ヴァレプシロン最適ランダム化仮説を導出するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-12-08T16:06:29Z) - Combinatorial Inference on the Optimal Assortment in Multinomial Logit
Models [14.689897325621672]
意思決定者は、与えられたプロパティが最適のアソシエーションに対して真であるかどうかをテストすることのみに関心を持つかもしれない。
本稿では,そのような特性をテストするための新しい推論フレームワークを提案する。
論文 参考訳(メタデータ) (2023-01-28T17:09:50Z) - Uncertainty Quantification of MLE for Entity Ranking with Covariates [3.2839905453386162]
本稿では,ペア比較に基づくランキング問題の統計的推定と推定について検討する。
我々は、有名なBradley-Terry-Luceモデルを拡張した新しいモデルCAREモデルを提案する。
我々は、スパース比較グラフの下で、$alpha_i*_i=1n$と$beta*$の最大確率推定器を導出する。
大規模数値研究による理論結果の検証と相互資金保有データセットへの適用について検討する。
論文 参考訳(メタデータ) (2022-12-20T02:28:27Z) - Ranking Inferences Based on the Top Choice of Multiway Comparisons [2.468314282946207]
本稿では、各試行においてランダムに選択された項目のうち、上位選択の観測データに基づいて、$n$アイテムのランキングを考察する。
これは、M$-wayランキングに対するプラケット=リュックモデルの有用な修正であり、最高選択のみを観測し、M=2$に対応する祝賀されたブラッドリー=テリー=リュックモデルの延長である。
論文 参考訳(メタデータ) (2022-11-22T02:34:52Z) - Relational Proxies: Emergent Relationships as Fine-Grained
Discriminators [52.17542855760418]
本稿では,オブジェクトのグローバル部分とローカル部分の間の情報を利用してラベルを符号化する手法を提案する。
我々は、理論的な結果に基づいてプロキシを設計し、7つの挑戦的なきめ細かいベンチマークデータセットに基づいて評価する。
また、この理論を実験的に検証し、複数のベンチマークで一貫した結果を得る。
論文 参考訳(メタデータ) (2022-10-05T11:08:04Z) - Recommendation Systems with Distribution-Free Reliability Guarantees [83.80644194980042]
我々は、主に良いアイテムを含むことを厳格に保証されたアイテムのセットを返す方法を示す。
本手法は, 擬似発見率の厳密な有限サンプル制御によるランキングモデルを提供する。
我々はYahoo!のランキングとMSMarcoデータセットの学習方法を評価する。
論文 参考訳(メタデータ) (2022-07-04T17:49:25Z) - The Performance of the MLE in the Bradley-Terry-Luce Model in
$\ell_{\infty}$-Loss and under General Graph Topologies [76.61051540383494]
我々はBradley-Terry-Luceモデルの$ell_infty$推定誤差に関する新しい一般上限を導出する。
導出された境界は良好に機能し、場合によっては既知の結果よりもシャープであることを示す。
論文 参考訳(メタデータ) (2021-10-20T23:46:35Z) - Towards Model-Agnostic Post-Hoc Adjustment for Balancing Ranking
Fairness and Algorithm Utility [54.179859639868646]
Bipartiteランキングは、ラベル付きデータから正の個人よりも上位の個人をランク付けするスコアリング機能を学ぶことを目的としている。
学習したスコアリング機能が、異なる保護グループ間で体系的な格差を引き起こすのではないかという懸念が高まっている。
本稿では、二部構成のランキングシナリオにおいて、それらのバランスをとるためのモデル後処理フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-15T10:08:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。