論文の概要: Bradley-Terry Rankings for Recommender Systems Across Dataset Taxonomies
- arxiv url: http://arxiv.org/abs/2606.07492v1
- Date: Fri, 05 Jun 2026 17:46:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-08 14:33:29.877519
- Title: Bradley-Terry Rankings for Recommender Systems Across Dataset Taxonomies
- Title(参考訳): データセット分類におけるレコメンダーシステムのBradley-Terryランキング
- Authors: Ekaterina Grishina, Stepan Kuznetsov, Askar Tsyganov, Ilya Ivanov, Daria Korovaitceva, Margarita Rusanova, Uliana Parkina, Alexander Derevyagin, Evgeny Frolov, Sergey Samsonov, Anton Lysenko,
- Abstract要約: 我々はBradley-Terry(BT)モデルに基づくデータ駆動型ランキング手法を提案する。
得られたランキングは、主要なデータセット統計に依存することを示す。
また、ランキングの整合性を評価するための新しい指標を提案し、不完全データに対するランキングの堅牢性を示す。
- 参考スコア(独自算出の注目度): 35.73333173997762
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The ranking of recommendation algorithms is a challenging problem since model performance is sensitive to dataset characteristics such as sparsity, sequential structure, and scale. This drives a demand for a proper methodology for fair comparison between algorithms. Naive aggregation of performance metrics (e.g., averaging NDCG over benchmarks) can yield misleading rankings, undermining practical selection. To address this problem, we introduce a novel, data-driven ranking methodology based on Bradley-Terry (BT) model. We demonstrate that the obtained ranking depends on key dataset statistics. Additionally, we propose a novel metric for evaluating ranking consistency and demonstrate robustness of our ranking to incomplete data. Finally, we introduce a dataset-specific methodology for ranking algorithms on unseen datasets without running the models, relying on extensions of the Bradley-Terry framework, including BT trees and BT models with covariates.
- Abstract(参考訳): モデル性能は、スパーシリティ、シーケンシャル構造、スケールなどのデータセット特性に敏感であるため、レコメンデーションアルゴリズムのランク付けは難しい問題である。
これにより、アルゴリズム間の公正な比較のための適切な方法論が要求される。
パフォーマンス指標(例えばベンチマーク上のNDCGの平均値)のナイーブアグリゲーションは、誤解を招くランキングをもたらし、実用的な選択を損なう可能性がある。
この問題に対処するために,Bradley-Terry(BT)モデルに基づく新しいデータ駆動型ランキング手法を提案する。
得られたランキングは、主要なデータセット統計に依存することを示す。
さらに、ランキングの整合性を評価するための新しい指標を提案し、不完全データに対するランキングの堅牢性を示す。
最後に、BT木やBTモデルなど、Bradley-Terryフレームワークの拡張に頼らず、モデルを実行せずに、未知のデータセット上のアルゴリズムをランク付けするためのデータセット固有の方法論を提案する。
関連論文リスト
- Metric-agnostic Learning-to-Rank via Boosting and Rank Approximation [33.0347118359824]
そこで本研究では,各クエリの平均平方損失に対してスムーズな近似を組み合わした,新たな微分可能なランキング損失を提案する。
本手法は,情報検索における現状と同等の効率で性能を向上する。
論文 参考訳(メタデータ) (2026-04-16T14:59:00Z) - RankList -- A Listwise Preference Learning Framework for Predicting Subjective Preferences [66.76322360727809]
RankNetを構造化されたリストレベルの監視に一般化するリストワイズ選好学習フレームワークである RankList を提案する。
我々の定式化は確率的枠組みの中で局所的および非局所的ランキング制約を明示的にモデル化する。
実験は多種多様性にまたがる手法の優越性を実証した。
論文 参考訳(メタデータ) (2025-08-13T13:59:41Z) - Take the essence and discard the dross: A Rethinking on Data Selection for Fine-Tuning Large Language Models [36.22392593103493]
微調整された大規模言語モデル(LLM)のデータ選択は、既存のデータセットから高品質なサブセットを選択することを目的としている。
既存の調査では、微調整フェーズの詳細な調査を見落としている。
特徴抽出, 基準設計, セレクタ評価を含む新しい3段階の手法を導入し, これらの手法を体系的に分類し, 評価する。
論文 参考訳(メタデータ) (2024-06-20T08:58:58Z) - Proper Dataset Valuation by Pointwise Mutual Information [26.693741797887643]
データキュレーション手法を評価するための情報理論フレームワークを提案する。
我々は,データセットの品質を,真のモデルパラメータに関する情報性の観点から定義する。
得られたデータとテストデータとの間のシャノン相互情報によりブラックウェル順序を決定することができることを示す。
論文 参考訳(メタデータ) (2024-05-28T15:04:17Z) - CURATRON: Complete and Robust Preference Data for Rigorous Alignment of Large Language Models [4.9125631769031415]
本稿では,大規模言語モデルと人間の価値観を協調する上での課題について考察する。
本稿では,LLMのレジリエンスを高めるために,堅牢で悪意のあるAIパイプラインデータセットを提案する。
論文 参考訳(メタデータ) (2024-03-05T07:58:12Z) - A Critical Re-evaluation of Benchmark Datasets for (Deep) Learning-Based
Matching Algorithms [11.264467955516706]
確立された13のデータセットの難易度と適切性を評価するための4つの手法を提案する。
一般的なデータセットの多くは、かなり簡単な分類タスクを処理している。
ベンチマークデータセットを得るための新しい手法を提案する。
論文 参考訳(メタデータ) (2023-07-03T07:54:54Z) - HARRIS: Hybrid Ranking and Regression Forests for Algorithm Selection [75.84584400866254]
両アプローチの強みを両アプローチの弱さを緩和しつつ組み合わせ, 特殊林を利用した新しいアルゴリズムセレクタを提案する。
HARRISの決定は、ハイブリッドランキングと回帰損失関数に基づいて最適化された木を作成する森林モデルに基づいている。
論文 参考訳(メタデータ) (2022-10-31T14:06:11Z) - Estimating leverage scores via rank revealing methods and randomization [50.591267188664666]
任意のランクの正方形密度あるいはスパース行列の統計レバレッジスコアを推定するアルゴリズムについて検討した。
提案手法は,高密度およびスパースなランダム化次元性還元変換の合成と階調明細化法を組み合わせることに基づく。
論文 参考訳(メタデータ) (2021-05-23T19:21:55Z) - PiRank: Learning To Rank via Differentiable Sorting [85.28916333414145]
ランク付けのための新しい分類可能なサロゲートであるPiRankを提案する。
ピランクは所望の指標をゼロ温度の限界で正確に回収する。
論文 参考訳(メタデータ) (2020-12-12T05:07:36Z) - Towards Model-Agnostic Post-Hoc Adjustment for Balancing Ranking
Fairness and Algorithm Utility [54.179859639868646]
Bipartiteランキングは、ラベル付きデータから正の個人よりも上位の個人をランク付けするスコアリング機能を学ぶことを目的としている。
学習したスコアリング機能が、異なる保護グループ間で体系的な格差を引き起こすのではないかという懸念が高まっている。
本稿では、二部構成のランキングシナリオにおいて、それらのバランスをとるためのモデル後処理フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-15T10:08:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。