論文の概要: Mitigating the Participation Bias by Balancing Extreme Ratings
- arxiv url: http://arxiv.org/abs/2502.03737v1
- Date: Thu, 06 Feb 2025 02:58:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-07 14:31:22.805227
- Title: Mitigating the Participation Bias by Balancing Extreme Ratings
- Title(参考訳): エクストリームレーティングのバランスによる参加バイアスの緩和
- Authors: Yongkang Guo, Yuqing Kong, Jialiang Liu,
- Abstract要約: 我々は、参加バイアスの下で、ロバストな評価集計タスクについて検討する。
私たちの目標は、集計された評価と、基礎となるすべての評価の平均との間の2乗損失を最小化することです。
- 参考スコア(独自算出の注目度): 3.5785450878667597
- License:
- Abstract: Rating aggregation plays a crucial role in various fields, such as product recommendations, hotel rankings, and teaching evaluations. However, traditional averaging methods can be affected by participation bias, where some raters do not participate in the rating process, leading to potential distortions. In this paper, we consider a robust rating aggregation task under the participation bias. We assume that raters may not reveal their ratings with a certain probability depending on their individual ratings, resulting in partially observed samples. Our goal is to minimize the expected squared loss between the aggregated ratings and the average of all underlying ratings (possibly unobserved) in the worst-case scenario. We focus on two settings based on whether the sample size (i.e. the number of raters) is known. In the first setting, where the sample size is known, we propose an aggregator, named as the Balanced Extremes Aggregator. It estimates unrevealed ratings with a balanced combination of extreme ratings. When the sample size is unknown, we derive another aggregator, the Polarizing-Averaging Aggregator, which becomes optimal as the sample size grows to infinity. Numerical results demonstrate the superiority of our proposed aggregators in mitigating participation bias, compared to simple averaging and the spectral method. Furthermore, we validate the effectiveness of our aggregators on a real-world dataset.
- Abstract(参考訳): 評価アグリゲーションは、製品レコメンデーション、ホテルランキング、教育評価など、様々な分野で重要な役割を担っている。
しかしながら、従来の平均化手法は、一部のラッカーが評価プロセスに参加しない参加バイアスの影響を受け、潜在的な歪みにつながる可能性がある。
本稿では,参加バイアス下でのロバストな評価集計課題について考察する。
レーティング担当者は、個々のレーティングによって特定の確率でレーティングを公表しない可能性があり、その結果、部分的に観察されたサンプルが得られたと仮定する。
私たちの目標は、最悪のシナリオにおいて、集計されたレーティングと、基礎となるレーティング(おそらく観測されていない)の平均との間の2乗損失を最小化することです。
サンプルサイズ(すなわちラッカー数)が分かっているかどうかに基づいて、2つの設定に焦点を当てる。
サンプルサイズが知られている最初の設定では、Ba balanced Extremes Aggregator という名前のアグリゲータを提案する。
調査されていない格付けと極端な格付けのバランスの取れた組み合わせを見積もっている。
試料粒径が不明な場合には, 試料粒径が無限に大きくなるにつれて, 試料粒径が最適となるポラライジング平均粒径アグリゲータを導出する。
その結果, 簡単な平均化法やスペクトル法に比べて, 参加者バイアス軽減に有効なアグリゲータの優位性を示した。
さらに,実世界のデータセット上でのアグリゲータの有効性を検証する。
関連論文リスト
- Can Large Language Models Understand Preferences in Personalized Recommendation? [32.2250928311146]
PerRecBenchを導入し、ユーザ評価バイアスとアイテムの品質から評価を分解する。
評価予測に長けているLCMベースのレコメンデーション手法では,ユーザの評価バイアスや項目品質を排除した場合,ユーザの好ましくない項目や好ましくない項目を識別できないことがわかった。
その結果、ポイントワイドランキングよりもペアワイズとリストワイズランキングの方が優れていること、PerRecBenchの従来の回帰指標との相関が低いこと、ユーザプロファイルの重要性、事前学習データ分布の役割が明らかになった。
論文 参考訳(メタデータ) (2025-01-23T05:24:18Z) - Analytical and Empirical Study of Herding Effects in Recommendation Systems [72.6693986712978]
評価アグリゲーションルールとショートリストされた代表レビューを用いて製品評価を管理する方法について検討する。
本稿では,Amazon と TripAdvisor の収束速度を向上させるために,適切な信頼度評価アグリゲーションルールが有効であることを示す。
論文 参考訳(メタデータ) (2024-08-20T14:29:23Z) - Going Beyond Popularity and Positivity Bias: Correcting for Multifactorial Bias in Recommender Systems [74.47680026838128]
ユーザインタラクションデータとレコメンダシステム(RS)の2つの典型的なバイアスは、人気バイアスと肯定バイアスである。
項目と評価値の双方に影響される多因子選択バイアスについて検討する。
分散を低減し、最適化の堅牢性を向上させるため、スムースで交互に勾配降下する手法を提案する。
論文 参考訳(メタデータ) (2024-04-29T12:18:21Z) - Tensor-based Collaborative Filtering With Smooth Ratings Scale [0.0]
人口レベルの異なる評価値間の依存性を表す評価の類似度行列を導入する。
利用者の比率を下げたり下げたりする効果をオフセットすることで、提案された推薦の質を向上させることができる。
論文 参考訳(メタデータ) (2022-05-10T17:55:25Z) - Holistic Approach to Measure Sample-level Adversarial Vulnerability and
its Utility in Building Trustworthy Systems [17.707594255626216]
敵対的攻撃は、知覚不能な雑音を伴うイメージを摂動させ、誤ったモデル予測をもたらす。
本稿では,異なる視点を組み合わせることで,サンプルの敵対的脆弱性を定量化するための総合的アプローチを提案する。
サンプルレベルで確実に敵の脆弱性を推定することにより、信頼できるシステムを開発できることを実証する。
論文 参考訳(メタデータ) (2022-05-05T12:36:17Z) - Abnormal-aware Multi-person Evaluation System with Improved Fuzzy
Weighting [0.0]
粗スクリーニングとスコア重み付きKendall-$tau$ Distanceからなる2段階スクリーニング法を選択する。
ファジィ・シンセティック・アセスメント・メソッド(FSE)を用いて、レビュアーによるスコアの重要度と信頼性を判定する。
論文 参考訳(メタデータ) (2022-05-01T03:42:43Z) - Cross Pairwise Ranking for Unbiased Item Recommendation [57.71258289870123]
我々はCPR(Cross Pairwise Ranking)という新しい学習パラダイムを開発する。
CPRは、露出メカニズムを知らずに不偏の推奨を達成する。
理論的には、この方法が学習に対するユーザ/イテムの適合性の影響を相殺することを証明する。
論文 参考訳(メタデータ) (2022-04-26T09:20:27Z) - Integrating Rankings into Quantized Scores in Peer Review [61.27794774537103]
ピアレビューでは、レビュアーは通常、論文のスコアを提供するように求められます。
この問題を軽減するため、カンファレンスはレビュアーにレビューした論文のランキングを付加するように求め始めている。
このランキング情報を使用するための標準的な手順はなく、エリアチェアは異なる方法でそれを使用することができる。
我々は、ランキング情報をスコアに組み込むために、原則化されたアプローチを取る。
論文 参考訳(メタデータ) (2022-04-05T19:39:13Z) - Universal Off-Policy Evaluation [64.02853483874334]
ユニバーサルオフ政治推定器(UnO)への第一歩を踏み出す
我々は, 平均, 分散, 分位数/中間数, 分位数範囲, cvar, および累積分布全体の推定と同時結合に uno を用いる。
論文 参考訳(メタデータ) (2021-04-26T18:54:31Z) - Deconfounding Scores: Feature Representations for Causal Effect
Estimation with Weak Overlap [140.98628848491146]
推定対象の偏りを伴わずに高い重なりを生じさせる,デコンファウンディングスコアを導入する。
分離スコアは観測データで識別可能なゼロ共分散条件を満たすことを示す。
特に,この手法が標準正規化の魅力的な代替となることを示す。
論文 参考訳(メタデータ) (2021-04-12T18:50:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。