論文の概要: Towards FairRAG: Preventing Representational Harm in Retrieval-Augmented Generation by Enforcing Fair Exposure at Retrieval Time
- arxiv url: http://arxiv.org/abs/2605.18806v1
- Date: Mon, 11 May 2026 22:01:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-20 21:37:32.346367
- Title: Towards FairRAG: Preventing Representational Harm in Retrieval-Augmented Generation by Enforcing Fair Exposure at Retrieval Time
- Title(参考訳): FairRAGに向けて:検索時間における公正な露光の強化による検索型世代における表現的ハームの防止
- Authors: Riddhi Tikoo,
- Abstract要約: Retrieval-augmented Generation (RAG) は幻覚に対処する技術である。
RAGのマルチコンポーネントパイプラインは、バイアスを導入可能な脆弱性を導入している。
本研究は,2つの提案された露出認識手法とともに,これまで開発されたユーティリティ重視のランキング戦略について考察する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As Large Language Model (LLM) integration has accelerated in high-stakes domains, model hallucination is a critical issue. Retrieval-augmented generation (RAG) is a technique for addressing hallucination; however, RAG's multi-component pipeline introduces vulnerabilities where biases can be introduced. This study considers two previously developed utility-focused ranking strategies (Standard and Stochastic) alongside two proposed exposure-aware approaches (Forced-Exposure and Representative Stochastic). Using the TREC 2022 Fair Ranking Dataset, which contains Wikipedia articles annotated as protected or non-protected, the LLM was asked to identify relevant articles with citations for four scenario-based Q&A prompts. The retrieval rankings and the generated outputs were evaluated for exposure bias and utility across all ranking methods. Overall, the Representative Stochastic ranker resulted in a statistically significant near-parity average exposure, acknowledging that relevance scores initially produced during retrieval are already shaped by representational bias, whereas the other rankers assume those scores are unbiased. Across all the methods of document ranking, generation demographic parity closely mirrored the exposure parity, reinforcing that representational bias in RAG systems is driven by retrieval and propagates to generation. These findings highlight that retrieval ranking is a critical point for mitigating downstream bias and propose a Representative Stochastic ranker that reintroduces fairness in RAG systems.
- Abstract(参考訳): 大規模言語モデル(LLM)の統合は、ハイテイクドメインにおいて加速しているため、モデル幻覚は重要な問題である。
Retrieval-augmented Generation(RAG)は幻覚に対処するテクニックであるが、RAGのマルチコンポーネントパイプラインは、バイアスを導入可能な脆弱性を導入している。
本研究では,従来開発された実用性重視のランキング戦略 (Standard と Stochastic) と,提案した露出対応アプローチ (Forced-Exposure と Representative Stochastic) について考察する。
TREC 2022 Fair Ranking Dataset(英語版)は、ウィキペディアの記事が保護または保護されていないと注釈付けされており、LLMは4つのシナリオベースのQ&Aプロンプトの引用で関連する記事を特定するよう求められた。
検索ランキングと生成したアウトプットは,すべてのランキング法において,露出バイアスと有効性について評価した。
全体として、代議員の確率的ランク付けは統計的に有意な近距離平均露出をもたらし、検索中に最初に生成された関連スコアは表現バイアスによって既に形作られており、他のランク付け者はそれらのスコアが偏りがないと仮定している。
文書ランキングのすべての方法において、生成人口比は露出パリティを忠実に反映し、RAGシステムにおける表現バイアスは検索によって駆動され、生成へと伝播していることを強調した。
これらの結果から,検索ランキングは下流バイアスを緩和する重要なポイントであり,RAGシステムにおける公平性を再導入する代表的確率ランク付け手法を提案する。
関連論文リスト
- Masking or Mitigating? Deconstructing the Impact of Query Rewriting on Retriever Biases in RAG [20.162803360845462]
本稿では,クエリエンハンスメント手法が検索バイアスに与える影響について,最初の系統的研究を行う。
単純な書き換えは、最も強力な集合バイアス低減(54%)を達成するが、複数のバイアスが組み合わさった敵の条件下では失敗する。
本結果は,特定のバイアス脆弱性に基づいてクエリ拡張戦略を選択するための実用的なガイダンスを提供する。
論文 参考訳(メタデータ) (2026-04-07T17:10:15Z) - Evaluating Social Bias in RAG Systems: When External Context Helps and Reasoning Hurts [7.344577590113121]
大規模言語モデル(LLM)に固有の社会的バイアスは、かなりの公平さを懸念する。
この研究は、RAGの社会的バイアスの影響を評価し、理解することに焦点を当てている。
論文 参考訳(メタデータ) (2026-02-10T06:27:56Z) - Re-Rankers as Relevance Judges [65.37611299805856]
再ランカ・アズ・レバレンス・ジャッジ設定で再ランカを再現する。
TREC-DL 2019〜2023では,220Mから32Bの3家族から8人の再ランカを対象に実験を行い,再ランカに基づく審査員による評価バイアスを分析した。
論文 参考訳(メタデータ) (2026-01-08T00:02:59Z) - Exposing Hidden Biases in Text-to-Image Models via Automated Prompt Search [18.386455479798574]
Bias-Guided Prompt Search (BGPS)は、画像内のバイアスの存在を最大化するプロンプトを自動的に生成するフレームワークである。
BGPSは、(1)属性ニュートラルなプロンプトを生成するよう指示されたLLMと、(2)TTIの内部表現に作用する属性分類器の2つのコンポーネントから構成される。
我々は、安定拡散1.5と最先端の縮退モデルに関する広範な実験を行い、微妙で以前は文書化されていなかったバイアスの配列を発見する。
論文 参考訳(メタデータ) (2025-12-09T15:39:04Z) - T-Retrievability: A Topic-Focused Approach to Measure Fair Document Exposure in Information Retrieval [22.953432572278597]
本稿では,トピックに着目した局所的検索可能性尺度を提案し,まずトポロジカル関連文書の複数グループにわたる検索可能性スコアを算出した。
我々の分析は、様々なニューラルランキングモデルの露出特性に関する新しい知見を明らかにする。
論文 参考訳(メタデータ) (2025-08-29T15:14:16Z) - Perplexity Trap: PLM-Based Retrievers Overrate Low Perplexity Documents [64.43980129731587]
因果診断・矯正法(CDC)という因果推論時間脱バイアス法を提案する。
CDCはまず、パープレキシティのバイアス効果を診断し、その後、全体の関連スコアからバイアス効果を分離する。
3つの領域にまたがる実験結果から, より優れた脱バイアス効果が示された。
論文 参考訳(メタデータ) (2025-03-11T17:59:00Z) - Towards Fair RAG: On the Impact of Fair Ranking in Retrieval-Augmented Generation [53.285436927963865]
本論文は,公正度を意識したランキングを組み込んだRAGシステムの最初の体系的評価である。
フェアネスを意識した検索を組み込むことで、ランキング品質と生成品質の両面を維持・強化することが少なくない。
論文 参考訳(メタデータ) (2024-09-17T23:10:04Z) - Thinking Racial Bias in Fair Forgery Detection: Models, Datasets and Evaluations [63.52709761339949]
最初に、Fair Forgery Detection(FairFD)データセットと呼ばれる専用のデータセットをコントリビュートし、SOTA(Public State-of-the-art)メソッドの人種的偏見を証明する。
我々は、偽りの結果を避けることができる平均的メトリクスと実用正規化メトリクスを含む新しいメトリクスを設計する。
また,有効で堅牢な後処理技術であるBias Pruning with Fair Activations (BPFA)も提案する。
論文 参考訳(メタデータ) (2024-07-19T14:53:18Z) - Societal Biases in Retrieved Contents: Measurement Framework and
Adversarial Mitigation for BERT Rankers [9.811131801693856]
ランキングモデルの検索したテキスト内容の公平性を測定するための新しいフレームワークを提供する。
本稿では,最先端のbertrankersに適用した逆バイアス緩和手法を提案する。
MARCOベンチマークの結果,全てのランキングモデルの公正度は,ランク付け非依存のベースラインの公平度よりも低いが,検索内容の公平度は,提案した対角トレーニングの適用時に著しく向上することが示された。
論文 参考訳(メタデータ) (2021-04-28T08:53:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。