論文の概要: Peer Identity Bias in Multi-Agent LLM Evaluation: An Empirical Study Using the TRUST Democratic Discourse Analysis Pipeline
- arxiv url: http://arxiv.org/abs/2604.22971v1
- Date: Fri, 24 Apr 2026 19:32:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-28 17:12:07.076828
- Title: Peer Identity Bias in Multi-Agent LLM Evaluation: An Empirical Study Using the TRUST Democratic Discourse Analysis Pipeline
- Title(参考訳): 多エージェントLDM評価におけるピアアイデンティティバイアス:TRUST民主党談話分析パイプラインを用いた実証的研究
- Authors: Juergen Dietrich,
- Abstract要約: 我々は、TRUSTの全てのアクティブなアイデンティティ露光チャンネルにおいて、識別依存のスコアリングバイアスを初めて体系的に測定した。
単一チャネルの匿名化は、個々のチャネルが反対方向に作用し、互いにキャンセルするので、ほぼゼロのバイアス効果をもたらす。
1つの試験されたモデルは、他の2倍から3倍の塩基性シコファンシーを示し、イデオロギーに関するほぼゼロの熟考的対立を示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The TRUST democratic discourse analysis pipeline exposes its large language model (LLM) components to peer model identity through multiple structural channels -- a design feature whose bias implications have not previously been empirically tested. We provide the first systematic measurement of identity-dependent scoring bias across all active identity exposure channels in TRUST, crossing four model families with two anonymization scopes across 30 political statements. The central finding is that single-channel anonymization produces near-zero bias effects, because individual channels act in opposite directions and cancel each other out -- a result that would lead an evaluator to conclude that identity bias is absent when it is not. Only full-pipeline anonymization reveals the true pattern: homogeneous ensembles amplify identity-driven sycophancy when model identity is fully visible, while the heterogeneous production configuration shows the reverse. Model choice matters independently: one tested model exhibits baseline sycophancy two to three times higher than the others and near-zero deliberative conflict on ideological topics, making it structurally unsuitable for pipelines where genuine inter-role disagreement is the intended quality mechanism. Three practical conclusions follow. First, heterogeneous model ensembles are structurally more robust than homogeneous ones, achieving higher consensus rates and lower identity amplification. Second, full-pipeline anonymization is required for valid bias measurement -- partial anonymization is insufficient and actively misleading. Third, these findings have direct implications for the validation of multi-agent LLM systems in quality-critical applications: a system validated under partial anonymization or with a homogeneous ensemble may pass validation while retaining structural identity bias invisible to single-channel measurement.
- Abstract(参考訳): TRUSTの民主的談話分析パイプラインは、その大きな言語モデル(LLM)コンポーネントを、複数の構造チャネルを通じてピアモデルアイデンティティに公開する。
本稿は、TRUSTのすべてのアクティブなアイデンティティ露光チャンネルにおいて、30の政治声明に2つの匿名化範囲を持つ4つのモデルファミリを横断する、アイデンティティ依存のスコアリングバイアスを初めて体系的に測定するものである。
中心的な発見は、単一チャネルの匿名化がほぼゼロのバイアス効果を生み出すことである。それは個々のチャネルが反対方向に作用し、互いにキャンセルするからである。
均質なアンサンブルは、モデルアイデンティティが完全に可視であるときにアイデンティティ駆動型サイコファンシーを増幅し、異質な生産構成は逆を示す。
モデル選択は独立して問題となる: 1つの試験されたモデルは、他のモデルよりも2倍から3倍高いベースラインサイコフィケーションを示し、イデオロギーのトピックに関するほぼゼロの熟考的対立を示し、真のロック間不一致が意図された品質メカニズムであるパイプラインに構造的に不適である。
3つの実践的な結論が続く。
第一に、異種モデルアンサンブルは均質モデルよりも構造的に堅牢であり、より高いコンセンサス率と低いアイデンティティ増幅を達成する。
第二に、有効なバイアス測定には全パイプの匿名化が必要であり、部分的な匿名化は不十分であり、積極的に誤解を招く。
第3に、これらの発見は、品質クリティカルなアプリケーションにおけるマルチエージェントLPMシステムの検証に直接的な意味を持つ: 部分匿名化または均質アンサンブルで検証されたシステムは、単一チャネル測定で見えない構造的同一性バイアスを維持しながら、検証をパスする可能性がある。
関連論文リスト
- Identity-Decoupled Anonymization for Visual Evidence in Multi-modal Retrieval-Augmented Generation [9.39195684989942]
Identity-Decoupled MRAGは、生成匿名化モジュールを検索と生成の間に介在するフレームワークである。
提案手法は,各面を識別符号と空間的に構造化された属性コードに分解し,相互情報的ペナルティと勾配に基づく独立項で正規化する不整形変分エンコーダ,識別符号を元のものと現実とを区別することが保証された合成物に置換する多様体認識拒絶サンプリング器,および (iii)匿名化顔と置換IDとを合成する条件付き潜時拡散発生器からなる。
論文 参考訳(メタデータ) (2026-04-26T07:42:33Z) - Beyond Nodes vs. Edges: A Multi-View Fusion Framework for Provenance-Based Intrusion Detection [6.343815622517112]
PROVfusionは、証明に基づく侵入検知のための多視点異常融合フレームワークである。
軽量な融合スキームを通じて異種異常信号を融合し、投票ベースの統合プロセスを通じて最終的な異常決定を決定する。
広く使用されている9つのベンチマークエンティティデータセットの実験では、PROVfusionは単一ノードとエッジ中心のベースラインよりも高い検出精度と偽陽性率を実現する。
論文 参考訳(メタデータ) (2026-04-16T06:40:50Z) - Quantifying Model Uniqueness in Heterogeneous AI Ecosystems [1.1162481475388237]
In-Silico Quasi-Experimental Design に基づく監査モデル一意性に関する統計的枠組みを提案する。
モデル間で一致した介入を強制することにより、本質的なモデルのアイデンティティを分離し、一意性を Peer-Inpresentible Residual (PIER) として定量化する。
これらの結果は、信頼できるAIを単一のモデルの説明以上のものにする。
論文 参考訳(メタデータ) (2026-01-30T13:41:53Z) - Towards Unification of Hallucination Detection and Fact Verification for Large Language Models [31.407333541614296]
大規模言語モデル(LLM)は、しばしば幻覚を示し、流動的に見えるコンテンツを生成するが、実際には正しくない。
この課題に対処するために、モデル中心の幻覚検出(HD)とテキスト中心のFact Verification(FV)という、2つの異なる研究パラダイムが登場した。
我々は,FVとHDの直接,インスタンスレベルの比較を可能にする統一評価フレームワークUniFactを紹介する。
論文 参考訳(メタデータ) (2025-12-02T13:51:01Z) - Beyond Inference Intervention: Identity-Decoupled Diffusion for Face Anonymization [55.29071072675132]
顔の匿名化は、非同一性属性を保持しながら、識別情報を隠蔽することを目的としている。
トレーニング中心の匿名化フレームワークである textbfIDsuperscript2Face を提案する。
IDtextsuperscript2Faceは、視覚的品質、アイデンティティの抑制、ユーティリティ保存において、既存の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2025-10-28T09:28:12Z) - RoboView-Bias: Benchmarking Visual Bias in Embodied Agents for Robotic Manipulation [67.38036090822982]
ロボット操作における視覚バイアスの定量化を目的とした,最初のベンチマークであるRoboView-Biasを提案する。
我々は、個々の視覚的要因とその相互作用によって引き起こされるバイアスの堅牢な測定を可能にする2,127のタスクインスタンスを作成します。
本研究は,視覚バイアスの系統的解析が,安全で信頼性の高い汎用的なエンボディエージェントの開発に必須であることを示す。
論文 参考訳(メタデータ) (2025-09-26T13:53:25Z) - Fair Deepfake Detectors Can Generalize [51.21167546843708]
共同設立者(データ分散とモデルキャパシティ)の制御により,公正な介入による一般化が向上することを示す。
この知見を応用して, 逆正当性重み付けとサブグループワイド特徴正規化を併用し, 新たなアライメント・アライメント・アライメント・アライメント・アライメント・アライメント・アライメント・アライメント・インセンティブ・インターベンション・インベンション・インテクション(DAID)を提案する。
DAIDは、いくつかの最先端技術と比較して、公平性と一般化の両方において一貫して優れた性能を達成する
論文 参考訳(メタデータ) (2025-07-03T14:10:02Z) - Nonparametric Identifiability of Causal Representations from Unknown
Interventions [63.1354734978244]
本研究では, 因果表現学習, 潜伏因果変数を推定するタスク, およびそれらの変数の混合から因果関係を考察する。
我々のゴールは、根底にある真理潜入者とその因果グラフの両方を、介入データから解決不可能なあいまいさの集合まで識別することである。
論文 参考訳(メタデータ) (2023-06-01T10:51:58Z) - Stable Bias: Analyzing Societal Representations in Diffusion Models [72.27121528451528]
本稿では,テキスト・ツー・イメージ(TTI)システムにおける社会的バイアスを探索する新しい手法を提案する。
我々のアプローチは、プロンプト内の性別や民族のマーカーを列挙して生成された画像の変動を特徴づけることに依存している。
我々はこの手法を利用して3つのTTIシステムによって生成された画像を分析し、そのアウトプットが米国の労働人口層と相関しているのに対して、彼らは常に異なる範囲において、限界化されたアイデンティティを低く表現している。
論文 参考訳(メタデータ) (2023-03-20T19:32:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。