論文の概要: Multi-Stakeholder LLM Alignment: Decomposing Estimation from Aggregation
- arxiv url: http://arxiv.org/abs/2605.26878v1
- Date: Tue, 26 May 2026 11:37:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-27 17:51:41.979578
- Title: Multi-Stakeholder LLM Alignment: Decomposing Estimation from Aggregation
- Title(参考訳): マルチステークホルダLLMアライメント:アグリゲーションからの推定を分解する
- Authors: Lulu Zheng, Wenjin Yang, Xiangwen Zhang, Rong Yin, Yulan Hu, Zheng Pan, Xin Li,
- Abstract要約: 我々は,このアグリゲーション固有の強調ノイズが,利害関係者の満足度を分散させると,大きなスコアシフトを引き起こすことを実証的,理論的に示す。
提案するtextscDecompR: 候補スコアの前にクエリ構造から逆ファクト重みを固定し, ロール単位のユーティリティを独立して推定する。
- 参考スコア(独自算出の注目度): 11.441422865035312
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Multi-stakeholder tasks require one output to satisfy users with conflicting preferences. Holistic LLM judges conflate utility estimation and utility aggregation, yielding unstable implicit weights. We show empirically and theoretically that this aggregation-specific \emph{weighting noise} can create large score shifts when stakeholder satisfaction is dispersed; in our experiments, these weight-induced shifts also increase with stakeholder count. We propose \textsc{DecompR}: counterfactual-calibrated weights are fixed from query structure before candidate scoring, while per-role utilities are estimated independently, removing candidate-dependent weight drift and reducing estimation noise.
- Abstract(参考訳): マルチステークホルダータスクは、相反する好みを持つユーザを満たすために1つのアウトプットを必要とする。
ホロスティックLLMは、ユーティリティ推定とユーティリティアグリゲーションを詳述し、不安定な暗黙の重みを生じる。
実験では,このアグリゲーション特異的な"emph{weighting noise"が,利害関係者の満足度を分散させると大きなスコアシフトを生じさせることを示す。
提案手法は,候補の採点前における問合せ構造から反事実校正重みを固定し,一方,ルール毎のユーティリティを独立に推定し,候補に依存した重みのドリフトを除去し,推定ノイズを低減することである。
関連論文リスト
- Uncertainty-Aware Variational Reward Factorization via Probabilistic Preference Bases for LLM Personalization [32.29307367283854]
本稿では,各ユーザの嗜好を共有嗜好空間における変分分布として表現する不確実性を考慮したフレームワークである,変分因数分解(VRF)を紹介する。
VRFは、変動エンコーダを介してユーザ分布を推測し、ワッサーシュタイン距離と共有確率ベースとの一致による重みを導出し、分散減衰損失による不確実な推定を導出する。
論文 参考訳(メタデータ) (2026-04-01T14:58:51Z) - Dependence-Aware Label Aggregation for LLM-as-a-Judge via Ising Models [55.94503936470247]
大規模なAI評価は、審査員を含む、$K$アノテータからのバイナリ判断を集約することにますます依存している。
ほとんどの古典的なメソッドは、アノテータが条件的に独立であると仮定するが、真のラベルは$Yin0,1$であり、この仮定は LLM の審査員によってしばしば違反される。
我々はIsingグラフィカルモデルと潜在因子に基づく依存認識モデルの階層構造を通してラベルアグリゲーションを研究する。
論文 参考訳(メタデータ) (2026-01-29T21:26:50Z) - Sparsity Is Necessary: Polynomial-Time Stability for Agentic LLMs in Large Action Spaces [11.62669179647184]
ツール拡張LLMシステムは、学習理論が無視してきた制御体制を公開する。
我々は、この設定をスパースエージェント制御(SAC)として定式化し、M上のブロックスパース表現を認めるポリシーを定式化する。
部分可観測性の下では, LLM は信念/表現誤差 epsilon_b によってのみ重要となり, 付加的な O(epsilon_b) 劣化が生じる。
論文 参考訳(メタデータ) (2026-01-13T06:56:53Z) - SCOPE: Stochastic and Counterbiased Option Placement for Evaluating Large Language Models [0.27309692684728604]
大規模言語モデル(LLM)は、選択肢の位置やラベルに固有のバイアスを生かして、複数の選択タスクの膨らませたスコアを達成できる。
本研究では,データセットに依存しない方法で選択バイアスを計測・緩和するSCOPEを提案する。
論文 参考訳(メタデータ) (2025-07-24T08:28:17Z) - Inference Scaling for Bridging Retrieval and Augmented Generation [47.091086803980765]
大規模言語モデル(LLM)の出力を操る一般的なアプローチとして、検索拡張世代(RAG)が登場している。
このようなバイアスは、推論スケーリングから、検索されたコンテキストの置換順序からの推論呼び出しの集約まで緩和可能であることを示す。
ROUGE-L は MS MARCO で,EM は HotpotQA ベンチマークで 7 ポイント向上した。
論文 参考訳(メタデータ) (2024-12-14T05:06:43Z) - ADEPT: A DEbiasing PrompT Framework [64.54665501064659]
ファインタニングは文脈化された単語の埋め込みを曖昧にするための応用手法である。
意味的な意味を持つ個別のプロンプトは、タスクを乱すのに有効であることが示されている。
本稿では, PLM をデバイアス化する方法であるADEPT を提案し, バイアス除去と表現能力の確保の微妙なバランスを維持しながら, 即時チューニングによる PLM のデバイアス化手法を提案する。
論文 参考訳(メタデータ) (2022-11-10T08:41:40Z) - CARMS: Categorical-Antithetic-REINFORCE Multi-Sample Gradient Estimator [60.799183326613395]
本稿では, 相互に負に相関した複数のサンプルに基づく分類的確率変数の非バイアス推定器を提案する。
CARMSは、ReINFORCEとコプラベースのサンプリングを組み合わせることで、重複サンプルを回避し、その分散を低減し、重要サンプリングを使用して推定器を偏りなく維持する。
我々は、生成的モデリングタスクと構造化された出力予測タスクに基づいて、いくつかのベンチマークデータセット上でCARMSを評価し、強力な自己制御ベースラインを含む競合する手法より優れていることを示す。
論文 参考訳(メタデータ) (2021-10-26T20:14:30Z) - Deconfounding Scores: Feature Representations for Causal Effect
Estimation with Weak Overlap [140.98628848491146]
推定対象の偏りを伴わずに高い重なりを生じさせる,デコンファウンディングスコアを導入する。
分離スコアは観測データで識別可能なゼロ共分散条件を満たすことを示す。
特に,この手法が標準正規化の魅力的な代替となることを示す。
論文 参考訳(メタデータ) (2021-04-12T18:50:11Z) - Optimal Off-Policy Evaluation from Multiple Logging Policies [77.62012545592233]
我々は,複数のロギングポリシからオフ政治評価を行い,それぞれが一定のサイズ,すなわち階層化サンプリングのデータセットを生成する。
複数ロガーのOPE推定器は,任意のインスタンス,すなわち効率のよいインスタンスに対して最小分散である。
論文 参考訳(メタデータ) (2020-10-21T13:43:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。