論文の概要: Whose Alignment? Comparing LLM Process Alignment Across Diverse Organizational Decision Contexts
- arxiv url: http://arxiv.org/abs/2605.25256v1
- Date: Sun, 24 May 2026 21:16:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 19:50:19.047879
- Title: Whose Alignment? Comparing LLM Process Alignment Across Diverse Organizational Decision Contexts
- Title(参考訳): LLMプロセスアライメントを異種組織決定文脈で比較した誰のアライメント?
- Authors: Niklas Weller, Emilio Barkett,
- Abstract要約: プロセスアライメントの計測には意思決定型キャプチャー手法を用いる。
この手法をECHR 第6条の決定に適用すると、プロセスアライメントは出力精度を強く予測する。
競合する領域では、高いプロセスアライメントは外部化や無条件で望ましいものではない。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Aligning AI systems with organizational decision-making is typically framed as a single-target problem: make the model behave like the organization. We argue this framing obscures a deeper pluralistic challenge. We rely on a decision-policy capturing method to measure process alignment: whether an LLM weights information as the organization does, not merely whether it reaches the same conclusions. Applying this method to ECHR Article 6 decisions, process alignment strongly predicts output accuracy (r = 0.85, p < .001) and externalization substantially improves alignment for poorly-aligned models. Applying it to German consumer credit decisions, this relationship collapses (r = 0.15, p = .60): interventions produce inconsistent effects and the benchmark encodes potentially discriminatory historical patterns. This contrast is itself a pluralistic alignment finding: in contested domains, high process alignment is neither achievable via externalization nor unconditionally desirable. Output agreement alone cannot distinguish a model that has internalized an organizational policy from one that merely approximates its outcomes; process-level measurement is a necessary component of any pluralistic alignment evaluation.
- Abstract(参考訳): 組織的な意思決定を伴うAIシステムのアラインメントは、通常、単一ターゲットの問題として、モデルを組織のように振る舞わせる。
我々は、このフレーミングがより深い多元的課題を曖昧にしていると論じている。
我々は、LCMが組織と同じ情報を重み付けするかどうか、単に同じ結論に達するかどうかという、プロセスアライメントを測定するための意思決定型キャプチャー手法を頼りにしています。
この手法をECHR 第6条の判断に適用することにより、プロセスアライメントは出力精度(r = 0.85, p < .001)を強く予測し、外部化は不整合モデルのアライメントを大幅に改善する。
ドイツの消費者信用決定に適用すると、この関係は崩壊する(r = 0.15, p = .60)。
競合する領域では、高いプロセスアライメントは外部化や無条件で望ましいものではない。
アウトプット合意だけでは、組織政策を内在化したモデルと、単に成果を近似したモデルとを区別することはできない。
関連論文リスト
- Causal Algorithmic Recourse: Foundations and Methods [57.73269033551628]
AIシステムの主な特徴は、個人が否定的な決定を覆す方法のレコメンデーションを提供する能力である。
既存のアプローチでは、recourseの結果を固定単位の反事実として扱う。
我々は、事前および事後結果のプロセスとして、会話をモデル化する因果的枠組みを開発する。
論文 参考訳(メタデータ) (2026-05-12T00:55:19Z) - Can Revealed Preferences Clarify LLM Alignment and Steering? [23.175180848107093]
LLMの観測した選択が最適化するインプリート嗜好を推定するための経験的パイプラインを提案する。
提案手法は,モデルが一貫したゴール指向の振る舞いをするかどうかの厳密な評価を可能にすることを示す。
論文 参考訳(メタデータ) (2026-05-08T23:26:35Z) - HALF: Harm-Aware LLM Fairness Evaluation Aligned with Deployment [52.374772443536045]
HALF(Harm-Aware LLM Fairness)は、現実的なアプリケーションにおけるモデルバイアスを評価し、有害度によって結果を評価するフレームワークである。
HALFは、以前のベンチマークの成功とデプロイメントの準備の整合性の間に明らかなギャップがあることを示します。
論文 参考訳(メタデータ) (2025-10-14T07:13:26Z) - DecisionFlow: Advancing Large Language Model as Principled Decision Maker [49.088778182807395]
DecisionFlowは、モデルにアクション、属性、制約の構造化された表現を推論するように誘導する、新しい決定モデリングフレームワークである。
プロンプトから直接回答を予測するのではなく、DecisionFlowは意味論的に根拠のある決定空間を構築し、潜在ユーティリティ関数を推論する。
実験の結果,DecisionFlowの精度は,強いプロンプトベースラインよりも最大30%向上した。
論文 参考訳(メタデータ) (2025-05-27T16:23:53Z) - The simulation of judgment in LLMs [32.57692724251287]
大規模言語モデル(LLM)は、情報フィルタリングから説明と信頼性の判断を通じて知識ギャップの評価と対処に至るまで、評価プロセスに組み込まれている。
これにより、このような評価がどのように構築されるのか、どのような仮定に依存しているのか、その戦略が人間のものとどのように異なるのかを調べる必要が生じる。
我々は、専門家の評価に対して、6つのLCM(NewsGuardとMedia Bias/Fact Check)と、制御された実験を通して収集された人間の判断に対してベンチマークを行った。
論文 参考訳(メタデータ) (2025-02-06T18:52:10Z) - Modularity in Reinforcement Learning via Algorithmic Independence in
Credit Assignment [79.5678820246642]
提案手法は, 事前決定の順序に対して, スパース変化のみを必要とする伝達問題に対して, 政策段階の手法よりも, より標本効率が高いことを示す。
我々は最近提案された社会的意思決定の枠組みをマルコフ決定プロセスよりもよりきめ細かい形式主義として一般化する。
論文 参考訳(メタデータ) (2021-06-28T21:29:13Z) - Reinforcement Learning based Collective Entity Alignment with Adaptive
Features [35.04861875266298]
本稿では,エンティティを集合的にアライメントする強化学習(RL)モデルを提案する。
RLフレームワークでは、相互依存と集団アライメントを特徴付けるコヒーレンスと排他的性制約を考案しています。
提案手法は,言語横断型と単言語型の両方のEAベンチマークで評価し,最先端のソリューションと比較した。
論文 参考訳(メタデータ) (2021-01-05T05:04:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。