論文の概要: XChoice: Explainable Evaluation of AI-Human Alignment in LLM-based Constrained Choice Decision Making
- arxiv url: http://arxiv.org/abs/2601.11286v1
- Date: Fri, 16 Jan 2026 13:35:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-19 20:21:50.506213
- Title: XChoice: Explainable Evaluation of AI-Human Alignment in LLM-based Constrained Choice Decision Making
- Title(参考訳): XChoice: LLMに基づく制約付き選択決定におけるAI-Humanアライメントの説明可能な評価
- Authors: Weihong Qi, Fan Huang, Rasika Muralidharan, Jisun An, Haewoon Kwak,
- Abstract要約: XChoiceは、制約のある意思決定においてAIと人間のアライメントを評価するための説明可能なフレームワークである。
我々は、アメリカン・タイム・ユース・サーベイ(ATUS)を人間的根拠として、アメリカ人の日々の時間割当についてXChoiceを実証する。
全体として、XChoiceは、ミスアライメントを診断し、表面結果整合以上の情報改善をサポートするメカニズムベースのメトリクスを提供する。
- 参考スコア(独自算出の注目度): 7.250052258137294
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present XChoice, an explainable framework for evaluating AI-human alignment in constrained decision making. Moving beyond outcome agreement such as accuracy and F1 score, XChoice fits a mechanism-based decision model to human data and LLM-generated decisions, recovering interpretable parameters that capture the relative importance of decision factors, constraint sensitivity, and implied trade-offs. Alignment is assessed by comparing these parameter vectors across models, options, and subgroups. We demonstrate XChoice on Americans' daily time allocation using the American Time Use Survey (ATUS) as human ground truth, revealing heterogeneous alignment across models and activities and salient misalignment concentrated in Black and married groups. We further validate robustness of XChoice via an invariance analysis and evaluate targeted mitigation with a retrieval augmented generation (RAG) intervention. Overall, XChoice provides mechanism-based metrics that diagnose misalignment and support informed improvements beyond surface outcome matching.
- Abstract(参考訳): 我々は、制約された意思決定におけるAI-ヒューマンアライメントを評価するための説明可能なフレームワークであるXChoiceを紹介する。
正確性やF1スコアといった結果の合意を超えて、XChoiceは、人間データとLLM生成決定にメカニズムベースの決定モデルを適用し、決定要因の相対的重要性、制約感度、インプリートトレードオフをキャプチャする解釈可能なパラメータを復元する。
アライメントはこれらのパラメータベクトルをモデル、オプション、サブグループ間で比較することによって評価される。
我々は、アメリカン・タイム・ユース・サーベイ(ATUS)を人間的根拠として、アメリカ人の日々の時間割当に関するXChoiceを実証し、モデルと活動にまたがる不均一なアライメントと、ブラックグループと既婚グループに集中した健康的不整合を明らかにした。
さらに,XChoiceの非分散解析によるロバスト性を検証し,検索拡張生成(RAG)介入による目標緩和を評価する。
全体として、XChoiceは、ミスアライメントを診断し、表面結果整合以上の情報改善をサポートするメカニズムベースのメトリクスを提供する。
関連論文リスト
- Statistical inference after variable selection in Cox models: A simulation study [0.0]
本稿では、ラッソ係数とその拡張であるアダプティブ・ラッソに対する変数選択後に適用されるいくつかの推論手順について検討する。
検討された手法には、サンプル分割、正確な選択後の推測、偏りのあるラッソが含まれる。
論文 参考訳(メタデータ) (2026-02-07T10:14:21Z) - A Principled Approach to Randomized Selection under Uncertainty: Applications to Peer Review and Grant Funding [61.86327960322782]
本稿では,各項目の品質の間隔推定に基づくランダム化意思決定の枠組みを提案する。
最適化に基づく最適化手法であるMERITを導入する。
MERITが既存のアプローチで保証されていない望ましい公理特性を満たすことを証明している。
論文 参考訳(メタデータ) (2025-06-23T19:59:30Z) - Decision Making in Changing Environments: Robustness, Query-Based Learning, and Differential Privacy [59.64384863882473]
本研究では,環境が時間とともに変化する対話的意思決定の課題について考察する。
意思決定の複雑さと敵意的な設定の複雑さを提供するフレームワークを提案する。
論文 参考訳(メタデータ) (2025-01-24T21:31:50Z) - One Model Many Scores: Using Multiverse Analysis to Prevent Fairness Hacking and Evaluate the Influence of Model Design Decisions [4.362723406385396]
設計と評価の決定の公平さをよりよく理解するために,多変量解析をどのように利用できるかを示す。
結果から,システム評価に関する決定が,同じモデルに対して,極めて異なる公平度指標を導出する可能性を強調した。
論文 参考訳(メタデータ) (2023-08-31T12:32:43Z) - Attitudes and Latent Class Choice Models using Machine learning [0.0]
LCCM (Latent Class Choice Models) の仕様において, 位置インジケータを効率的に組み込む手法を提案する。
この定式化は、位置指標と決定選択との関係を探索する能力において構造方程式を克服する。
我々は,デンマークのコペンハーゲンから,カーシェアリング(Car-Sharing, CS)サービスサブスクリプションの選択を推定するためのフレームワークをテストした。
論文 参考訳(メタデータ) (2023-02-20T10:03:01Z) - Robust Design and Evaluation of Predictive Algorithms under Unobserved Confounding [6.925076885159747]
本稿では,予測アルゴリズムの堅牢な設計と評価のためのフレームワークを提案する。
様々な不確定な仮定が、所得グループ間での信用リスク予測と公平性評価に大きく影響していることが示される。
論文 参考訳(メタデータ) (2022-12-19T20:41:44Z) - Explainability's Gain is Optimality's Loss? -- How Explanations Bias
Decision-making [0.0]
説明は、アルゴリズムと人間の意思決定者とのコミュニケーションを促進するのに役立つ。
因果モデルに関する特徴に基づく説明のセマンティクスは、意思決定者の以前の信念から漏れを引き起こす。
このような違いは、準最適かつ偏った決定結果をもたらす可能性がある。
論文 参考訳(メタデータ) (2022-06-17T11:43:42Z) - Off-Policy Evaluation with Policy-Dependent Optimization Response [90.28758112893054]
我々は,テキスト政治に依存した線形最適化応答を用いた非政治評価のための新しいフレームワークを開発した。
摂動法による政策依存推定のための非バイアス推定器を構築する。
因果介入を最適化するための一般的なアルゴリズムを提供する。
論文 参考訳(メタデータ) (2022-02-25T20:25:37Z) - A integrating critic-waspas group decision making method under
interval-valued q-rung orthogonal fuzzy enviroment [0.0]
本稿では,重みと属性の重みが未知な多属性群意思決定のための新しいツールを提案する。
本稿では,Yager演算子とCRITIC-WASPAS法に基づいて,時間間隔値の一般化されたファジィ群決定法を提案する。
その利点は、意思決定者がより大きな自由を許容し、意思決定者の重みによる偏見を回避し、正確な評価を得ることにある。
論文 参考訳(メタデータ) (2022-01-04T08:11:28Z) - Calibrating Predictions to Decisions: A Novel Approach to Multi-Class
Calibration [118.26862029820447]
我々は、下流の意思決定者に対して、予測された分布と真の分布を区別不能にする必要がある新しい概念、即時校正を導入します。
決定キャリブレーションは、皮膚病変の判定と、現代のニューラルネットワークを用いたImageNet分類を改善する。
論文 参考訳(メタデータ) (2021-07-12T20:17:28Z) - When Does Uncertainty Matter?: Understanding the Impact of Predictive
Uncertainty in ML Assisted Decision Making [68.19284302320146]
我々は,異なるレベルの専門知識を持つ人々が,異なるタイプの予測不確実性にどう反応するかを評価するために,ユーザスタディを実施している。
その結果,後続の予測分布を示すことは,MLモデルの予測との相違点が小さくなることがわかった。
このことは、後続の予測分布は、人間の分布の種類や専門性を考慮し、注意を払って使用するべき有用な決定支援として役立つ可能性があることを示唆している。
論文 参考訳(メタデータ) (2020-11-12T02:23:53Z) - Decision-Making with Auto-Encoding Variational Bayes [71.44735417472043]
変分分布とは異なる後部近似を用いて意思決定を行うことが示唆された。
これらの理論的な結果から,最適モデルに関するいくつかの近似的提案を学習することを提案する。
おもちゃの例に加えて,単細胞RNAシークエンシングのケーススタディも紹介する。
論文 参考訳(メタデータ) (2020-02-17T19:23:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。