論文の概要: Aligning LLM Uncertainty with Human Disagreement in Subjectivity Analysis
- arxiv url: http://arxiv.org/abs/2605.10415v2
- Date: Wed, 13 May 2026 13:41:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-14 17:13:58.856575
- Title: Aligning LLM Uncertainty with Human Disagreement in Subjectivity Analysis
- Title(参考訳): 主観的分析における人体識別の不確かさの調整
- Authors: Junyu Lu, Deyi Ji, Xuanyi Liu, Lanyun Zhu, Bo Xu, Liang Yang, Xian-Sheng Hua, Hongfei Lin,
- Abstract要約: 我々は、モデルが人間の不一致を反映した不確実性を表現しながら予測する不確実性を考慮した主観性分析を提唱する。
この視点を運用するために,二相認識と不確実性アライメントの枠組みを提案する。
3つの主観的分析課題の実験は、DPUAが人間の不一致とモデルの不確実性をよりよく整合させながら、タスク性能を保っていることを示している。
- 参考スコア(独自算出の注目度): 57.78407973423517
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large language models for subjectivity analysis are typically trained with aggregated labels, which compress variations in human judgment into a single supervision signal. This paradigm overlooks the intrinsic uncertainty of low-agreement samples and often induces overconfident predictions, undermining reliability and generalization in complex subjective settings. In this work, we advocate uncertainty-aware subjectivity analysis, where models are expected to make predictions while expressing uncertainty that reflects human disagreement. To operationalize this perspective, we propose a two-phase Disagreement Perception and Uncertainty Alignment (DPUA) framework. Specifically, DPUA jointly models label prediction, rationale generation, and uncertainty expression under an uncertainty-aware setting. In the disagreement perception phase, adaptive decoupled learning enhances the model's sensitivity to disagreement-related cues while preserving task performance. In the uncertainty alignment phase, GRPO-based reward optimization further improves uncertainty-aware reasoning and aligns the model's confidence expression with the human disagreement distribution. Experiments on three subjectivity analysis tasks show that DPUA preserves task performance while better aligning model uncertainty with human disagreement, mitigating overconfidence on boundary samples, and improving out-of-distribution generalization.
- Abstract(参考訳): 主観的分析のための大規模言語モデルは一般に、人間の判断のバリエーションを単一の監視信号に圧縮する集約ラベルで訓練される。
このパラダイムは、低収差サンプルの本質的な不確実性を見落とし、しばしば自信過剰な予測を誘発し、複雑な主観的設定における信頼性と一般化を損なう。
本研究では,人間の不一致を反映した不確実性を表現するとともに,モデルによる予測が期待される不確実性を考慮した主観性分析を提唱する。
そこで我々は,この視点を運用するために,DPUA(Disagreement Perception and Uncertainty Alignment)フレームワークを提案する。
具体的には、DPUAは、不確実性を考慮した条件下でのラベル予測、合理的生成、不確実性表現を共同でモデル化する。
不一致認識フェーズでは、適応的疎結合学習は、タスク性能を維持しながら、不一致関連キューに対するモデルの感度を高める。
不確実性アライメントフェーズにおいて、GRPOに基づく報酬最適化は不確実性認識推論をさらに改善し、モデルの信頼性表現と人間の不一致分布とを整合させる。
3つの主観的分析課題の実験では、DPUAは、モデルの不確実性を人間の不一致と整合させ、境界サンプルへの過信を軽減し、分布外一般化を改善するとともに、タスク性能を保っている。
関連論文リスト
- Sensitivity Uncertainty Alignment in Large Language Models [0.0]
逆入力およびあいまい入力下での大規模言語モデルの故障を解析するためのフレームワークを提案する。
我々はスカラースコア SUA_theta(x) を定義し、分布感度と予測エントロピーの差を捉える。
我々は,一貫性の正則化とエントロピーアライメントを組み合わせたトレーニング手法SUA-TRと,より安全な推論のための禁制ルールを導入する。
論文 参考訳(メタデータ) (2026-04-21T17:53:12Z) - Rubric-Guided Fine-tuning of SpeechLLMs for Multi-Aspect, Multi-Rater L2 Reading-Speech Assessment [8.300738063140129]
本稿では,多視点評価基準を明示的に符号化したルーリック誘導推論フレームワークを提案する。
我々は、解釈可能な信頼区間に対する共形キャリブレーションによって支持される不確実性校正回帰手法を開発する。
以上の結果から,ルーブリック誘導型不確実性校正推論は,信頼性と説明可能なSpeechLLMに基づく音声評価への原則的道筋を提供することが示された。
論文 参考訳(メタデータ) (2026-02-28T11:08:24Z) - Towards Reliable LLM-based Robot Planning via Combined Uncertainty Estimation [68.106428321492]
大規模言語モデル (LLM) は高度な推論能力を示し、ロボットが自然言語の命令を理解し、適切な接地で高レベルな計画を生成することができる。
LLMの幻覚は重大な課題であり、しばしば過度に信頼され、不一致または安全でない計画に繋がる。
本研究は, 信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性評価を別々に評価するものである。
論文 参考訳(メタデータ) (2025-10-09T10:26:58Z) - Uncertainty-Supervised Interpretable and Robust Evidential Segmentation [16.64288013782432]
不確実性の推定は、信頼性を提供するツールとして、医用画像セグメンテーションにおいて広く研究されている。
従来手法では、不確実性推定の効果的な監督が欠如していた。
本研究では,不確実性の学習を指導する自己教師型アプローチを提案する。
論文 参考訳(メタデータ) (2025-09-21T14:31:47Z) - SConU: Selective Conformal Uncertainty in Large Language Models [59.25881667640868]
SconU(Selective Conformal Uncertainity)と呼ばれる新しいアプローチを提案する。
我々は,特定の管理可能なリスクレベルで設定されたキャリブレーションの不確実性分布から,与えられたサンプルが逸脱するかどうかを決定するのに役立つ2つの共形p値を開発する。
我々のアプローチは、単一ドメインと学際的コンテキストの両方にわたる誤発見率の厳密な管理を促進するだけでなく、予測の効率を高める。
論文 参考訳(メタデータ) (2025-04-19T03:01:45Z) - Probabilistic Modeling of Disparity Uncertainty for Robust and Efficient Stereo Matching [61.73532883992135]
本稿では,新しい不確実性を考慮したステレオマッチングフレームワークを提案する。
我々はベイズリスクを不確実性の測定として採用し、データを別々に見積もり、不確実性をモデル化する。
論文 参考訳(メタデータ) (2024-12-24T23:28:20Z) - Toward Reliable Human Pose Forecasting with Uncertainty [51.628234388046195]
我々は、複数のモデルを含む人間のポーズ予測のためのオープンソースのライブラリを開発し、複数のデータセットをサポートする。
我々は、パフォーマンスを高め、より良い信頼をもたらすために、問題の2つの不確実性を考案する。
論文 参考訳(メタデータ) (2023-04-13T17:56:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。