論文の概要: AGSC: Adaptive Granularity and Semantic Clustering for Uncertainty Quantification in Long-text Generation
- arxiv url: http://arxiv.org/abs/2604.06812v1
- Date: Wed, 08 Apr 2026 08:25:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-09 17:30:51.425966
- Title: AGSC: Adaptive Granularity and Semantic Clustering for Uncertainty Quantification in Long-text Generation
- Title(参考訳): AGSC:長文生成における不確実性定量化のための適応粒度と意味クラスタリング
- Authors: Guanran Luo, Wentao Qiu, Wanru Zhao, Wenhan Lv, Zhongquan Jian, Meihong Wang, Qingqiang Wu,
- Abstract要約: AGSC(Adaptive Granularity and GMM-based Semantic Clustering)は、長文生成に適したUQフレームワークである。
AGSCはまずNLI中立確率を用いて不確実性と無関係性を区別し、不要な計算を減らした。
BIOとLongFactの実験では、AGSCは完全な原子分解と比較して推論時間を約60%削減しながら、事実と最先端の相関を達成している。
- 参考スコア(独自算出の注目度): 13.35380243690811
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large Language Models (LLMs) have demonstrated impressive capabilities in long-form generation, yet their application is hindered by the hallucination problem. While Uncertainty Quantification (UQ) is essential for assessing reliability, the complex structure makes reliable aggregation across heterogeneous themes difficult, in addition, existing methods often overlook the nuance of neutral information and suffer from the high computational cost of fine-grained decomposition. To address these challenges, we propose AGSC (Adaptive Granularity and GMM-based Semantic Clustering), a UQ framework tailored for long-form generation. AGSC first uses NLI neutral probabilities as triggers to distinguish irrelevance from uncertainty, reducing unnecessary computation. It then applies Gaussian Mixture Model (GMM) soft clustering to model latent semantic themes and assign topic-aware weights for downstream aggregation. Experiments on BIO and LongFact show that AGSC achieves state-of-the-art correlation with factuality while reducing inference time by about 60% compared to full atomic decomposition.
- Abstract(参考訳): LLM(Large Language Models)は、長文生成において印象的な機能を示すが、幻覚の問題によってその応用が妨げられている。
不確実性定量化(UQ)は信頼性を評価するのに不可欠であるが、複雑な構造は不均一なテーマをまたいだ信頼性の高い集約を困難にし、また既存の手法は中立情報のニュアンスを無視し、より微細な分解の計算コストが高くなる。
これらの課題に対処するため、長文生成に適したUQフレームワークAGSC(Adaptive Granularity and GMM-based Semantic Clustering)を提案する。
AGSCはまずNLI中立確率をトリガーとして使用し、不確実性と無関係性を区別し、不要な計算を減らした。
次に、Gaussian Mixture Model(GMM)ソフトクラスタリングを適用して、潜在意味テーマをモデル化し、下流アグリゲーションにトピック認識重みを割り当てる。
BIOとLongFactの実験では、AGSCは完全な原子分解と比較して推論時間を約60%削減しながら、事実と最先端の相関を達成している。
関連論文リスト
- Weight-Informed Self-Explaining Clustering for Mixed-Type Tabular Data [63.62853416081748]
WISEは表現、特徴重み付け、クラスタリング、解釈を統一するフレームワークである。
クラスタリングを駆動する同じプリミティブに根ざした、忠実で人間解釈可能な説明を生成する。
論文 参考訳(メタデータ) (2026-04-07T13:18:31Z) - Adaptive Guidance for Retrieval-Augmented Masked Diffusion Models [60.25003813232697]
本稿では,Masked Diffusion Models (MDMs) のトレーニング自由適応ガイダンスフレームワークとして,適応検索型Masked Diffusion (ARAM) を提案する。
ARAMは、検索した文脈によって誘導される分布シフトのSNR(Signal-to-Noise Ratio)に従って、雑音発生時の誘導スケールを校正する。
複数の知識集約型QAベンチマークの実験は、ARAMが競争力のあるRAGベースラインよりも全体的なQA性能を改善することを示している。
論文 参考訳(メタデータ) (2026-03-18T12:54:50Z) - GTS: Inference-Time Scaling of Latent Reasoning with a Learnable Gaussian Thought Sampler [54.10960908347221]
我々は、学習可能な密度から条件付きサンプリングとして潜在思考探索をモデル化し、このアイデアをガウス思想サンプリング(GTS)としてインスタンス化する。
GTSは、連続的推論状態における文脈依存摂動分布を予測し、バックボーンを凍結させながらGRPOスタイルのポリシー最適化を訓練する。
論文 参考訳(メタデータ) (2026-02-15T09:57:47Z) - CoT-Seg: Rethinking Segmentation with Chain-of-Thought Reasoning and Self-Correction [50.67483317563736]
本稿では,段階的に考察し,必要な情報を検索し,結果を生成し,自己評価を行い,結果を洗練するシステムを提案する。
CoT-Segは、思考の連鎖推論と自己補正を組み合わせることで、推論セグメンテーションを再考する、トレーニング不要のフレームワークである。
論文 参考訳(メタデータ) (2026-01-24T11:41:54Z) - Disentangling History and Propagation Dependencies in Cross-Subject Knee Contact Stress Prediction Using a Shared MeshGraphNet Backbone [0.8283940114367679]
予測の不確実性の主な原因が時間的履歴依存か空間的伝播依存かは、まだ不明である。
OpenSim-FEBioワークフローを使用して、9つの被験者による試行のデータセットを構築した。
ヒストリーエンコーディングを組み込んだモデルは、大域的精度と空間的整合性において、ベースラインMGNとModMGNを大きく上回った。
論文 参考訳(メタデータ) (2026-01-13T08:15:57Z) - Robust fuzzy clustering for high-dimensional multivariate time series with outlier detection [8.124770608442377]
RFCPCAは、多変量時系列データに適した、堅牢なファジィサブスペースクラスタリング手法である。
潜時構造を捕捉し、校正されたメンバーシップの不確実性を提供し、汚染下で安定なまま、フラグ列レベルのアウトリーチを提供する。
ドライバEEGでは、RFCPCAは関連するメソッドよりもクラスタリングの精度を向上し、不確実性と外れ値の構造のより信頼性の高い特徴を与える。
論文 参考訳(メタデータ) (2025-10-30T20:16:28Z) - Generate Aligned Anomaly: Region-Guided Few-Shot Anomaly Image-Mask Pair Synthesis for Industrial Inspection [53.137651284042434]
異常検査は製造業において重要な役割を担っているが、異常サンプルの不足は既存の方法の有効性を制限している。
本稿では,GAA (Generate grained Anomaly) を提案する。
GAAは少数のサンプルのみを用いて現実的で多様で意味的に整合した異常を発生させる。
論文 参考訳(メタデータ) (2025-07-13T12:56:59Z) - ReTimeCausal: EM-Augmented Additive Noise Models for Interpretable Causal Discovery in Irregular Time Series [32.21736212737614]
本稿では, 金融, 医療, 気候科学などの高度領域における不規則サンプル時系列における因果発見について検討する。
ReTimeCausalは,物理誘導型データ計算と疎因性推論を統一する付加雑音モデル(ANM)と期待最大化(EM)の新たな統合である。
論文 参考訳(メタデータ) (2025-07-04T05:39:50Z) - PHEATPRUNER: Interpretable Data-centric Feature Selection for Multivariate Time Series Classification through Persistent Homology [0.0937465283958018]
PHeatPrunerは時系列分類における性能と解釈可能性のバランスをとる方法である。
永続ホモロジーは、適用変数の最大45%のプルーニングを促進する。
シーフ理論は、データの構造的ニュアンスに関する深い洞察を提供する説明ベクトルに寄与する。
論文 参考訳(メタデータ) (2025-04-25T13:14:11Z) - MS$^3$D: A RG Flow-Based Regularization for GAN Training with Limited Data [16.574346252357653]
物理における再正規化群(RG)の考え方に基づく新しい正規化法を提案する。
本手法は,限られたデータシナリオ下でのGANの性能と安定性を効果的に向上できることを示す。
論文 参考訳(メタデータ) (2024-08-20T18:37:37Z) - Conditional Hybrid GAN for Sequence Generation [56.67961004064029]
本稿では,この問題を解決するための条件付きハイブリッドGAN(C-Hybrid-GAN)を提案する。
我々はGumbel-Softmax法を利用して離散値列の分布を近似する。
提案したC-Hybrid-GANは、文脈条件付き離散値シーケンス生成において既存の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-09-18T03:52:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。