論文の概要: Purging the Gray Zone: Latent-Geometric Denoising for Precise Knowledge Boundary Awareness
- arxiv url: http://arxiv.org/abs/2604.14324v1
- Date: Wed, 15 Apr 2026 18:28:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-17 21:29:29.987019
- Title: Purging the Gray Zone: Latent-Geometric Denoising for Precise Knowledge Boundary Awareness
- Title(参考訳): グレーゾーンの取得:精密知識境界認識のための潜時幾何学的デノジング
- Authors: Hao An, Yibin Lou, Jiayi Guo, Yang Xu,
- Abstract要約: 大型言語モデル (LLM) はしばしば、自身の知識境界を正確に知覚できないために幻覚を示す。
本稿では,決定超平面近傍の"グレーゾーン"を明らかにするために,遅延空間表現の観点を採用する。
本稿では,*GeoDe**(**Geo**metric **De**noising)フレームワークを提案する。
- 参考スコア(独自算出の注目度): 10.100316281261163
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large language models (LLMs) often exhibit hallucinations due to their inability to accurately perceive their own knowledge boundaries. Existing abstention fine-tuning methods typically partition datasets directly based on response accuracy, causing models to suffer from severe label noise near the decision boundaries and consequently exhibit high rates of abstentions or hallucinations. This paper adopts a latent space representation perspective, revealing a "gray zone" near the decision hyperplane where internal belief ambiguity constitutes the core performance bottleneck. Based on this insight, we propose the **GeoDe** (**Geo**metric **De**noising) framework for abstention fine-tuning. This method constructs a truth hyperplane using linear probes and performs "geometric denoising" by employing geometric distance as a confidence signal for abstention decisions. This approach filters out ambiguous boundary samples while retaining high-fidelity signals for fine-tuning. Experiments across multiple models (Llama3, Qwen3) and benchmark datasets (TriviaQA, NQ, SciQ, SimpleQA) demonstrate that GeoDe significantly enhances model truthfulness and demonstrates strong generalization in out-of-distribution (OOD) scenarios. Code is available at https://github.com/Notbesidemoon/GeoDe.
- Abstract(参考訳): 大型言語モデル (LLM) はしばしば、自身の知識境界を正確に知覚できないために幻覚を示す。
既存の禁忌細調整法は、通常、応答精度に基づいてデータセットを分割し、決定境界付近で重度のラベルノイズに悩まされ、結果として、禁忌や幻覚の頻度が高くなる。
本稿では,内的信念の曖昧さが中心的な性能ボトルネックを構成する超平面近傍の「グレーゾーン」を明らかにする。
この知見に基づいて, 控えめな微調整のための**GeoDe**(**Geo**metric**De**noising)フレームワークを提案する。
線形プローブを用いて真理超平面を構築し、幾何距離を吸収判定のための信頼信号として利用して「幾何デノナイジング」を行う。
このアプローチは、微調整のための高忠実度信号を保持しながら、あいまいな境界サンプルをフィルタリングする。
複数のモデル(Llama3, Qwen3)とベンチマークデータセット(TriviaQA, NQ, SciQ, SimpleQA)にまたがる実験により、GeoDeはモデルの真理性を大幅に向上し、配布外(OOD)シナリオにおいて強力な一般化を示す。
コードはhttps://github.com/Notbesidemoon/GeoDe.comで入手できる。
関連論文リスト
- Do We Need Perfect Data? Leveraging Noise for Domain Generalized Segmentation [20.89655949578527]
本稿では,この制限を頑健な学習機会に変換するフレームワークFLEX-Segを提案する。
5つの実世界のデータセットに対する実験は、最先端の手法よりも一貫した改善を示している。
その結果、不完全な合成データを扱うための適応的戦略が、ドメインの一般化に優れた結果をもたらすことが検証された。
論文 参考訳(メタデータ) (2025-11-28T07:46:32Z) - Rethinking Contrastive Learning in Graph Anomaly Detection: A Clean-View Perspective [54.605073936695575]
グラフ異常検出は、Webセキュリティやファイナンシャル不正検出などの分野で広く応用されているグラフベースのデータにおいて、異常なパターンを特定することを目的としている。
既存の手法は対照的な学習に依存しており、ノードとその局所部分グラフの間のより低い類似性は異常を示すと仮定する。
干渉エッジの存在は、対照的な学習過程を損なう破壊的なノイズをもたらすため、この仮定を無効にする。
コントラスト学習プロセスにおいて重要な干渉源を特定するために,複数スケールの異常認識モジュールを含むクリーンビュー拡張グラフ異常検出フレームワーク(CVGAD)を提案する。
論文 参考訳(メタデータ) (2025-05-23T15:05:56Z) - The Spacetime of Diffusion Models: An Information Geometry Perspective [40.23096112113255]
決定論的確率フローを用いた標準的なプルバック手法であるComplementODEデコーダが根本的に欠陥があることが示される。
遅延時空$z=(x_t,t)$を導入し、すべてのノイズスケールにわたる分布の族を指数化する。
結果として得られた構造は、ジオデシックが最小限のノイズ列を追跡し、データ間の編集を飾る、原則付き拡散距離編集(Diffusion Distance Edit)を誘導する。
論文 参考訳(メタデータ) (2025-05-23T06:16:58Z) - ARMAX identification of low rank graphical models [0.6906005491572401]
大規模システムでは複雑な内部関係がしばしば存在し、このような相互接続システムは低階のプロセスによって効果的に記述できる。
既存の下級識別アプローチは、ノイズを明示的に考慮しないことが多く、弱い雑音の下でも無視できない不正確さにつながった。
論文 参考訳(メタデータ) (2025-01-16T15:43:32Z) - Generative Edge Detection with Stable Diffusion [52.870631376660924]
エッジ検出は一般的に、主に識別法によって対処されるピクセルレベルの分類問題と見なされる。
本稿では、事前学習した安定拡散モデルのポテンシャルを十分に活用して、GED(Generative Edge Detector)という新しい手法を提案する。
複数のデータセットに対して広範な実験を行い、競争性能を達成する。
論文 参考訳(メタデータ) (2024-10-04T01:52:23Z) - Graph Anomaly Detection with Noisy Labels by Reinforcement Learning [13.135788402192215]
本稿では,新しいフレームワークREGAD,すなわちReinforced Graph Anomaly Detectorを提案する。
具体的には,高信頼ラベルを用いたノード間を近似したノイズエッジを切断することにより,ベース検出器の性能向上(AUC)を最大化することを目的とする。
論文 参考訳(メタデータ) (2024-07-08T13:41:21Z) - GLENet: Boosting 3D Object Detectors with Generative Label Uncertainty Estimation [70.75100533512021]
本稿では,対象物の潜在的可算有界箱の多様性として,ラベルの不確実性問題を定式化する。
本稿では,条件付き変分オートエンコーダを応用した生成フレームワークであるGLENetを提案する。
GLENetが生成するラベルの不確実性はプラグアンドプレイモジュールであり、既存のディープ3D検出器に便利に統合することができる。
論文 参考訳(メタデータ) (2022-07-06T06:26:17Z) - Robust Fine-Tuning of Deep Neural Networks with Hessian-based
Generalization Guarantees [20.2407347618552]
オーバーフィッティングの問題を理解するために,ファインチューニングの一般化特性について検討する。
本稿では,クラス条件独立ノイズモデルに基づくアルゴリズムと一般化誤差保証を提案する。
論文 参考訳(メタデータ) (2022-06-06T14:52:46Z) - Tackling Instance-Dependent Label Noise via a Universal Probabilistic
Model [80.91927573604438]
本稿では,ノイズラベルをインスタンスに明示的に関連付ける,単純かつ普遍的な確率モデルを提案する。
合成および実世界のラベルノイズを用いたデータセット実験により,提案手法がロバスト性に大きな改善をもたらすことを確認した。
論文 参考訳(メタデータ) (2021-01-14T05:43:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。