論文の概要: From Scalars to Tensors: Declared Losses Recover Epistemic Distinctions That Neutrosophic Scalars Cannot Express
- arxiv url: http://arxiv.org/abs/2604.09602v1
- Date: Tue, 10 Mar 2026 01:02:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-19 19:09:11.541864
- Title: From Scalars to Tensors: Declared Losses Recover Epistemic Distinctions That Neutrosophic Scalars Cannot Express
- Title(参考訳): ScalarsからTensorsへ:Neurosophic Scalarsが表現できないてんかんの特定を宣言
- Authors: Tony Mason,
- Abstract要約: Leyva-Vzquez と Smarandache (2025) は、真理、不決定性、ファルシティが 1.0 に制限されない独立次元であるニュートロソフィックな T/I/F 評価が「超真実」を示すことを示した。
我々は5つのベンダーから5つのモデルファミリにまたがって実験を再現し、拡張し、制約のない評価の84%に超真実を見出した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Leyva-Vázquez and Smarandache (2025) demonstrated that neutrosophic T/I/F evaluation, where Truth, Indeterminacy, and Falsity are independent dimensions not constrained to sum to 1.0, which reveals "hyper-truth"' (T+I+F > 1.0) in 35% of complex epistemic cases evaluated by LLMs. We extend their work in two directions. First, we replicate and extend their experiment across five model families from five vendors (Anthropic, Meta, DeepSeek, Alibaba, Mistral), finding hyper-truth in 84% of unconstrained evaluations, which confirms the phenomenon is cross-vendor under our prompt protocol. Second, and more significantly, we identify a limitation of scalar T/I/F that their framework cannot address: models adopting an `"Absorption" position (T=0, I=1, F=0) produce identical scalar outputs for fundamentally different epistemic situations (paradox, ignorance, contingency), collapsing the very distinctions neutrosophic logic was designed to preserve. We demonstrate that extending the evaluation to include declared losses (structured descriptions of what the model cannot evaluate and why) substantially recovers these distinctions. Models producing identical scalars for paradox and ignorance produce nearly disjoint loss vocabularies (Jaccard similarity < 0.10 on loss description keywords), with domain-specific, severity-rated loss declarations that differentiate the nature of their uncertainty. This suggests that scalar T/I/F is a necessary but insufficient representation of epistemic state, and that tensor-structured output (scalars + losses) provides a more faithful model of LLM epistemic capabilities.
- Abstract(参考訳): Leyva-Vázquez と Smarandache (2025) は、好中球性T/I/F評価において、真性、不定性、Falsity が 1.0 に制限されない独立次元であり、LLM による複雑なてんかん症例の35%に "hyper-Truth" (T+I+F > 1.0) が現れることを示した。
私たちは彼らの仕事を2方向に広げる。
まず、これらの実験を5つのベンダー(Anthropic、Meta、DeepSeek、Alibaba、Mistral)から5つのモデルファミリー(Anthropic、DeepSeek、Alibaba、Mistral)で再現して拡張し、制約のない評価の84%にハイパートラストを見つけ、この現象が当社のプロンプトプロトコルの下でクロスベンダであることを確認します。
第二に、我々は彼らのフレームワークが対応できないスカラーT/I/Fの制限を識別する: `"Absorption"位置(T=0, I=1, F=0)を採用するモデルは、基本的に異なる疫学的状況(パラドックス、無知、随伴性)に対して同一のスカラーアウトプットを生成し、ニュートロソフィック論理が保存されるように設計された。
評価を宣言された損失(モデルが評価できないものや理由の構造化された記述)に拡張することで、これらの区別が大幅に回復することを示す。
パラドックスと無知のために同一のスカラーを生成するモデルは、ほぼ不整合な損失語彙(Jaccard similarity < 0.10 on loss description keywords)を生成し、その不確実性の性質を区別するドメイン固有で重症度の高い損失宣言を生成する。
このことは、スカラーT/I/Fは、エピステミック状態の必要だが不十分な表現であり、テンソル構造化された出力(スカラー+ロス)が、より忠実なLLMエピステミック機能のモデルをもたらすことを示唆している。
関連論文リスト
- The Energy of Falsehood: Detecting Hallucinations via Diffusion Model Likelihoods [0.9877005520976847]
LLM(Large Language Models)は、しばしばもっともらしいが誤った主張を幻覚させる。
非平衡熱力学による事実検証を再現する,教師なしのフレームワークであるDiffuTruthを提案する。
論文 参考訳(メタデータ) (2026-02-11T20:52:16Z) - Epistemic Uncertainty Quantification for Pre-trained VLMs via Riemannian Flow Matching [3.0708725114491293]
視覚言語モデル(VLM)は本質的に決定論的であり、不確実性を定量化する固有のメカニズムが欠如している。
我々は,低密度領域がモデル無知を意味するてんかん不確実性の指標として,埋め込みの負の対数密度を理論的に動機付けている。
我々は,REPVLMが不確実性と予測誤差のほぼ完全な相関を達成し,既存のベースラインを著しく上回ることを示す。
論文 参考訳(メタデータ) (2026-01-29T12:58:42Z) - Detecting AI Hallucinations in Finance: An Information-Theoretic Method Cuts Hallucination Rate by 92% [4.693270291878929]
大規模言語モデル(LLMs)は、流動的だがサポートされていない答え、幻覚を生み出す。
ECLIPSEは,モデルの意味エントロピーと利用可能な証拠の容量とのミスマッチとして幻覚を扱うフレームワークである。
論文 参考訳(メタデータ) (2025-12-02T05:25:48Z) - Semantic Energy: Detecting LLM Hallucination Beyond Entropy [106.92072182161712]
大規模言語モデル(LLM)は、現実のアプリケーションにますますデプロイされているが、幻覚の影響を受けやすいままである。
不確実性推定は、そのような幻覚を検出するための実現可能なアプローチである。
本稿では,新しい不確実性推定フレームワークであるセマンティック・エナジーを紹介する。
論文 参考訳(メタデータ) (2025-08-20T07:33:50Z) - Towards Self-Supervised Covariance Estimation in Deep Heteroscedastic Regression [102.24287051757469]
深部異方性回帰における自己教師付き共分散推定について検討する。
正規分布の間の2-ワッサーシュタイン距離の上界を導出する。
幅広い合成データセットと実データセットに対する実験により、提案された2-ワッサーシュタインと擬似ラベルアノテーションが結合した結果、計算的に安価で正確な深部ヘテロ代用回帰が導かれることが示された。
論文 参考訳(メタデータ) (2025-02-14T22:37:11Z) - To Believe or Not to Believe Your LLM [51.2579827761899]
大規模言語モデル(LLM)における不確実性定量化について検討する。
疫学的な不確実性が大きい場合にのみ確実に検出できる情報理論の指標を導出する。
定式化の利点を実証する一連の実験を行う。
論文 参考訳(メタデータ) (2024-06-04T17:58:18Z) - Kernel Language Entropy: Fine-grained Uncertainty Quantification for LLMs from Semantic Similarities [79.9629927171974]
大規模言語モデル(LLM)の不確実性は、安全性と信頼性が重要であるアプリケーションには不可欠である。
ホワイトボックスとブラックボックス LLM における不確実性評価手法である Kernel Language Entropy (KLE) を提案する。
論文 参考訳(メタデータ) (2024-05-30T12:42:05Z) - Position: Understanding LLMs Requires More Than Statistical Generalization [14.059192372377417]
LLMの望ましい性質のいくつかは、良い統計一般化の結果ではないと論じる。
我々の中心的な議論は、AR確率モデルは本質的には識別できないという観察に依存している。
論文 参考訳(メタデータ) (2024-05-03T09:41:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。