論文の概要: WavePhaseNet: A DFT-Based Method for Constructing Semantic Conceptual Hierarchy Structures (SCHS)
- arxiv url: http://arxiv.org/abs/2602.14419v1
- Date: Mon, 16 Feb 2026 03:07:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-17 16:22:50.053334
- Title: WavePhaseNet: A DFT-Based Method for Constructing Semantic Conceptual Hierarchy Structures (SCHS)
- Title(参考訳): WavePhaseNet:意味的概念階層構造(SCHS)構築のためのDFTに基づく手法
- Authors: Kiyotaka Kasubuchi, Kazuo Fukiya,
- Abstract要約: 本稿では,大規模言語モデルにおけるトランスフォーマー/アテンション機構を再構成する。
GPT-4の24,576次元埋め込み空間は、言語自己相似性とZipfの法則に基づく1/fスペクトル構造を示す。
コホモロジー整合性制御(Cohomological Consistency Control) 局所窓の重なり合うコホモロジー正則化によって構築される最小の埋め込み空間は、グラフ構造とコチェーン複体を定義することができる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper reformulates Transformer/Attention mechanisms in Large Language Models (LLMs) through measure theory and frequency analysis, theoretically demonstrating that hallucination is an inevitable structural limitation. The embedding space functions as a conditional expectation over a σ-algebra, and its failure to be isomorphic to the semantic truth set fundamentally causes logical consistency breakdown. WavePhaseNet Method The authors propose WavePhaseNet, which explicitly constructs a Semantic Conceptual Hierarchy Structure (SCHS) using Discrete Fourier Transform (DFT). By applying DFT along the sequence dimension, semantic information is decomposed into frequency bands: low-frequency components capture global meaning and intent, while high-frequency components represent local syntax and expression. This staged separation enables precise semantic manipulation in diagonalized space. Dimensionality Reduction GPT-4's 24,576-dimensional embedding space exhibits a 1/f spectral structure based on language self-similarity and Zipf's law. Through cumulative energy analysis, the authors derive that approximately 3,000 dimensions constitute the lower bound for "complete representation." This demonstrates that reduction from 24,576 to 3,000 dimensions preserves meaning and intent while enabling rigorous reasoning and suppressing hallucination. Cohomological Consistency Control The reduced embedding space, constructed via cohomological regularization over overlapping local windows, allows defining a graph structure and cochain complex. This quantifies inconsistencies among local inferences as coboundary-based losses. Applying harmonic projection based on Hodge theory positions cohomology as a computable regularization principle for controlling semantic consistency, extracting maximally consistent global representations.
- Abstract(参考訳): 本稿では,大規模言語モデル(LLM)におけるトランスフォーマー/アテンション機構を,測度理論と周波数解析によって再構成し,幻覚が必然的構造的限界であることを理論的に証明する。
埋め込み空間はσ-代数上の条件付き期待として機能し、その意味論的真理集合に同型でないことが論理的整合分解を根本的に引き起こす。
WavePhaseNet Method 著者らは、離散フーリエ変換(DFT)を用いて意味論的概念階層構造(SCHS)を明示的に構築するWavePhaseNetを提案する。
低周波成分はグローバルな意味と意図を捉え、高周波成分は局所的な構文と表現を表現する。
この段階的分離は、対角化空間における正確な意味操作を可能にする。
GPT-4の24,576次元埋め込み空間は、言語自己相似性とZipfの法則に基づく1/fスペクトル構造を示す。
累積エネルギー解析により、約3,000次元が「完全表現」の下位境界を構成することが導かれる。
これは、24,576次元から3,000次元への縮小が、厳密な推論と幻覚の抑制を可能にしながら、意味と意図を保っていることを示している。
コホモロジー整合性制御(Cohomological Consistency Control) 局所窓の重なり合うコホモロジー正則化によって構築される最小の埋め込み空間は、グラフ構造とコチェーン複体を定義することができる。
これは、局所的な推論の不整合をコバウンダリベースの損失として定量化する。
ホッジ理論に基づく調和射影の適用は、コホモロジーを意味的一貫性を制御するための計算可能な正則化原理として位置づけ、最大一貫した大域的表現を抽出する。
関連論文リスト
- Latent Object Permanence: Topological Phase Transitions, Free-Energy Principles, and Renormalization Group Flows in Deep Transformer Manifolds [0.5729426778193398]
幾何学的および統計的物理レンズを用いた深部変圧器言語モデルにおける多段階推論の出現について検討する。
我々は、フォワードパスを離散粗粒度写像として形式化し、安定な「概念盆地」の出現と、この再正規化のような力学の固定点を関連付ける。
結果として生じる低エントロピー状態は、スペクトルテール崩壊と、表現空間における過渡的で再利用可能なオブジェクトのような構造の形成によって特徴づけられる。
論文 参考訳(メタデータ) (2026-01-16T23:11:02Z) - Improving LLM Reasoning with Homophily-aware Structural and Semantic Text-Attributed Graph Compression [55.51959317490934]
大規模言語モデル(LLM)は、テキスト分散グラフ(TAG)理解において有望な能力を示している。
グラフは本来、構造情報や意味情報を豊富に含むものであり、それらの有効利用はLLMの推論性能の潜在的な利益を解放する可能性があると論じる。
グラフホモフィリーの活用を目的としたフレームワーク LLMs (HS2C) のホモフィリー対応構造とセマンティック圧縮を提案する。
論文 参考訳(メタデータ) (2026-01-13T03:35:18Z) - Text-to-State Mapping for Non-Resolution Reasoning: The Contradiction-Preservation Principle [0.0]
非解答推論(Non-Resolution Reasoning、NRR)は、初期解釈の崩壊を強制するのではなく、意味的曖昧性を維持するための正式な枠組みを提供する。
本稿では,言語入力をNRRフレームワーク内の重ね合わせ状態に変換するテキスト間マッピング機能を提案する。
論文 参考訳(メタデータ) (2026-01-12T08:04:47Z) - SIGMA: Scalable Spectral Insights for LLM Collapse [51.863164847253366]
SIGMA(Spectral Inequalities for Gram Matrix Analysis)は,モデル崩壊のための統一的なフレームワークである。
行列のスペクトル上の決定論的境界を導出するベンチマークを利用することで、SIGMAは表現空間の収縮を追跡するために数学的に基底化された計量を提供する。
我々は、SIGMAが状態への遷移を効果的に捉え、崩壊のメカニズムに関する理論的知見の両方を提供することを示した。
論文 参考訳(メタデータ) (2026-01-06T19:47:11Z) - TokenBlowUp: Resolving Representational Singularities in LLM Token Spaces via Monoidal Transformations [0.9179857807576733]
最近の研究は、大規模言語モデルのトークン埋め込み空間に対する基礎多様体仮説に挑戦する説得力のある証拠を提供している。
我々はこの問題をスキーム理論の言語で定式化し、スキーム理論のブローアップを各特異点に適用することにより厳密な解法を提案する。
我々は、この新しい空間の幾何学的正則化を保証する公式な定理を証明し、元の病理が解決されたことを示す。
論文 参考訳(メタデータ) (2025-07-26T02:39:54Z) - Matched Topological Subspace Detector [16.216899458761773]
本研究では, 単体(エッジなど)で定義された信号や, 単体複合体のすべてのレベルを横断する信号に対して, ナイマン・ピアソンマッチングトポロジカル部分空間検出器を提案する。
本稿では,外貨交換網を含む実世界の各種データに対する検出器の有効性を実証する。
論文 参考訳(メタデータ) (2025-04-08T10:38:30Z) - DIFFormer: Scalable (Graph) Transformers Induced by Energy Constrained
Diffusion [66.21290235237808]
本稿では,データセットからのインスタンスのバッチを進化状態にエンコードするエネルギー制約拡散モデルを提案する。
任意のインスタンス対間の対拡散強度に対する閉形式最適推定を示唆する厳密な理論を提供する。
各種タスクにおいて優れた性能を有する汎用エンコーダバックボーンとして,本モデルの適用性を示す実験を行った。
論文 参考訳(メタデータ) (2023-01-23T15:18:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。