論文の概要: Axiomatizing Neural Networks via Pursuit of Subspaces
- arxiv url: http://arxiv.org/abs/2605.20534v1
- Date: Tue, 19 May 2026 22:12:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-21 19:19:56.396614
- Title: Axiomatizing Neural Networks via Pursuit of Subspaces
- Title(参考訳): 部分空間の探索によるニューラルネットワークの公理化
- Authors: Mehmet Yamac, Mert Duman, Ugur Akpinar, Felix Rojas Casadiego, Serkan Kiranyaz, Marcel van Gerven, Moncef Gabbouj,
- Abstract要約: 本稿では,一組の幾何学を通してニューラルネットワークの挙動を定式化する公理的フレームワークであるPursuit of Subspaces (PoS)仮説を紹介する。
この枠組みは,表現構造やアーキテクチャ機構,一般化行動など,ディープラーニングの基本的問題に対する幾何学的説明を与える。
- 参考スコア(独自算出の注目度): 18.584665304905897
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While deep neural networks have achieved remarkable success across a wide range of domains, their underlying mechanisms remain poorly understood, and they are often regarded as black boxes. This gap between empirical performance and theoretical understanding poses a challenge analogous to the pre-axiomatic stage of classical geometry. In this work, we introduce the Pursuit of Subspaces (PoS) hypothesis, an axiomatic framework that formulates neural network behavior through a set of geometric postulates. These axioms, together with their derived consequences, provide a unified perspective on representation, computation, and generalization in both shallow and deep architectures. We show that this framework yields geometric explanations for fundamental questions in deep learning, including representation structure, architectural mechanisms, and generalization behavior, offering a principled step toward a coherent theoretical foundation.
- Abstract(参考訳): ディープニューラルネットワークは幅広い領域で顕著な成功を収めてきたが、その基盤となるメカニズムは理解されていないままであり、ブラックボックスと見なされることが多い。
この経験的性能と理論的理解のギャップは、古典幾何学の公理以前の段階に類似した挑戦をもたらす。
本研究では,ニューラルネットワークの挙動を幾何的仮定を用いて定式化する公理的フレームワークであるPursuit of Subspaces (PoS)仮説を紹介する。
これらの公理は、それらの導出した結果とともに、浅いアーキテクチャと深いアーキテクチャの両方における表現、計算、一般化に関する統一的な視点を提供する。
この枠組みは, 表現構造, アーキテクチャ機構, 一般化行動など, 深層学習の基本的問題に対する幾何学的説明を与える。
関連論文リスト
- Pointwise Generalization in Deep Neural Networks [24.565019622696664]
深層ネットワークのトラクタビリティを説明する構造特性と数学的原理を同定する。
深層ネットワークは数学的に計算可能であり,その一般化はポイントワイズ,特徴スペクトル認識複雑性によって明確に説明できることを示す。
論文 参考訳(メタデータ) (2026-05-18T16:09:06Z) - Foundations of Artificial Intelligence Frameworks: Notion and Limits of AGI [0.0]
人工知能は、スケールに関係なく、現在のニューラルネットワークパラダイムから生まれない、と我々は主張する。
本稿では,既存の施設(計算基板)と建築組織を区別する枠組みを提案する。
論文 参考訳(メタデータ) (2025-11-23T16:18:13Z) - The Impact of Geometric Complexity on Neural Collapse in Transfer Learning [6.554326244334867]
損失面の平坦さと神経崩壊は、最近、有用な事前学習指標として現れている。
実験と理論を通じて、事前学習されたネットワークの幾何学的複雑さに影響を与えるメカニズムが神経崩壊に影響を及ぼすことを示す。
論文 参考訳(メタデータ) (2024-05-24T16:52:09Z) - Rank Diminishing in Deep Neural Networks [71.03777954670323]
ニューラルネットワークのランクは、層をまたがる情報を測定する。
これは機械学習の幅広い領域にまたがる重要な構造条件の例である。
しかし、ニューラルネットワークでは、低ランク構造を生み出す固有のメカニズムはあいまいで不明瞭である。
論文 参考訳(メタデータ) (2022-06-13T12:03:32Z) - A singular Riemannian geometry approach to Deep Neural Networks I.
Theoretical foundations [77.86290991564829]
ディープニューラルネットワークは、音声認識、機械翻訳、画像解析など、いくつかの科学領域で複雑な問題を解決するために広く使われている。
我々は、リーマン計量を備えた列の最後の多様体で、多様体間の写像の特定の列を研究する。
このようなシーケンスのマップの理論的性質について検討し、最終的に実践的な関心を持つニューラルネットワークの実装間のマップのケースに焦点を当てる。
論文 参考訳(メタデータ) (2021-12-17T11:43:30Z) - Recent advances in deep learning theory [104.01582662336256]
本稿では,近年のディープラーニング理論の進歩をレビューし,整理する。
文献は,(1)深層学習の一般化可能性を分析する複雑性とキャパシティに基づくアプローチ,(2)勾配降下とその変種をモデル化するための微分方程式とその力学系,(3)動的システムの軌道を駆動する損失景観の幾何学的構造,(5)ネットワークアーキテクチャにおけるいくつかの特別な構造の理論的基礎,の6つのグループに分類される。
論文 参考訳(メタデータ) (2020-12-20T14:16:41Z) - Developing Constrained Neural Units Over Time [81.19349325749037]
本稿では,既存のアプローチと異なるニューラルネットワークの定義方法に焦点をあてる。
ニューラルネットワークの構造は、データとの相互作用にも拡張される制約の特別なクラスによって定義される。
提案した理論は時間領域にキャストされ, データを順序づけられた方法でネットワークに提示する。
論文 参考訳(メタデータ) (2020-09-01T09:07:25Z) - A Chain Graph Interpretation of Real-World Neural Networks [58.78692706974121]
本稿では,NNを連鎖グラフ(CG)、フィードフォワードを近似推論手法として識別する別の解釈を提案する。
CG解釈は、確率的グラフィカルモデルのリッチな理論的枠組みの中で、各NNコンポーネントの性質を規定する。
我々は,CG解釈が様々なNN技術に対する新しい理論的支援と洞察を提供することを示す具体例を実例で示す。
論文 参考訳(メタデータ) (2020-06-30T14:46:08Z) - Understanding Deep Architectures with Reasoning Layer [60.90906477693774]
本研究では,アルゴリズムの収束,安定性,感度といった特性が,エンドツーエンドモデルの近似と一般化能力と密接に関連していることを示す。
私たちの理論は、深いアーキテクチャを推論層で設計するための有用なガイドラインを提供することができます。
論文 参考訳(メタデータ) (2020-06-24T00:26:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。