論文の概要: Lattice theory and algebraic models for deep convolutional learning based on mathematical morphology
- arxiv url: http://arxiv.org/abs/2605.24608v1
- Date: Sat, 23 May 2026 14:43:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 19:50:18.271168
- Title: Lattice theory and algebraic models for deep convolutional learning based on mathematical morphology
- Title(参考訳): 数学的形態学に基づく深層畳み込み学習のための格子理論と代数モデル
- Authors: Gustavo, Angulo,
- Abstract要約: 我々は,深層畳み込みアーキテクチャ,CNN,ResNet,UNetなどのエンコーダ・デコーダネットワークのための厳密なフレームワークを開発する。
中心的なツールは、翻訳不変作用素に対するMatheron--Maragos--Banon--Barrera(MMBB)普遍表現理論である。
- 参考スコア(独自算出の注目度): 0.3587119374173258
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We develop a rigorous algebraic framework for deep convolutional architectures, CNNs, ResNets, and encoder--decoder networks such as UNet, grounded in lattice theory and mathematical morphology. The central tool is the Matheron--Maragos--Banon--Barrera (MMBB) universal representation theory for translation-invariant operators, which we apply systematically to every layer of a standard deep network. The principal finding is that the standard CNN pipeline (linear convolution~$+$ ReLU~$+$ flat max-pooling) is a cross-lattice operator: the convolution is an erosion in the Fourier inf-semilattice while ReLU is a lattice-join closing and max-pooling is a dilation in the pointwise max-plus lattice, and their composition is a morphological opening in neither. A second finding is that the upper adjoint of ReLU in the pointwise lattice is a global (non-local) operator, the identity on globally non-negative functions and $-\infty$ otherwise, so no local morphological erosion can form an adjunction pair with ReLU. These two results together provide the precise algebraic reason why depth in standard CNNs introduces genuine representational power: the composed layer is not idempotent. Three layer designs that are genuine idempotent openings are identified and fully characterised: the pure max-plus morphological layer (pointwise lattice), the spectral Wiener layer (Fourier lattice), and the self-dual morphological layer. We establish a complete fixed-point and convergence theory. The framework also unifies max-pooling, strided convolution, and the Laplacian pyramid under the Goutsias--Heijmans adjoint pyramid theory, and gives the Activation--Pooling Dilation (APD) factorisation with its correct adjoint.
- Abstract(参考訳): 我々は、格子理論と数学的形態を基礎とした、深い畳み込みアーキテクチャ、CNN、ResNet、UNetなどのエンコーダ-デコーダネットワークのための厳密な代数的フレームワークを開発する。中心となるツールは、翻訳不変作用素に対するMatheron-Maragos--Banon--Barrera(MMBB)普遍表現理論であり、標準深層ネットワークのすべての層に体系的に適用する。
主な発見は、標準のCNNパイプライン(線型畳み込み~$+$ ReLU~$+$ flat max-pooling)が交叉格子作用素である: 畳み込みはフーリエ Inf-semilattice における浸食であり、ReLU は格子接合閉包であり、最大プールは点方向の最大プラス格子における拡張であり、それらの構成はどちらもモルフォロジー開包ではない。
第二の発見は、ポイントワイド格子におけるReLUの上の随伴は、大域的(非局所的)作用素であり、大域的非負函数上の恒等式と$-\infty$であり、したがって局所的形態的浸食はReLUとの随伴対を形成することができないことである。
これらの2つの結果は、標準CNNの深さが真の表現力をもたらす正確な代数的理由を与える。
純最大余剰モルフォロジー層(ポイントワイア格子)、スペクトルウィーナー層(フーリエ格子)、自己双対モルフォロジー層(英語版)の3つの層設計が同定され、完全に特徴づけられる。
完全不動点収束理論を確立する。
このフレームワークはまた、最大プーリング、強弱畳み込み、ラプラシアピラミッドをグートシアス=ハイマンの随伴ピラミッド理論の下に統一し、その正しい随伴と活性化-ポリシング・ディレーション(英語版)(APD)の分解を与える。
関連論文リスト
- Ternary Gamma Semirings: From Neural Implementation to Categorical Foundations [0.14504054468850663]
本稿では,ニューラルネットワーク学習と抽象代数構造を結合する理論的枠組みを確立する。
まず、標準ニューラルネットワークが合成一般化タスクで完全に失敗することを示す最小限の反例を示す。
この学習された特徴空間が有限可換3次3次3次$-semiringを構成することを証明し、その3次演算は多数決ルールを実装している。
論文 参考訳(メタデータ) (2026-03-15T14:56:33Z) - A Depth Hierarchy for Computing the Maximum in ReLU Networks via Extremal Graph Theory [3.0120086446979877]
本稿では,ReLUニューラルネットワークを用いた実入力に対して$d$以上の最大関数の正確な計算問題を考察する。
十分に狭いネットワークでは、最大値の非線形性を捕捉できないことを示す。
このことは、その単純性にもかかわらず、最大函数は固有の複雑さを持っていることを示唆している。
論文 参考訳(メタデータ) (2026-01-04T07:40:42Z) - Understanding Matrix Function Normalizations in Covariance Pooling through the Lens of Riemannian Geometry [63.694184882697435]
グローバル共分散プーリング(GCP)は、高レベルの表現の2階統計を利用して、ディープニューラルネットワーク(DNN)の性能を向上させることが実証されている。
本稿では、リーマン幾何学の観点から行列対数とパワーの包括的かつ統一的な理解を提供する。
論文 参考訳(メタデータ) (2024-07-15T07:11:44Z) - What Improves the Generalization of Graph Transformers? A Theoretical Dive into the Self-attention and Positional Encoding [67.59552859593985]
自己アテンションと位置エンコーディングを組み込んだグラフトランスフォーマーは、さまざまなグラフ学習タスクのための強力なアーキテクチャとして登場した。
本稿では,半教師付き分類のための浅いグラフ変換器の理論的検討について紹介する。
論文 参考訳(メタデータ) (2024-06-04T05:30:16Z) - A Unified Algebraic Perspective on Lipschitz Neural Networks [88.14073994459586]
本稿では,様々なタイプの1-Lipschitzニューラルネットワークを統一する新しい視点を提案する。
そこで本研究では,SDP(Common semidefinite Programming)条件の解析解を求めることによって,既存の多くの手法を導出し,一般化することができることを示す。
SDPベースのLipschitz Layers (SLL) と呼ばれる我々のアプローチは、非自明で効率的な凸ポテンシャル層の一般化を設計できる。
論文 参考訳(メタデータ) (2023-03-06T14:31:09Z) - Analysis of Convolutions, Non-linearity and Depth in Graph Neural
Networks using Neural Tangent Kernel [8.824340350342512]
グラフニューラルネットワーク(GNN)は、隣接するノードを集約することで、データの構造情報を活用するように設計されている。
半教師付きノード分類設定におけるグラフニューラルカーネルを用いて,GNNアーキテクチャの異なる側面の影響を理論的に解析する。
i) 線形ネットワークはReLUネットワークと同じくらいのクラス情報をキャプチャし、 (ii) 行正規化は、他の畳み込みよりも基礎となるクラス構造を保存し、 (iii) 過スムージングによりネットワーク深さが低下し、 (iv) スキップ接続は無限の深さでもクラス情報を保持し、過スムーズを除去する。
論文 参考訳(メタデータ) (2022-10-18T12:28:37Z) - Geometric Graph Representation Learning via Maximizing Rate Reduction [73.6044873825311]
学習ノード表現は、コミュニティ検出やノード分類などのグラフ解析において、さまざまな下流タスクの恩恵を受ける。
教師なしの方法でノード表現を学習するための幾何学グラフ表現学習(G2R)を提案する。
G2R は異なるグループ内のノードを異なる部分空間にマッピングし、各部分空間はコンパクトで異なる部分空間が分散される。
論文 参考訳(メタデータ) (2022-02-13T07:46:24Z) - Dual-constrained Deep Semi-Supervised Coupled Factorization Network with
Enriched Prior [80.5637175255349]
本稿では、DS2CF-Netと呼ばれる、拡張された事前制約付きDual-Constrained Deep Semi-Supervised Coupled Factorization Networkを提案する。
隠れた深い特徴を抽出するために、DS2CF-Netは、深い構造と幾何学的な構造に制約のあるニューラルネットワークとしてモデル化される。
我々のネットワークは、表現学習とクラスタリングのための最先端の性能を得ることができる。
論文 参考訳(メタデータ) (2020-09-08T13:10:21Z) - Topology of deep neural networks [8.946655323517092]
M = M_a cup M_b subseteq mathbbRd$データセットのトポロジが、よく訓練されたニューラルネットワークの層を通過するとどのように変化するかを研究する。
論文 参考訳(メタデータ) (2020-04-13T17:53:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。