論文の概要: Monocular Depth Estimation via Neural Network with Learnable Algebraic Group and Ring Structures
- arxiv url: http://arxiv.org/abs/2604.24328v1
- Date: Mon, 27 Apr 2026 11:19:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-28 17:12:07.918564
- Title: Monocular Depth Estimation via Neural Network with Learnable Algebraic Group and Ring Structures
- Title(参考訳): 学習可能な代数群とリング構造を持つニューラルネットワークによる単眼深度推定
- Authors: Qianlei Wang, Kexun Chen, Shaolin Zhang, Hongli Gao, Chaoning Zhang, Xiaolin Qin,
- Abstract要約: LAGRNetは、学習可能なグループ、リング、および層構造をディープラーニングパイプラインに明示的に埋め込むことにより、代数幾何学のMDEを基盤とする新しいフレームワークである。
LAGRNetは精度と一般化能力の両方において最先端の手法を著しく上回ることを示す。
- 参考スコア(独自算出の注目度): 17.239765616051507
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Monocular depth estimation (MDE) has witnessed remarkable progress driven by Convolutional Neural Networks and transformer-based architectures. However, these approaches typically treat the problem as a generic image-to-image regression on Euclidean grids, thereby overlooking the intrinsic algebraic and geometric structures induced by perspective projection. To address this limitation, we propose LAGRNet, a novel framework that fundamentally grounds MDE in algebraic geometry by explicitly embedding learnable group, ring, and sheaf structures into the deep learning pipeline. Modeling feature maps as sections of a sheaf over an approximated image manifold, our method first establishes a Group-defined Feature Manifold (GFM) parameterized by a learned algebraic group action to enforce projective equivariance and robustness against view changes. To facilitate algebraically consistent cross-scale interactions, we subsequently introduce a Ring Convolution Layer (RCL) that formulates feature fusion as a graded ring homomorphism. Furthermore, to ensure global topological consistency, a Sheaf-based Module (SM) aggregates local depth cues via Čech nerve on the image topology. Extensive zero-shot evaluations across the KITTI, NYU-Depth V2, and ETH3D benchmarks demonstrate that LAGRNet significantly outperforms state-of-the-art methods in both accuracy and generalization capabilities.
- Abstract(参考訳): 単眼深度推定(MDE)は、畳み込みニューラルネットワークとトランスフォーマーベースのアーキテクチャによって駆動される顕著な進歩を目撃している。
しかし、これらのアプローチは一般にユークリッド格子上の一般的なイメージ・ツー・イメージ回帰としてこの問題を扱うため、視点射影によって誘導される固有代数的構造や幾何学的構造を見渡すことができる。
この制限に対処するために,学習可能な群,リング,および層構造を深層学習パイプラインに明示的に埋め込むことにより,代数幾何学のMDEを基礎とする新しいフレームワークであるLAGRNetを提案する。
近似された画像多様体上の層としての特徴写像をモデル化し、まず、学習された代数的群作用によってパラメータ化されたグループ定義特徴多様体(GFM)を確立し、視点変化に対して射影的等分散とロバスト性を強制する。
代数的に一貫したクロススケール相互作用を促進するために、次数付き環準同型として特徴的融合を定式化するリング畳み込み層(RCL)を導入する。
さらに、世界的トポロジの整合性を確保するため、シェーチ神経を介して局所深度キューを画像トポロジ上で集約する。
KITTI、NYU-Depth V2、ETH3Dベンチマークによる大規模なゼロショット評価は、LAGRNetが精度と一般化能力の両方において最先端の手法を大幅に上回っていることを示している。
関連論文リスト
- Hyperbolic Enhanced Representation Learning for Incomplete Multi-view Clustering [57.38215918201251]
本稿では,不完全なマルチビュークラスタリングのためのハイパーボリック拡張表現学習フレームワークであるHERLを提案する。
ポアンカレボール内で操作すると、HERLは表現学習を強化するために構造を意識した潜在空間を構築する。
HERLは最先端のアプローチよりも一貫して優れていることを示す。
論文 参考訳(メタデータ) (2026-04-18T10:50:46Z) - The Neural Differential Manifold: An Architecture with Explicit Geometric Structure [8.201374511929538]
本稿では,その基本設計に幾何学的構造を明示的に組み込んだニューラルネットワークアーキテクチャであるニューラル微分マニフォールド(NDM)を紹介する。
我々は、より効率的な最適化の可能性、継続学習の強化、科学的発見と制御可能な生成モデルへの応用など、このアプローチの理論的利点を分析する。
論文 参考訳(メタデータ) (2025-10-29T02:24:27Z) - Learning the Structure of Connection Graphs [13.687470962704744]
接続グラフ(CG)は、ネットワークトポロジーと変換を結合することで従来のグラフモデルを拡張し、グローバルな幾何学的一貫性の表現を可能にする。
本稿では,ラプラシアン接続と基礎となるラプラシアンをリンクするスペクトル特性を強制する,一貫した仮定の下での最大擬似構造に基づく原理的枠組みを提案する。
本稿では,ネットワークトポロジ,エッジウェイト,幾何学的構造を共同推論するブロック最適化手法であるStructured Connection Graph Learning (SCGL)アルゴリズムを紹介する。
論文 参考訳(メタデータ) (2025-10-13T10:33:31Z) - Geometry-Aware Spiking Graph Neural Network [24.920334588995072]
本稿では,スパイクに基づくニューラルダイナミクスを適応表現学習と統合するGeometry-Aware Spiking Graph Neural Networkを提案する。
複数のベンチマーク実験により、GSGはユークリッドSNNと多様体ベースGNNと比較して精度、堅牢性、エネルギー効率が優れていることが示された。
論文 参考訳(メタデータ) (2025-08-09T02:52:38Z) - Generalized Linear Mode Connectivity for Transformers [87.32299363530996]
驚くべき現象はリニアモード接続(LMC)であり、独立に訓練されたモデルを低損失またはゼロ損失の経路で接続することができる。
以前の研究は主に置換によるニューロンの並べ替えに焦点を合わせてきたが、そのようなアプローチは範囲に限られている。
我々は、4つの対称性クラス(置換、半置換、変換、一般可逆写像)をキャプチャする統一的なフレームワークを導入する。
この一般化により、独立に訓練された視覚変換器とGPT-2モデルの間の低障壁とゼロバリア線形経路の発見が可能となった。
論文 参考訳(メタデータ) (2025-06-28T01:46:36Z) - Geometric Neural Process Fields [58.77241763774756]
幾何学的ニューラル・プロセス・フィールド(Geometric Neural Process Fields, G-NPF)は、ニューラル・ラディアンス・フィールドの確率的フレームワークである。
これらの基盤の上に構築された階層型潜在変数モデルにより、G-NPFは複数の空間レベルにまたがる構造情報を統合できる。
3次元シーンと2次元画像と1次元信号レグレッションの新規ビュー合成実験により,本手法の有効性を実証した。
論文 参考訳(メタデータ) (2025-02-04T14:17:18Z) - Conformable Convolution for Topologically Aware Learning of Complex Anatomical Structures [38.20599800950335]
トポロジ的一貫性を明示するために設計された新しい畳み込み層であるConformable Convolutionを紹介する。
Topological Posterior Generator (TPG)モジュールは、重要なトポロジ的特徴を特定し、畳み込み層をガイドする。
本稿では,構造物の相互接続性維持が重要となるセグメンテーション作業におけるフレームワークの有効性を示す。
論文 参考訳(メタデータ) (2024-12-29T22:41:33Z) - Point Cloud Denoising With Fine-Granularity Dynamic Graph Convolutional Networks [58.050130177241186]
ノイズの摂動は、しばしば3次元の点雲を破損させ、表面の再構成、レンダリング、さらなる処理といった下流のタスクを妨げる。
本稿では,GDGCNと呼ばれる粒度動的グラフ畳み込みネットワークについて紹介する。
論文 参考訳(メタデータ) (2024-11-21T14:19:32Z) - Dist2Cycle: A Simplicial Neural Network for Homology Localization [66.15805004725809]
単純複体は多方向順序関係を明示的にエンコードするグラフの高次元一般化と見なすことができる。
単体錯体の$k$-homological特徴によってパラメータ化された関数のグラフ畳み込みモデルを提案する。
論文 参考訳(メタデータ) (2021-10-28T14:59:41Z) - MDP Homomorphic Networks: Group Symmetries in Reinforcement Learning [90.20563679417567]
本稿では,深層強化学習のためのMDP準同型ネットワークを提案する。
MDP準同型ネットワーク(英: MDP homomorphic network)は、MDPの結合状態-作用空間における対称性の下で不変なニューラルネットワークである。
このようなネットワークは,グリッドワールドであるCartPoleとPongの非構造化ネットワークよりも高速に収束することを示す。
論文 参考訳(メタデータ) (2020-06-30T15:38:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。