論文の概要: Surface Vision Mamba: Leveraging Bidirectional State Space Model for Efficient Spherical Manifold Representation
- arxiv url: http://arxiv.org/abs/2501.14679v4
- Date: Fri, 14 Feb 2025 14:55:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-17 14:46:34.748311
- Title: Surface Vision Mamba: Leveraging Bidirectional State Space Model for Efficient Spherical Manifold Representation
- Title(参考訳): Surface Vision Mamba: 効率的な球面マニフォールド表現のための双方向状態空間モデル
- Authors: Rongzhao He, Weihao Zheng, Leilei Zhao, Ying Wang, Dalin Zhu, Dan Wu, Bin Hu,
- Abstract要約: 球面に無注意の視覚マンバを導入する。
本手法は球面データを三角形パッチの列として表現することで表面パッチを実現する。
提案したSurface Vision Mambaは、複数の神経発達型表現型回帰タスクで評価される。
- 参考スコア(独自算出の注目度): 6.550827841703163
- License:
- Abstract: Attention-based methods have demonstrated exceptional performance in modelling long-range dependencies on spherical cortical surfaces, surpassing traditional Geometric Deep Learning (GDL) models. However, their extensive inference time and high memory demands pose challenges for application to large datasets with limited computing resources. Inspired by the state space model in computer vision, we introduce the attention-free Vision Mamba (Vim) to spherical surfaces, presenting a domain-agnostic architecture for analyzing data on spherical manifolds. Our method achieves surface patching by representing spherical data as a sequence of triangular patches derived from a subdivided icosphere. The proposed Surface Vision Mamba (SiM) is evaluated on multiple neurodevelopmental phenotype regression tasks using cortical surface metrics from neonatal brains. Experimental results demonstrate that SiM outperforms both attention- and GDL-based methods, delivering 4.8 times faster inference and achieving 91.7% lower memory consumption compared to the Surface Vision Transformer (SiT) under the Ico-4 grid partitioning. Sensitivity analysis further underscores the potential of SiM to identify subtle cognitive developmental patterns. The code is available at https://github.com/Rongzhao-He/surface-vision-mamba.
- Abstract(参考訳): 注意に基づく手法は、従来の幾何学的深層学習(GDL)モデルを上回る、球状皮質表面の長距離依存性をモデル化する際、例外的な性能を示した。
しかし、その広範囲な推論時間と高いメモリ要求は、限られた計算資源を持つ大規模データセットに適用する上での課題となる。
コンピュータビジョンにおける状態空間モデルにインスパイアされた視覚マンバ(Vim)を球面に導入し,球面上のデータを分析するドメインに依存しないアーキテクチャを提案する。
本手法は, 球面データを, 分割した球面から得られた三角形のパッチの列として表現することにより, 表面のパッチングを実現する。
The proposed Surface Vision Mamba (SiM) is evaluate on multiple neurodevelopmental representationtype regression task using cortical surface metrics from Neonatal Brains。
実験の結果、SiMは注意法とGDL法の両方で優れており、Ico-4グリッドパーティショニングにおけるSurface Vision Transformer(SiT)に比べて4.8倍高速で、メモリ消費は91.7%減少している。
感度分析は、微妙な認知発達パターンを識別するSiMの可能性をさらに強調する。
コードはhttps://github.com/Rongzhao-He/ surface-vision-mamba.comで公開されている。
関連論文リスト
- Geometry Distributions [51.4061133324376]
本稿では,分布として幾何学をモデル化する新しい幾何学的データ表現を提案する。
提案手法では,新しいネットワークアーキテクチャを用いた拡散モデルを用いて表面点分布の学習を行う。
本研究では,多種多様な対象に対して質的かつ定量的に表現を評価し,その有効性を実証した。
論文 参考訳(メタデータ) (2024-11-25T04:06:48Z) - NASM: Neural Anisotropic Surface Meshing [38.8654207201197]
本稿では、異方性表面メッシュのための学習に基づく新しい手法NASMを提案する。
鍵となるアイデアは、入力メッシュを高次元ユークリッド埋め込み空間に埋め込み、曲率ベースの異方性計量を保存することである。
そこで,本研究では,新たに生成した高次元埋め込みにおける特徴感リメッシングを提案し,鮮明な幾何学的特徴を自動キャプチャする。
論文 参考訳(メタデータ) (2024-10-30T15:20:10Z) - HRVMamba: High-Resolution Visual State Space Model for Dense Prediction [60.80423207808076]
効率的なハードウェアを意識した設計のステートスペースモデル(SSM)は、コンピュータビジョンタスクにおいて大きな可能性を証明している。
これらのモデルは、誘導バイアスの不足、長距離の忘れ、低解像度の出力表現の3つの主要な課題によって制約されている。
本稿では, 変形可能な畳み込みを利用して, 長距離忘れ問題を緩和する動的ビジュアル状態空間(DVSS)ブロックを提案する。
また,DVSSブロックに基づく高分解能視覚空間モデル(HRVMamba)を導入し,プロセス全体を通して高分解能表現を保存する。
論文 参考訳(メタデータ) (2024-10-04T06:19:29Z) - Unsupervised Multimodal Surface Registration with Geometric Deep
Learning [3.3403308469369577]
GeoMorphは、皮質表面の画像登録用に設計された新しい幾何学的深層学習フレームワークである。
よりスムーズな変形によるアライメントの改善により,GeoMorphは既存のディープラーニング手法よりも優れていることを示す。
このような汎用性と堅牢性は、様々な神経科学応用に強い可能性を示唆している。
論文 参考訳(メタデータ) (2023-11-21T22:05:00Z) - VTAE: Variational Transformer Autoencoder with Manifolds Learning [144.0546653941249]
深層生成モデルは、多くの潜伏変数を通して非線形データ分布の学習に成功している。
ジェネレータの非線形性は、潜在空間がデータ空間の不満足な射影を示し、表現学習が不十分になることを意味する。
本研究では、測地学と正確な計算により、深部生成モデルの性能を大幅に向上させることができることを示す。
論文 参考訳(メタデータ) (2023-04-03T13:13:19Z) - The Multiscale Surface Vision Transformer [10.833580445244094]
表面深層学習のためのバックボーンアーキテクチャとして,Multiscale Surface Vision Transformer (MS-SiT)を導入した。
以上の結果から,MS-SiTは新生児の表現型予測タスクにおいて,既存の表面深層学習法よりも優れていた。
論文 参考訳(メタデータ) (2023-03-21T15:00:17Z) - HSurf-Net: Normal Estimation for 3D Point Clouds by Learning Hyper
Surfaces [54.77683371400133]
本稿では,ノイズと密度の変動のある点群から正規性を正確に予測できるHSurf-Netという新しい正規推定手法を提案する。
実験結果から, HSurf-Netは, 合成形状データセット上での最先端性能を実現することがわかった。
論文 参考訳(メタデータ) (2022-10-13T16:39:53Z) - Surface Vision Transformers: Attention-Based Modelling applied to
Cortical Analysis [8.20832544370228]
球面多様体上に投影された任意の曲面データを研究するために、ドメインに依存しないアーキテクチャを導入する。
ビジョントランスモデルは、連続したマルチヘッド自己アテンション層を介してパッチのシーケンスを符号化する。
実験の結果、SiTは一般的に表面CNNよりも優れており、登録データと未登録データで比較可能であることがわかった。
論文 参考訳(メタデータ) (2022-03-30T15:56:11Z) - Mixed Effects Neural ODE: A Variational Approximation for Analyzing the
Dynamics of Panel Data [50.23363975709122]
パネルデータ解析に(固定・ランダムな)混合効果を取り入れたME-NODEという確率モデルを提案する。
我々は、Wong-Zakai定理によって提供されるSDEの滑らかな近似を用いて、我々のモデルを導出できることを示す。
次に、ME-NODEのためのエビデンスに基づく下界を導出し、(効率的な)トレーニングアルゴリズムを開発する。
論文 参考訳(メタデータ) (2022-02-18T22:41:51Z) - Improvising the Learning of Neural Networks on Hyperspherical Manifold [0.0]
教師付き設定における畳み込みニューラルネットワーク(CNN)の影響は、大幅なパフォーマンス向上をもたらした。
CNNの超球面多様体上での操作から学んだ表現は、顔認識において洞察に富んだ結果をもたらした。
ユークリッド空間におけるソフトマックスよりも優れた超球直観によって、幅広い活性化関数が発達する。
論文 参考訳(メタデータ) (2021-09-29T22:39:07Z) - Deep Implicit Surface Point Prediction Networks [49.286550880464866]
暗黙の関数としての3次元形状の深い神経表現は、高忠実度モデルを生成することが示されている。
本稿では,CSP(Nest Surface-point)表現と呼ばれる新しい種類の暗黙の表現を用いて,そのような曲面をモデル化する新しいアプローチを提案する。
論文 参考訳(メタデータ) (2021-06-10T14:31:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。