論文の概要: MVC-Net: A Convolutional Neural Network Architecture for Manifold-Valued
Images With Applications
- arxiv url: http://arxiv.org/abs/2003.01234v2
- Date: Fri, 6 Mar 2020 17:40:23 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-27 05:32:40.304660
- Title: MVC-Net: A Convolutional Neural Network Architecture for Manifold-Valued
Images With Applications
- Title(参考訳): MVC-Net: アプリケーションによるマニフォールド値画像のための畳み込みニューラルネットワークアーキテクチャ
- Authors: Jose J. Bouza, Chun-Hao Yang, David Vaillancourt, Baba C. Vemuri
- Abstract要約: 本稿では,MVC層を用いた多層ニューラルネットワークの構築方法について述べる。
医用画像およびコンピュータビジョンタスクにおけるMVC-netの優れた性能を実証的に示す。
- 参考スコア(独自算出の注目度): 5.352699766206807
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Geometric deep learning has attracted significant attention in recent years,
in part due to the availability of exotic data types for which traditional
neural network architectures are not well suited. Our goal in this paper is to
generalize convolutional neural networks (CNN) to the manifold-valued image
case which arises commonly in medical imaging and computer vision applications.
Explicitly, the input data to the network is an image where each pixel value is
a sample from a Riemannian manifold. To achieve this goal, we must generalize
the basic building block of traditional CNN architectures, namely, the weighted
combinations operation. To this end, we develop a tangent space combination
operation which is used to define a convolution operation on manifold-valued
images that we call, the Manifold-Valued Convolution (MVC). We prove
theoretical properties of the MVC operation, including equivariance to the
action of the isometry group admitted by the manifold and characterizing when
compositions of MVC layers collapse to a single layer. We present a detailed
description of how to use MVC layers to build full, multi-layer neural networks
that operate on manifold-valued images, which we call the MVC-net. Further, we
empirically demonstrate superior performance of the MVC-nets in medical imaging
and computer vision tasks.
- Abstract(参考訳): 幾何学的ディープラーニングは近年,従来のニューラルネットワークアーキテクチャに適さないエキゾチックなデータタイプが利用可能であることから,大きな注目を集めている。
本稿では,畳み込みニューラルネットワーク(cnn)を,医用画像やコンピュータビジョンアプリケーションで一般的に見られる多様体値画像ケースに一般化することを目的とする。
明示的に、ネットワークへの入力データは、各ピクセル値がリーマン多様体からのサンプルである画像である。
この目的を達成するためには、従来のCNNアーキテクチャの基本構成ブロック、すなわち重み付けされた組み合わせ操作を一般化する必要がある。
この目的のために、我々は多様体値畳み込み(mvc)と呼ばれる多様体値画像の畳み込み演算を定義するために使われる接空間結合演算を開発する。
我々は,MVC演算の理論的性質を証明し,多様体によって認められた等尺群の作用に等しく,MVC層の組成が単一層に崩壊した場合に特徴付ける。
我々は、MVC-netと呼ばれる多様体値の画像で動く完全な多層ニューラルネットワークを構築するために、MVC層をどのように利用するかについて、詳細な説明を行う。
さらに、医用画像およびコンピュータビジョンタスクにおけるMVC-netの優れた性能を実証的に示す。
関連論文リスト
- A Review of Pulse-Coupled Neural Network Applications in Computer Vision and Image Processing [0.0]
パルス結合型ニューラルネットワーク(PCNN)は,いくつかの基本的な画像処理とコンピュータビジョンの課題に対処することに成功した。
これらのアプリケーションで得られた結果は、PCNNアーキテクチャが様々なコンピュータビジョンタスクに関連する有用な知覚情報を生成することを示唆している。
論文 参考訳(メタデータ) (2024-06-01T00:10:05Z) - nnMamba: 3D Biomedical Image Segmentation, Classification and Landmark
Detection with State Space Model [24.955052600683423]
本稿では、CNNの強みとステートスペースシーケンスモデル(SSM)の高度な長距離モデリング機能を統合する新しいアーキテクチャであるnnMambaを紹介する。
6つのデータセットの実験では、3D画像のセグメンテーション、分類、ランドマーク検出など、一連の困難なタスクにおいて、nnMambaが最先端のメソッドよりも優れていることが示されている。
論文 参考訳(メタデータ) (2024-02-05T21:28:47Z) - Learning Multimodal Volumetric Features for Large-Scale Neuron Tracing [72.45257414889478]
オーバーセグメントニューロン間の接続を予測し,人間の作業量を削減することを目的としている。
最初はFlyTracingという名前のデータセットを構築しました。
本稿では,高密度なボリュームEM画像の埋め込みを生成するための,新しい接続性を考慮したコントラスト学習手法を提案する。
論文 参考訳(メタデータ) (2024-01-05T19:45:12Z) - Masked Contrastive Graph Representation Learning for Age Estimation [44.96502862249276]
本稿では,画像冗長性情報を扱う上で,グラフ表現学習の特性を利用する。
年齢推定のためのMasked Contrastive Graph Representation Learning (MCGRL)法を提案する。
実世界の顔画像データセットに対する実験結果から,提案手法が他の最先端の年齢推定手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2023-06-16T15:53:21Z) - Prediction of Geometric Transformation on Cardiac MRI via Convolutional
Neural Network [13.01021780124613]
画像に適用される幾何学的変換を認識するために,ConvNetsを訓練して医用画像の特徴を学習することを提案する。
幾何学的変換を容易に予測できる簡単な自己教師型タスクを提案する。
論文 参考訳(メタデータ) (2022-11-12T11:29:14Z) - Deep Image Clustering with Contrastive Learning and Multi-scale Graph
Convolutional Networks [58.868899595936476]
コントラスト学習とマルチスケールグラフ畳み込みネットワーク(IcicleGCN)を用いた画像クラスタリング手法を提案する。
複数の画像データセットの実験は、最先端のIcicleGCNよりも優れたクラスタリング性能を示している。
論文 参考訳(メタデータ) (2022-07-14T19:16:56Z) - Two-Stream Graph Convolutional Network for Intra-oral Scanner Image
Segmentation [133.02190910009384]
本稿では,2ストリームグラフ畳み込みネットワーク(TSGCN)を提案する。
TSGCNは3次元歯(表面)セグメンテーションにおいて最先端の方法よりも優れています。
論文 参考訳(メタデータ) (2022-04-19T10:41:09Z) - Deep Features for training Support Vector Machine [16.795405355504077]
本稿では,訓練済みcnnから抽出した特徴に基づく汎用コンピュータビジョンシステムを開発した。
複数の学習特徴を単一の構造に組み合わせ、異なる画像分類タスクに取り組んでいます。
論文 参考訳(メタデータ) (2021-04-08T03:13:09Z) - Spatial Dependency Networks: Neural Layers for Improved Generative Image
Modeling [79.15521784128102]
画像生成装置(デコーダ)を構築するための新しいニューラルネットワークを導入し、可変オートエンコーダ(VAE)に適用する。
空間依存ネットワーク(sdns)では、ディープニューラルネットの各レベルにおける特徴マップを空間的にコヒーレントな方法で計算する。
空間依存層による階層型vaeのデコーダの強化は密度推定を大幅に改善することを示す。
論文 参考訳(メタデータ) (2021-03-16T07:01:08Z) - Learning Deep Interleaved Networks with Asymmetric Co-Attention for
Image Restoration [65.11022516031463]
本稿では,高品質(本社)画像再構成のために,異なる状態の情報をどのように組み合わせるべきかを学習するディープインターリーブドネットワーク(DIN)を提案する。
本稿では,各インターリーブノードにアタッチメントされた非対称なコアテンション(AsyCA)を提案し,その特性依存性をモデル化する。
提案したDINはエンドツーエンドで訓練でき、様々な画像復元タスクに適用できる。
論文 参考訳(メタデータ) (2020-10-29T15:32:00Z) - Neural Cellular Automata Manifold [84.08170531451006]
ニューラルセルラーオートマタのニューラルネットワークアーキテクチャは、より大きなNNにカプセル化可能であることを示す。
これにより、NAAの多様体を符号化する新しいモデルを提案し、それぞれが異なる画像を生成することができる。
生物学的には、我々のアプローチは転写因子の役割を担い、細胞の分化を促進する特定のタンパク質への遺伝子マッピングを調節する。
論文 参考訳(メタデータ) (2020-06-22T11:41:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。