論文の概要: MSNet: A Deep Multi-scale Submanifold Network for Visual Classification
- arxiv url: http://arxiv.org/abs/2201.10145v1
- Date: Tue, 25 Jan 2022 07:39:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-26 15:40:11.572333
- Title: MSNet: A Deep Multi-scale Submanifold Network for Visual Classification
- Title(参考訳): msnet:視覚分類のための深層マルチスケールサブ多様体ネットワーク
- Authors: Ziheng Chen, Xiao-Jun Wu, Tianyang Xu, Rui Wang, Zhiwu Huang, Josef
Kittler
- Abstract要約: 我々は,SPDネットワークにおける局所的幾何情報の保存を確実にすることが最重要であると論じている。
幾何学的マルチスケール情報を融合したアーキテクチャMSNetを提案する。
特に、ネットワーク層に符号化されたリッチな局所幾何学を利用するために、サブ多様体融合ブロックを設計する。
- 参考スコア(独自算出の注目度): 43.789561494266316
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The Symmetric Positive Definite (SPD) matrix has received wide attention as a
tool for visual data representation in computer vision. Although there are many
different attempts to develop effective deep architectures for data processing
on the Riemannian manifold of SPD matrices, a very few solutions explicitly
mine the local geometrical information in deep SPD feature representations.
While CNNs have demonstrated the potential of hierarchical local pattern
extraction even for SPD represented data, we argue that it is of utmost
importance to ensure the preservation of local geometric information in the SPD
networks. Accordingly, in this work we propose an SPD network designed with
this objective in mind. In particular, we propose an architecture, referred to
as MSNet, which fuses geometrical multi-scale information. We first analyse the
convolution operator commonly used for mapping the local information in
Euclidean deep networks from the perspective of a higher level of abstraction
afforded by the Category Theory. Based on this analysis, we postulate a
submanifold selection principle to guide the design of our MSNet. In
particular, we use it to design a submanifold fusion block to take advantage of
the rich local geometry encoded in the network layers. The experiments
involving multiple visual tasks show that our algorithm outperforms most
Riemannian SOTA competitors.
- Abstract(参考訳): 対称正定値行列(spd)はコンピュータビジョンにおける視覚的データ表現のツールとして広く注目を集めている。
SPD行列のリーマン多様体上のデータ処理に有効な深層アーキテクチャを開発する試みは数多くあるが、深部SPD特徴表現の局所幾何学的情報を明示的に掘り下げる方法はほとんどない。
CNNはSPD表現データにおいても階層的局所パターン抽出の可能性を示したが、SPDネットワークにおける局所幾何学情報の保存は最も重要であると我々は主張する。
そこで本研究では,この目的を念頭に設計したSPDネットワークを提案する。
特に,幾何学的多スケール情報を融合するmsnetと呼ばれるアーキテクチャを提案する。
まず, ユークリッド深層ネットワークの局所情報マッピングに一般的に用いられる畳み込み演算子を, カテゴリ理論によって与えられる高レベルな抽象化の観点から解析する。
この分析に基づいて,MSNetの設計を導くために,サブ多様体選択原理を仮定する。
特に、ネットワーク層に符号化されたリッチな局所幾何学を利用するために、サブ多様体融合ブロックを設計する。
複数の視覚的タスクを含む実験は、我々のアルゴリズムがほとんどのリーマンSOTA競合より優れていることを示している。
関連論文リスト
- Riemannian Self-Attention Mechanism for SPD Networks [34.794770395408335]
本稿では,SPD多様体自己アテンション機構(SMSA)を提案する。
構造化表現の識別を改善するためにSMSAベースの幾何学習モジュール(SMSA-GL)を設計する。
論文 参考訳(メタデータ) (2023-11-28T12:34:46Z) - Riemannian Multiclass Logistics Regression for SPD Neural Networks [54.418735373762004]
対称正定値行列(SPD)を学習するためのディープニューラルネットワークは、機械学習において注目を集めている。
既存のSPDネットワークの多くは、固有分類器ではなく、近似空間上の伝統的なユークリッド分類器を使用している。
双曲型ニューラルネットワーク(HNN)の成功に触発されて,SPDネットワークのためのリーマン型マルチクラスロジスティクスレグレッション(RMLR)を提案する。
論文 参考訳(メタデータ) (2023-05-18T20:12:22Z) - Adaptive Riemannian Metrics on SPD Manifolds [67.48576298756996]
対称正定値行列(SPD)は、データの構造的相関を符号化する本質的な能力のため、機械学習において広く注目を集めている。
既存の固定計量テンソルは、SPD行列学習、特にSPDニューラルネットワークの準最適性能をもたらす可能性がある。
論文 参考訳(メタデータ) (2023-03-26T18:31:52Z) - GraphCSPN: Geometry-Aware Depth Completion via Dynamic GCNs [49.55919802779889]
本稿では,グラフ畳み込みに基づく空間伝搬ネットワーク(GraphCSPN)を提案する。
本研究では、幾何学的表現学習において、畳み込みニューラルネットワークとグラフニューラルネットワークを相補的に活用する。
提案手法は,数段の伝搬ステップのみを使用する場合と比較して,最先端の性能を実現する。
論文 参考訳(メタデータ) (2022-10-19T17:56:03Z) - DreamNet: A Deep Riemannian Network based on SPD Manifold Learning for
Visual Classification [36.848148506610364]
SPD行列学習のための新しいアーキテクチャを提案する。
深層表現を豊かにするために、SPDNetをバックボーンとして採用する。
次に、SRAEの表現能力を高めるために、ショートカット接続を持つ残余ブロックをいくつか挿入する。
論文 参考訳(メタデータ) (2022-06-16T07:15:20Z) - DeepSSN: a deep convolutional neural network to assess spatial scene
similarity [11.608756441376544]
本稿では,深部空間シーンネットワーク(Deep Space Scene Network,DeepSSN)を提案する。
提案したDeepSSNを用いて,スケッチマップを用いた空間問合せをユーザが入力する空間シーン探索システムを開発した。
提案手法は,データ拡張後の131,300個のラベル付きシーンサンプルを含むマルチソース・コンバウンド・マップデータを用いて検証する。
論文 参考訳(メタデータ) (2022-02-07T23:53:20Z) - DeHIN: A Decentralized Framework for Embedding Large-scale Heterogeneous
Information Networks [64.62314068155997]
本稿では,異種情報ネットワーク(DeHIN)のための分散埋め込みフレームワークについて述べる。
DeHINは、大きなHINをハイパーグラフとして革新的に定式化するコンテキスト保存分割機構を提供する。
当社のフレームワークでは,木のようなパイプラインを採用することで,効率よくHINを分割する分散戦略を採用しています。
論文 参考訳(メタデータ) (2022-01-08T04:08:36Z) - Towards Interpretable Deep Networks for Monocular Depth Estimation [78.84690613778739]
我々は,深部MDEネットワークの解釈可能性について,その隠蔽ユニットの深さ選択性を用いて定量化する。
本稿では,解釈可能なMDE深層ネットワークを,元のアーキテクチャを変更することなく学習する手法を提案する。
実験により,本手法は深部MDEネットワークの解釈可能性を向上させることができることが示された。
論文 参考訳(メタデータ) (2021-08-11T16:43:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。