論文の概要: MSNet: A Deep Multi-scale Submanifold Network for Visual Classification
- arxiv url: http://arxiv.org/abs/2201.10145v1
- Date: Tue, 25 Jan 2022 07:39:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-26 15:40:11.572333
- Title: MSNet: A Deep Multi-scale Submanifold Network for Visual Classification
- Title(参考訳): msnet:視覚分類のための深層マルチスケールサブ多様体ネットワーク
- Authors: Ziheng Chen, Xiao-Jun Wu, Tianyang Xu, Rui Wang, Zhiwu Huang, Josef
Kittler
- Abstract要約: 我々は,SPDネットワークにおける局所的幾何情報の保存を確実にすることが最重要であると論じている。
幾何学的マルチスケール情報を融合したアーキテクチャMSNetを提案する。
特に、ネットワーク層に符号化されたリッチな局所幾何学を利用するために、サブ多様体融合ブロックを設計する。
- 参考スコア(独自算出の注目度): 43.789561494266316
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The Symmetric Positive Definite (SPD) matrix has received wide attention as a
tool for visual data representation in computer vision. Although there are many
different attempts to develop effective deep architectures for data processing
on the Riemannian manifold of SPD matrices, a very few solutions explicitly
mine the local geometrical information in deep SPD feature representations.
While CNNs have demonstrated the potential of hierarchical local pattern
extraction even for SPD represented data, we argue that it is of utmost
importance to ensure the preservation of local geometric information in the SPD
networks. Accordingly, in this work we propose an SPD network designed with
this objective in mind. In particular, we propose an architecture, referred to
as MSNet, which fuses geometrical multi-scale information. We first analyse the
convolution operator commonly used for mapping the local information in
Euclidean deep networks from the perspective of a higher level of abstraction
afforded by the Category Theory. Based on this analysis, we postulate a
submanifold selection principle to guide the design of our MSNet. In
particular, we use it to design a submanifold fusion block to take advantage of
the rich local geometry encoded in the network layers. The experiments
involving multiple visual tasks show that our algorithm outperforms most
Riemannian SOTA competitors.
- Abstract(参考訳): 対称正定値行列(spd)はコンピュータビジョンにおける視覚的データ表現のツールとして広く注目を集めている。
SPD行列のリーマン多様体上のデータ処理に有効な深層アーキテクチャを開発する試みは数多くあるが、深部SPD特徴表現の局所幾何学的情報を明示的に掘り下げる方法はほとんどない。
CNNはSPD表現データにおいても階層的局所パターン抽出の可能性を示したが、SPDネットワークにおける局所幾何学情報の保存は最も重要であると我々は主張する。
そこで本研究では,この目的を念頭に設計したSPDネットワークを提案する。
特に,幾何学的多スケール情報を融合するmsnetと呼ばれるアーキテクチャを提案する。
まず, ユークリッド深層ネットワークの局所情報マッピングに一般的に用いられる畳み込み演算子を, カテゴリ理論によって与えられる高レベルな抽象化の観点から解析する。
この分析に基づいて,MSNetの設計を導くために,サブ多様体選択原理を仮定する。
特に、ネットワーク層に符号化されたリッチな局所幾何学を利用するために、サブ多様体融合ブロックを設計する。
複数の視覚的タスクを含む実験は、我々のアルゴリズムがほとんどのリーマンSOTA競合より優れていることを示している。
関連論文リスト
- A Lie Group Approach to Riemannian Batch Normalization [59.48083303101632]
本稿では,リー群における正規化手法の統一的枠組みを確立する。
我々は3つの異なるリー群構造を持つ対称正定性(SPD)に焦点を当てる。
これらのリー群によって誘導される特定の正規化層は、SPDニューラルネットワークに対して提案される。
論文 参考訳(メタデータ) (2024-03-17T16:24:07Z) - Riemannian Self-Attention Mechanism for SPD Networks [34.794770395408335]
本稿では,SPD多様体自己アテンション機構(SMSA)を提案する。
構造化表現の識別を改善するためにSMSAベースの幾何学習モジュール(SMSA-GL)を設計する。
論文 参考訳(メタデータ) (2023-11-28T12:34:46Z) - Riemannian Multinomial Logistics Regression for SPD Neural Networks [60.11063972538648]
本稿では,Symmetric Positive Definite (SPD) 行列のための新しいタイプのディープニューラルネットワークを提案する。
我々のフレームワークは、既存のSPDネットワークで最も人気のあるLogEig分類器について、斬新な説明を提供する。
本手法の有効性は,レーダ認識,人行動認識,脳波分類(EEG)の3つの応用で実証された。
論文 参考訳(メタデータ) (2023-05-18T20:12:22Z) - Adaptive Log-Euclidean Metrics for SPD Matrix Learning [73.12655932115881]
広く使われているログユークリッド計量(LEM)を拡張した適応ログユークリッド計量(ALEM)を提案する。
実験および理論的結果から,SPDニューラルネットワークの性能向上における提案手法の有効性が示された。
論文 参考訳(メタデータ) (2023-03-26T18:31:52Z) - Bayesian Hyperbolic Multidimensional Scaling [2.5944208050492183]
低次元多様体が双曲型であるとき、多次元スケーリングに対するベイズ的アプローチを提案する。
ケース制御可能性近似は、より大きなデータ設定における後部分布からの効率的なサンプリングを可能にする。
提案手法は,シミュレーション,標準基準データセット,インディアン村のネットワークデータ,およびヒトの遺伝子発現データを用いて,最先端の代替手法に対して評価する。
論文 参考訳(メタデータ) (2022-10-26T23:34:30Z) - DreamNet: A Deep Riemannian Network based on SPD Manifold Learning for
Visual Classification [36.848148506610364]
SPD行列学習のための新しいアーキテクチャを提案する。
深層表現を豊かにするために、SPDNetをバックボーンとして採用する。
次に、SRAEの表現能力を高めるために、ショートカット接続を持つ残余ブロックをいくつか挿入する。
論文 参考訳(メタデータ) (2022-06-16T07:15:20Z) - DeepSSN: a deep convolutional neural network to assess spatial scene
similarity [11.608756441376544]
本稿では,深部空間シーンネットワーク(Deep Space Scene Network,DeepSSN)を提案する。
提案したDeepSSNを用いて,スケッチマップを用いた空間問合せをユーザが入力する空間シーン探索システムを開発した。
提案手法は,データ拡張後の131,300個のラベル付きシーンサンプルを含むマルチソース・コンバウンド・マップデータを用いて検証する。
論文 参考訳(メタデータ) (2022-02-07T23:53:20Z) - DeHIN: A Decentralized Framework for Embedding Large-scale Heterogeneous
Information Networks [64.62314068155997]
本稿では,異種情報ネットワーク(DeHIN)のための分散埋め込みフレームワークについて述べる。
DeHINは、大きなHINをハイパーグラフとして革新的に定式化するコンテキスト保存分割機構を提供する。
当社のフレームワークでは,木のようなパイプラインを採用することで,効率よくHINを分割する分散戦略を採用しています。
論文 参考訳(メタデータ) (2022-01-08T04:08:36Z) - Towards Interpretable Deep Networks for Monocular Depth Estimation [78.84690613778739]
我々は,深部MDEネットワークの解釈可能性について,その隠蔽ユニットの深さ選択性を用いて定量化する。
本稿では,解釈可能なMDE深層ネットワークを,元のアーキテクチャを変更することなく学習する手法を提案する。
実験により,本手法は深部MDEネットワークの解釈可能性を向上させることができることが示された。
論文 参考訳(メタデータ) (2021-08-11T16:43:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。