Fugu-MT 論文翻訳(概要): MSNet: A Deep Multi-scale Submanifold Network for Visual Classification

論文の概要: MSNet: A Deep Multi-scale Submanifold Network for Visual Classification

arxiv url: http://arxiv.org/abs/2201.10145v1
Date: Tue, 25 Jan 2022 07:39:25 GMT
ステータス: 翻訳完了
システム内更新日: 2022-01-26 15:40:11.572333
Title: MSNet: A Deep Multi-scale Submanifold Network for Visual Classification
Title（参考訳）: msnet:視覚分類のための深層マルチスケールサブ多様体ネットワーク
Authors: Ziheng Chen, Xiao-Jun Wu, Tianyang Xu, Rui Wang, Zhiwu Huang, Josef Kittler
Abstract要約: 我々は,SPDネットワークにおける局所的幾何情報の保存を確実にすることが最重要であると論じている。幾何学的マルチスケール情報を融合したアーキテクチャMSNetを提案する。特に、ネットワーク層に符号化されたリッチな局所幾何学を利用するために、サブ多様体融合ブロックを設計する。
参考スコア（独自算出の注目度）: 43.789561494266316
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The Symmetric Positive Definite (SPD) matrix has received wide attention as a tool for visual data representation in computer vision. Although there are many different attempts to develop effective deep architectures for data processing on the Riemannian manifold of SPD matrices, a very few solutions explicitly mine the local geometrical information in deep SPD feature representations. While CNNs have demonstrated the potential of hierarchical local pattern extraction even for SPD represented data, we argue that it is of utmost importance to ensure the preservation of local geometric information in the SPD networks. Accordingly, in this work we propose an SPD network designed with this objective in mind. In particular, we propose an architecture, referred to as MSNet, which fuses geometrical multi-scale information. We first analyse the convolution operator commonly used for mapping the local information in Euclidean deep networks from the perspective of a higher level of abstraction afforded by the Category Theory. Based on this analysis, we postulate a submanifold selection principle to guide the design of our MSNet. In particular, we use it to design a submanifold fusion block to take advantage of the rich local geometry encoded in the network layers. The experiments involving multiple visual tasks show that our algorithm outperforms most Riemannian SOTA competitors.
Abstract（参考訳）: 対称正定値行列(spd)はコンピュータビジョンにおける視覚的データ表現のツールとして広く注目を集めている。 SPD行列のリーマン多様体上のデータ処理に有効な深層アーキテクチャを開発する試みは数多くあるが、深部SPD特徴表現の局所幾何学的情報を明示的に掘り下げる方法はほとんどない。 CNNはSPD表現データにおいても階層的局所パターン抽出の可能性を示したが、SPDネットワークにおける局所幾何学情報の保存は最も重要であると我々は主張する。そこで本研究では,この目的を念頭に設計したSPDネットワークを提案する。特に,幾何学的多スケール情報を融合するmsnetと呼ばれるアーキテクチャを提案する。まず, ユークリッド深層ネットワークの局所情報マッピングに一般的に用いられる畳み込み演算子を, カテゴリ理論によって与えられる高レベルな抽象化の観点から解析する。この分析に基づいて,MSNetの設計を導くために,サブ多様体選択原理を仮定する。特に、ネットワーク層に符号化されたリッチな局所幾何学を利用するために、サブ多様体融合ブロックを設計する。複数の視覚的タスクを含む実験は、我々のアルゴリズムがほとんどのリーマンSOTA競合より優れていることを示している。

関連論文リスト

Estimating Dataset Dimension via Singular Metrics under the Manifold Hypothesis: Application to Inverse Problems [0.6138671548064356]
多様体の内在次元を推定し、適切な局所座標を構築し、周囲空間と多様体空間の間の写像を学習する3つの重要な課題に対処する枠組みを提案する。本稿では,VAEデコーダのプルバック値の数値ランクを解析することにより,データセットのIDを推定することに集中する。推定IDは、可逆なVAEの混合を用いた局所チャートのアトラスの構築をガイドし、正確な多様体パラメータ化と効率的な推論を可能にする。
論文参考訳（メタデータ） (2025-07-09T21:22:59Z)
A Lie Group Approach to Riemannian Batch Normalization [59.48083303101632]
本稿では,リー群における正規化手法の統一的枠組みを確立する。我々は3つの異なるリー群構造を持つ対称正定性(SPD)に焦点を当てる。これらのリー群によって誘導される特定の正規化層は、SPDニューラルネットワークに対して提案される。
論文参考訳（メタデータ） (2024-03-17T16:24:07Z)
Riemannian Self-Attention Mechanism for SPD Networks [34.794770395408335]
本稿では,SPD多様体自己アテンション機構(SMSA)を提案する。構造化表現の識別を改善するためにSMSAベースの幾何学習モジュール(SMSA-GL)を設計する。
論文参考訳（メタデータ） (2023-11-28T12:34:46Z)
Riemannian Multinomial Logistics Regression for SPD Neural Networks [60.11063972538648]
本稿では,Symmetric Positive Definite (SPD) 行列のための新しいタイプのディープニューラルネットワークを提案する。我々のフレームワークは、既存のSPDネットワークで最も人気のあるLogEig分類器について、斬新な説明を提供する。本手法の有効性は,レーダ認識,人行動認識,脳波分類(EEG)の3つの応用で実証された。
論文参考訳（メタデータ） (2023-05-18T20:12:22Z)
Adaptive Log-Euclidean Metrics for SPD Matrix Learning [73.12655932115881]
広く使われているログユークリッド計量(LEM)を拡張した適応ログユークリッド計量(ALEM)を提案する。実験および理論的結果から,SPDニューラルネットワークの性能向上における提案手法の有効性が示された。
論文参考訳（メタデータ） (2023-03-26T18:31:52Z)
Bayesian Hyperbolic Multidimensional Scaling [2.5944208050492183]
低次元多様体が双曲型であるとき、多次元スケーリングに対するベイズ的アプローチを提案する。ケース制御可能性近似は、より大きなデータ設定における後部分布からの効率的なサンプリングを可能にする。提案手法は,シミュレーション,標準基準データセット,インディアン村のネットワークデータ,およびヒトの遺伝子発現データを用いて,最先端の代替手法に対して評価する。
論文参考訳（メタデータ） (2022-10-26T23:34:30Z)
DreamNet: A Deep Riemannian Network based on SPD Manifold Learning for Visual Classification [36.848148506610364]
SPD行列学習のための新しいアーキテクチャを提案する。深層表現を豊かにするために、SPDNetをバックボーンとして採用する。次に、SRAEの表現能力を高めるために、ショートカット接続を持つ残余ブロックをいくつか挿入する。
論文参考訳（メタデータ） (2022-06-16T07:15:20Z)
DeepSSN: a deep convolutional neural network to assess spatial scene similarity [11.608756441376544]
本稿では,深部空間シーンネットワーク(Deep Space Scene Network,DeepSSN)を提案する。提案したDeepSSNを用いて,スケッチマップを用いた空間問合せをユーザが入力する空間シーン探索システムを開発した。提案手法は,データ拡張後の131,300個のラベル付きシーンサンプルを含むマルチソース・コンバウンド・マップデータを用いて検証する。
論文参考訳（メタデータ） (2022-02-07T23:53:20Z)
Deep Optimal Transport for Domain Adaptation on SPD Manifolds [9.552869120136005]
最適輸送理論とSPD多様体の幾何学を組み合わせた新しい幾何学的深層学習フレームワークを提案する。提案手法は, 多様体構造を尊重しながらデータ分布を整列させ, 限界差と条件差を効果的に低減する。提案手法は,KU,BNCI2014001,BNCI2015001の3つのクロスセッション脳コンピュータインタフェースデータセットに対して検証を行った。
論文参考訳（メタデータ） (2022-01-15T03:13:02Z)
DeHIN: A Decentralized Framework for Embedding Large-scale Heterogeneous Information Networks [64.62314068155997]
本稿では,異種情報ネットワーク(DeHIN)のための分散埋め込みフレームワークについて述べる。 DeHINは、大きなHINをハイパーグラフとして革新的に定式化するコンテキスト保存分割機構を提供する。当社のフレームワークでは,木のようなパイプラインを採用することで,効率よくHINを分割する分散戦略を採用しています。
論文参考訳（メタデータ） (2022-01-08T04:08:36Z)
Towards Interpretable Deep Networks for Monocular Depth Estimation [78.84690613778739]
我々は,深部MDEネットワークの解釈可能性について,その隠蔽ユニットの深さ選択性を用いて定量化する。本稿では,解釈可能なMDE深層ネットワークを,元のアーキテクチャを変更することなく学習する手法を提案する。実験により,本手法は深部MDEネットワークの解釈可能性を向上させることができることが示された。
論文参考訳（メタデータ） (2021-08-11T16:43:45Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。