論文の概要: DreamNet: A Deep Riemannian Network based on SPD Manifold Learning for
Visual Classification
- arxiv url: http://arxiv.org/abs/2206.07967v1
- Date: Thu, 16 Jun 2022 07:15:20 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-17 16:00:42.376444
- Title: DreamNet: A Deep Riemannian Network based on SPD Manifold Learning for
Visual Classification
- Title(参考訳): DreamNet:視覚分類のためのSPDマニフォールド学習に基づくディープリーマンネットワーク
- Authors: Rui Wang, Xiao-Jun Wu, Ziheng Chen, Tianyang Xu, Josef Kittler
- Abstract要約: SPD行列学習のための新しいアーキテクチャを提案する。
深層表現を豊かにするために、SPDNetをバックボーンとして採用する。
次に、SRAEの表現能力を高めるために、ショートカット接続を持つ残余ブロックをいくつか挿入する。
- 参考スコア(独自算出の注目度): 36.848148506610364
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Image set-based visual classification methods have achieved remarkable
performance, via characterising the image set in terms of a non-singular
covariance matrix on a symmetric positive definite (SPD) manifold. To adapt to
complicated visual scenarios better, several Riemannian networks (RiemNets) for
SPD matrix nonlinear processing have recently been studied. However, it is
pertinent to ask, whether greater accuracy gains can be achieved by simply
increasing the depth of RiemNets. The answer appears to be negative, as deeper
RiemNets tend to lose generalization ability. To explore a possible solution to
this issue, we propose a new architecture for SPD matrix learning.
Specifically, to enrich the deep representations, we adopt SPDNet [1] as the
backbone, with a stacked Riemannian autoencoder (SRAE) built on the tail. The
associated reconstruction error term can make the embedding functions of both
SRAE and of each RAE an approximate identity mapping, which helps to prevent
the degradation of statistical information. We then insert several
residual-like blocks with shortcut connections to augment the representational
capacity of SRAE, and to simplify the training of a deeper network. The
experimental evidence demonstrates that our DreamNet can achieve improved
accuracy with increased depth of the network.
- Abstract(参考訳): 画像集合に基づく視覚分類法は、対称正定値(SPD)多様体上の非特異共分散行列を用いて画像集合を特徴付けることにより、顕著な性能を達成した。
複雑な視覚シナリオに適応するために、SPD行列非線形処理のためのいくつかのリーマンネットワーク(RiemNets)が最近研究されている。
しかし、RiemNetsの深さを単純に増やすことで、より精度の高いゲインが達成できるかどうかを問う必要がある。
RiemNetsは一般化能力を失う傾向にあるため、この答えは否定的であるようだ。
そこで本研究では,SPD行列学習のための新しいアーキテクチャを提案する。
具体的には、深部表現を豊かにするために、尾部にRiemannian autoencoder (SRAE) を積み重ねたSPDNet [1] をバックボーンとして採用する。
関連する再構成誤り項は、SRAEと各RAEの埋め込み機能を近似IDマッピングとし、統計情報の劣化を防止するのに役立つ。
次に,sraeの表現能力を高めるために近距離接続を持つ残差状ブロックを複数挿入し,より深いネットワークの訓練を簡素化する。
実験により,DreamNetがネットワークの深度を増大させて精度を向上できることが実証された。
関連論文リスト
- Riemannian Multinomial Logistics Regression for SPD Neural Networks [60.11063972538648]
本稿では,Symmetric Positive Definite (SPD) 行列のための新しいタイプのディープニューラルネットワークを提案する。
我々のフレームワークは、既存のSPDネットワークで最も人気のあるLogEig分類器について、斬新な説明を提供する。
本手法の有効性は,レーダ認識,人行動認識,脳波分類(EEG)の3つの応用で実証された。
論文 参考訳(メタデータ) (2023-05-18T20:12:22Z) - Differentiable Neural Networks with RePU Activation: with Applications to Score Estimation and Isotonic Regression [7.450181695527364]
整流パワーユニット(RePU)関数によって活性化される微分可能なニューラルネットワークの特性について検討する。
RePUを活性化したディープニューラルネットワークを用いて,スムーズな関数とその導関数を同時に近似するエラー境界を確立する。
論文 参考訳(メタデータ) (2023-05-01T00:09:48Z) - Singular Value Perturbation and Deep Network Optimization [29.204852309828006]
我々は,行列摂動に関する新たな理論的結果を開発し,アーキテクチャが深層ネットワークの性能に与える影響について光を当てる。
特に,ディープラーニング実践者が長年経験してきたことを説明する。深層アーキテクチャのパラメータは,他よりも容易に最適化できる。
摂動結果の直接的な応用は、ResNetがConvNetよりも簡単に最適化できる理由を解析的に説明します。
論文 参考訳(メタデータ) (2022-03-07T02:09:39Z) - A Deeper Look into Convolutions via Pruning [9.89901717499058]
現代のアーキテクチャは、複数のレイヤの畳み込みの後、しばしば最後に、非常に少数の完全に接続されたレイヤを含んでいる。
この戦略はすでにパラメータの数を削減しているが、ほとんどの畳み込みは認識性能を損なうことなく排除できる。
本研究では,従来の重みに基づく重み付け手法に加えて,固有値に基づく行列特性を用いて,広く使用されているCNNファミリーの内部機構に光を当てる。
論文 参考訳(メタデータ) (2021-02-04T18:55:03Z) - Learning Deep Interleaved Networks with Asymmetric Co-Attention for
Image Restoration [65.11022516031463]
本稿では,高品質(本社)画像再構成のために,異なる状態の情報をどのように組み合わせるべきかを学習するディープインターリーブドネットワーク(DIN)を提案する。
本稿では,各インターリーブノードにアタッチメントされた非対称なコアテンション(AsyCA)を提案し,その特性依存性をモデル化する。
提案したDINはエンドツーエンドで訓練でき、様々な画像復元タスクに適用できる。
論文 参考訳(メタデータ) (2020-10-29T15:32:00Z) - Dynamic Graph: Learning Instance-aware Connectivity for Neural Networks [78.65792427542672]
動的グラフネットワーク(DG-Net)は完全な有向非巡回グラフであり、ノードは畳み込みブロックを表し、エッジは接続経路を表す。
ネットワークの同じパスを使用する代わりに、DG-Netは各ノードの機能を動的に集約する。
論文 参考訳(メタデータ) (2020-10-02T16:50:26Z) - Adaptive Context-Aware Multi-Modal Network for Depth Completion [107.15344488719322]
我々は,観測された空間コンテキストを捉えるために,グラフ伝搬を採用することを提案する。
次に、注意機構を伝搬に適用し、ネットワークが文脈情報を適応的にモデル化することを奨励する。
最後に、抽出したマルチモーダル特徴を効果的に活用するための対称ゲート融合戦略を導入する。
本稿では,Adaptive Context-Aware Multi-Modal Network (ACMNet) を2つのベンチマークで評価した。
論文 参考訳(メタデータ) (2020-08-25T06:00:06Z) - Deep Adaptive Inference Networks for Single Image Super-Resolution [72.7304455761067]
シングルイメージ超解像(SISR)は、ディープ畳み込みニューラルネットワーク(CNN)の展開により、近年大きく進歩している。
本稿では,深部SISR(AdaDSR)の適応型推論ネットワークを活用することで,この問題に対処する。
我々のAdaDSRは、SISRモデルをバックボーンとし、画像の特徴とリソース制約を入力として取り、ローカルネットワーク深さのマップを予測する軽量アダプタモジュールを備える。
論文 参考訳(メタデータ) (2020-04-08T10:08:20Z) - Deep Residual-Dense Lattice Network for Speech Enhancement [29.53125031648651]
残差リンク(ResNet)と因果拡張畳み込みユニットを備えた畳み込みニューラルネットワーク(CNN)は、深層学習による音声強調のためのネットワークとして選択されている。
機能再使用を改善する1つの戦略は、ResNetと密結合CNN(DenseNets)を融合させることである。
本稿では,残差と高密度のアグリゲーションを両立させる残差格子ネットワーク(RDL-Net)を提案する。
論文 参考訳(メタデータ) (2020-02-27T04:36:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。