論文の概要: Learning Partial Correlation based Deep Visual Representation for Image
Classification
- arxiv url: http://arxiv.org/abs/2304.11597v2
- Date: Wed, 26 Apr 2023 07:00:11 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-27 10:53:29.383912
- Title: Learning Partial Correlation based Deep Visual Representation for Image
Classification
- Title(参考訳): 画像分類のための部分相関に基づく深層視覚表現の学習
- Authors: Saimunur Rahman and Piotr Koniusz and Lei Wang and Luping Zhou and
Peyman Moghadam and Changming Sun
- Abstract要約: CNNの新たな構造層としてスパース逆共分散推定(SICE)を定式化する。
本研究は,部分的相関に基づく深部視覚表現を求め,小さなサンプル問題を緩和する。
実験により,本モデルの有効性と優れた分類性能が示された。
- 参考スコア(独自算出の注目度): 61.0532370259644
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Visual representation based on covariance matrix has demonstrates its
efficacy for image classification by characterising the pairwise correlation of
different channels in convolutional feature maps. However, pairwise correlation
will become misleading once there is another channel correlating with both
channels of interest, resulting in the ``confounding'' effect. For this case,
``partial correlation'' which removes the confounding effect shall be estimated
instead. Nevertheless, reliably estimating partial correlation requires to
solve a symmetric positive definite matrix optimisation, known as sparse
inverse covariance estimation (SICE). How to incorporate this process into CNN
remains an open issue. In this work, we formulate SICE as a novel structured
layer of CNN. To ensure end-to-end trainability, we develop an iterative method
to solve the above matrix optimisation during forward and backward propagation
steps. Our work obtains a partial correlation based deep visual representation
and mitigates the small sample problem often encountered by covariance matrix
estimation in CNN. Computationally, our model can be effectively trained with
GPU and works well with a large number of channels of advanced CNNs.
Experiments show the efficacy and superior classification performance of our
deep visual representation compared to covariance matrix based counterparts.
- Abstract(参考訳): 共分散行列に基づく視覚表現は、畳み込み特徴写像における異なるチャネルのペア関係を特徴付けることにより、画像分類の有効性を示す。
しかし、一方の相関関係は、興味のある両方のチャネルに関連付けられた別のチャネルが存在すると誤解され、 ``confounding'' 効果をもたらす。
この場合、共起効果を除去する ``partial correlation'' を代わりに推定する。
それでも、偏相関を確実に推定するには対称正定値行列最適化(sparse inverse covariance Estimation, SICE)を解く必要がある。
このプロセスをCNNに組み込む方法はまだオープンな問題である。
本研究では,CNNの新規構造層としてSICEを定式化する。
エンドツーエンドのトレーサビリティを確保するために,上述の行列最適化を前方および後方伝播ステップで解く反復法を開発した。
本研究は,cnn における共分散行列推定によって発生する小さなサンプル問題を軽減し,部分相関に基づく深部視覚表現を得る。
計算学的には、我々のモデルはGPUで効果的に訓練でき、先進的なCNNの多数のチャネルでうまく機能する。
実験では,共分散行列に基づく表現と比較して,深い視覚表現の有効性と優れた分類性能を示す。
関連論文リスト
- Canonical Correlation Guided Deep Neural Network [14.188285111418516]
深層ニューラルネットワーク(CCDNN)により実現可能な標準相関学習フレームワークを提案する。
提案手法では、最適化の定式化は相関を最大化するために制限されず、代わりに正規相関を制約として行う。
相関による冗長性を低減するために、冗長性フィルタを設計する。
論文 参考訳(メタデータ) (2024-09-28T16:08:44Z) - Efficient Similarity-based Passive Filter Pruning for Compressing CNNs [23.661189257759535]
畳み込みニューラルネットワーク(CNN)は様々なアプリケーションで大きな成功を収めている。
CNNの計算複雑性とメモリストレージは、リソース制約のあるデバイスへのデプロイにおいてボトルネックとなる。
CNNの計算コストとメモリオーバーヘッドを削減しようとする最近の取り組みは、類似性に基づくパッシブフィルタプルーニング手法である。
論文 参考訳(メタデータ) (2022-10-27T09:57:47Z) - Large-Margin Representation Learning for Texture Classification [67.94823375350433]
本稿では,テクスチャ分類のための小さなデータセット上で教師付きモデルをトレーニングするために,畳み込み層(CL)と大規模計量学習を組み合わせた新しいアプローチを提案する。
テクスチャと病理画像データセットの実験結果から,提案手法は同等のCNNと比較して計算コストが低く,収束が早く,競争精度が向上することが示された。
論文 参考訳(メタデータ) (2022-06-17T04:07:45Z) - Disentangled Representation Learning for Text-Video Retrieval [51.861423831566626]
テキスト・ビデオ検索(TVR)における相互モダリティの相互作用
我々は相互作用のパラダイムを深く研究し、その計算を2つの項に分けることができることを示した。
本稿では,逐次的かつ階層的な表現を捉えるための非絡み合いフレームワークを提案する。
論文 参考訳(メタデータ) (2022-03-14T13:55:33Z) - Semantic Correspondence with Transformers [68.37049687360705]
本稿では,変換器を用いたコストアグリゲーション(CAT)を提案し,意味論的に類似した画像間の密接な対応を見出す。
初期相関マップと多レベルアグリゲーションを曖昧にするための外観親和性モデリングを含む。
提案手法の有効性を示す実験を行い,広範囲にわたるアブレーション研究を行った。
論文 参考訳(メタデータ) (2021-06-04T14:39:03Z) - ACDC: Weight Sharing in Atom-Coefficient Decomposed Convolution [57.635467829558664]
我々は,CNNにおいて,畳み込みカーネル間の構造正則化を導入する。
我々はCNNがパラメータや計算量を劇的に減らして性能を維持していることを示す。
論文 参考訳(メタデータ) (2020-09-04T20:41:47Z) - Out-of-distribution Generalization via Partial Feature Decorrelation [72.96261704851683]
本稿では,特徴分解ネットワークと対象画像分類モデルとを協調的に最適化する,PFDL(Partial Feature Deorrelation Learning)アルゴリズムを提案する。
実世界のデータセットを用いた実験により,OOD画像分類データセットにおけるバックボーンモデルの精度が向上することを示した。
論文 参考訳(メタデータ) (2020-07-30T05:48:48Z) - Domain Siamese CNNs for Sparse Multispectral Disparity Estimation [15.065764374430783]
そこで本研究では,異なるスペクトルの画像間の不均一性を推定できる新しいCNNアーキテクチャを提案する。
LITIV 2014およびLITIV 2018データセットを用いて実験を行った。
論文 参考訳(メタデータ) (2020-04-30T20:29:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。