論文の概要: Channel Interaction Networks for Fine-Grained Image Categorization
- arxiv url: http://arxiv.org/abs/2003.05235v1
- Date: Wed, 11 Mar 2020 11:51:51 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-24 14:50:05.651372
- Title: Channel Interaction Networks for Fine-Grained Image Categorization
- Title(参考訳): 細粒度画像分類のためのチャネルインタラクションネットワーク
- Authors: Yu Gao, Xintong Han, Xun Wang, Weilin Huang, Matthew R. Scott
- Abstract要約: 微妙なクラス間差のため、きめ細かい画像分類は困難である。
本稿では,チャネル・インタラクション・ネットワーク(CIN)を提案する。
我々のモデルは、多段階のトレーニングやテストを必要とせずに、エンドツーエンドで効率的にトレーニングすることができる。
- 参考スコア(独自算出の注目度): 61.095320862647476
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Fine-grained image categorization is challenging due to the subtle
inter-class differences.We posit that exploiting the rich relationships between
channels can help capture such differences since different channels correspond
to different semantics. In this paper, we propose a channel interaction network
(CIN), which models the channel-wise interplay both within an image and across
images. For a single image, a self-channel interaction (SCI) module is proposed
to explore channel-wise correlation within the image. This allows the model to
learn the complementary features from the correlated channels, yielding
stronger fine-grained features. Furthermore, given an image pair, we introduce
a contrastive channel interaction (CCI) module to model the cross-sample
channel interaction with a metric learning framework, allowing the CIN to
distinguish the subtle visual differences between images. Our model can be
trained efficiently in an end-to-end fashion without the need of multi-stage
training and testing. Finally, comprehensive experiments are conducted on three
publicly available benchmarks, where the proposed method consistently
outperforms the state-of-theart approaches, such as DFL-CNN (Wang, Morariu, and
Davis 2018) and NTS (Yang et al. 2018).
- Abstract(参考訳): 細粒度の画像分類は,微妙なクラス間差異のため困難であり,チャネル間のリッチな関係を活用すれば,異なるチャネルが異なる意味論に対応するため,そのような差異を捉えることができると考えられる。
本稿では,画像内および画像間のチャネル間相互作用をモデル化するチャネル間相互作用ネットワーク(cin)を提案する。
単一の画像に対して,自己チャネルインタラクション(sci)モジュールを提案し,画像内のチャネル間相関を探索する。
これにより、モデルが相関チャネルから補完的な特徴を学習し、より強力なきめ細かい特徴が得られる。
さらに、画像対が与えられた場合、コントラッシブチャネル相互作用(CCI)モジュールを導入し、メトリック学習フレームワークとのクロスサンプルチャネル相互作用をモデル化し、CINが画像間の微妙な視覚的差異を識別できるようにする。
当社のモデルは,多段階のトレーニングやテストの必要なしに,エンドツーエンドの方法で効率的にトレーニングすることが可能です。
最後に、提案手法は、DFL-CNN (Wang, Morariu, Davis 2018) やNTS (Yang et al. 2018) などの最先端のアプローチを一貫して上回っている。
関連論文リスト
- Efficient Multi-Scale Attention Module with Cross-Spatial Learning [4.046170185945849]
効率的なマルチスケールアテンション(EMA)モジュールを提案する。
チャネルごとの情報保持と計算オーバーヘッドの低減に重点を置いている。
我々は画像分類と物体検出タスクについて広範囲にわたるアブレーション研究と実験を行った。
論文 参考訳(メタデータ) (2023-05-23T00:35:47Z) - Interpreting Class Conditional GANs with Channel Awareness [57.01413866290279]
クラス条件生成器が複数のクラスの合成をどのように統合するかを検討する。
このような現象を説明するために、単一チャネルが最終合成にどのように貢献するかを定量的に特徴づけるチャネル認識を提案する。
我々のアルゴリズムは条件付きGANでいくつかの新しい応用を可能にする。
論文 参考訳(メタデータ) (2022-03-21T17:53:22Z) - Multi-Scale Feature Fusion: Learning Better Semantic Segmentation for
Road Pothole Detection [9.356003255288417]
本稿では,単一モーダルなセマンティックセグメンテーションに基づく新しいポットホール検出手法を提案する。
まず、畳み込みニューラルネットワークを用いて入力画像から視覚的特徴を抽出する。
チャネルアテンションモジュールは、異なるフィーチャーマップの一貫性を高めるために、チャネル機能を再考する。
論文 参考訳(メタデータ) (2021-12-24T15:07:47Z) - Learning Contrastive Representation for Semantic Correspondence [150.29135856909477]
セマンティックマッチングのためのマルチレベルコントラスト学習手法を提案する。
画像レベルのコントラスト学習は、畳み込み特徴が類似したオブジェクト間の対応を見出すための鍵となる要素であることを示す。
論文 参考訳(メタデータ) (2021-09-22T18:34:14Z) - Relational Embedding for Few-Shot Classification [32.12002195421671]
本稿では,メタラーニング(メタラーニング)の「観察すべきもの」と「出席すべき場所」をリレーショナルな視点で扱うことで,数発分類の問題に対処することを提案する。
我々の手法は自己相関表現(SCR)と相互相関注意(CCA)を通して画像内および画像間のパターンを利用する。
私たちの埋め込みネットワーク(RENet)は2つのリレーショナルモジュールを組み合わせて、エンドツーエンドでリレーショナル埋め込みを学習します。
論文 参考訳(メタデータ) (2021-08-22T08:44:55Z) - Speaker embeddings by modeling channel-wise correlations [16.263418635038747]
任意の周波数のチャネル間のペアワイズ相関を統計として用いる,別のプール方式を提案する。
この手法はコンピュータビジョンにおけるスタイル・トランスファー法にインスパイアされ、チャネル関係の行列でモデル化された画像のスタイルが別の画像に転送される。
画像スタイルと話者特性,および画像内容と音素シーケンスの類似を描画することにより,ResNetアーキテクチャを訓練するためのチャネルワイズ相関機能の利用について検討する。
論文 参考訳(メタデータ) (2021-04-06T15:10:14Z) - Progressive Co-Attention Network for Fine-grained Visual Classification [20.838908090777885]
きめ細かい視覚分類は、同じカテゴリ内の複数のサブカテゴリに属する画像を認識することを目的としている。
既存のほとんどの方法は個々の画像のみを入力とする。
そこで本研究では,pca-net(progressive co-attention network)と呼ばれる効果的な手法を提案する。
論文 参考訳(メタデータ) (2021-01-21T10:19:02Z) - Channel-wise Knowledge Distillation for Dense Prediction [73.99057249472735]
本稿では,学生ネットワークと教師ネットワークのチャンネルワイズ機能について提案する。
様々なネットワーク構造を持つ3つのベンチマークにおいて、一貫して優れた性能を実現している。
論文 参考訳(メタデータ) (2020-11-26T12:00:38Z) - Dual Attention GANs for Semantic Image Synthesis [101.36015877815537]
本稿では,写真リアリスティック・セマンティック・一貫性のあるイメージを合成するための新しいデュアルアテンションGAN(DAGAN)を提案する。
また,2つの新しいモジュール,すなわち位置対応空間アテンションモジュール(SAM)と規模対応チャネルアテンションモジュール(CAM)を提案する。
DAGANは、より少ないモデルパラメータを使用しながら、最先端のメソッドよりも驚くほど優れた結果が得られる。
論文 参考訳(メタデータ) (2020-08-29T17:49:01Z) - Single Image Super-Resolution via a Holistic Attention Network [87.42409213909269]
本稿では,階層,チャネル,位置間の全体的相互依存性をモデル化するための新しい全体論的注意ネットワーク(HAN)を提案する。
提案したHANは階層的特徴を適応的に強調し,層間相関を考慮した。
実験により、提案HANは、最先端の単一画像超解像アプローチに対して好適に機能することが示された。
論文 参考訳(メタデータ) (2020-08-20T04:13:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。