論文の概要: Localizing Semantic Patches for Accelerating Image Classification
- arxiv url: http://arxiv.org/abs/2206.03367v1
- Date: Tue, 7 Jun 2022 15:01:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-08 14:56:09.265572
- Title: Localizing Semantic Patches for Accelerating Image Classification
- Title(参考訳): 画像分類の高速化のためのセマンティックパッチの局所化
- Authors: Chuanguang Yang, Zhulin An, Yongjun Xu
- Abstract要約: まず、AnchorNetと呼ばれる軽量パッチ提案ネットワークを用いて、入力画像上のタスク認識領域をピンポイントする。
次に、より小さな空間冗長性を持つ局所的なセマンティックパッチを一般的な分類ネットワークに供給する。
提案手法は,より少ない推論コストでSOTA動的推論手法より優れる。
- 参考スコア(独自算出の注目度): 12.250230630124758
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Existing works often focus on reducing the architecture redundancy for
accelerating image classification but ignore the spatial redundancy of the
input image. This paper proposes an efficient image classification pipeline to
solve this problem. We first pinpoint task-aware regions over the input image
by a lightweight patch proposal network called AnchorNet. We then feed these
localized semantic patches with much smaller spatial redundancy into a general
classification network. Unlike the popular design of deep CNN, we aim to
carefully design the Receptive Field of AnchorNet without intermediate
convolutional paddings. This ensures the exact mapping from a high-level
spatial location to the specific input image patch. The contribution of each
patch is interpretable. Moreover, AnchorNet is compatible with any downstream
architecture. Experimental results on ImageNet show that our method outperforms
SOTA dynamic inference methods with fewer inference costs. Our code is
available at https://github.com/winycg/AnchorNet.
- Abstract(参考訳): 既存の作品は、画像分類を加速するためにアーキテクチャ冗長性を減らすことに注力することが多いが、入力画像の空間冗長性は無視する。
本稿では,この問題を解決するための効率的な画像分類パイプラインを提案する。
まず、anchornetと呼ばれる軽量パッチ提案ネットワークにより、入力画像上のタスク認識領域をピンポイントする。
次に、より小さな空間冗長性を持つ局所的なセマンティックパッチを一般的な分類ネットワークに供給する。
深層CNNの一般的な設計とは異なり、中間畳み込みパディングを使わずに、AnchorNetの受容場を慎重に設計することを目指している。
これにより、高レベルの空間位置から特定の入力画像パッチへの正確なマッピングが保証される。
各パッチの貢献は解釈可能である。
さらに、AnchorNetはダウンストリームアーキテクチャと互換性がある。
ImageNetの実験結果から,提案手法は推論コストの少ないSOTA動的推論手法よりも優れていることがわかった。
私たちのコードはhttps://github.com/winycg/AnchorNetで利用可能です。
関連論文リスト
- Learning to Rank Patches for Unbiased Image Redundancy Reduction [80.93989115541966]
画像は、隣接する領域の画素が空間的に相関しているため、空間的冗長性に悩まされる。
既存のアプローチでは、意味の少ない画像領域を減らし、この制限を克服しようとしている。
本稿では,Learning to Rank Patchesと呼ばれる画像冗長性低減のための自己教師型フレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-31T13:12:41Z) - PadChannel: Improving CNN Performance through Explicit Padding Encoding [40.39759037668144]
畳み込みニューラルネットワーク(CNN)では、パディングは層全体の空間的次元を保存する上で重要な役割を果たす。
従来のパディング技術は、実際の画像内容とパッド領域を明確に区別するものではない。
本研究では,パディングステータスを付加的な入力チャネルとしてエンコードする新しいパディング手法PadChannelを提案する。
論文 参考訳(メタデータ) (2023-11-13T07:44:56Z) - PATS: Patch Area Transportation with Subdivision for Local Feature
Matching [78.67559513308787]
局所特徴マッチングは、一対のイメージ間のスパース対応を確立することを目的としている。
この問題に対処するために,PATS(Patch Area Transportation with Subdivision)を提案する。
PATSは、マッチング精度とカバレッジの両方を改善し、下流タスクにおいて優れたパフォーマンスを示す。
論文 参考訳(メタデータ) (2023-03-14T08:28:36Z) - Accurate Image Restoration with Attention Retractable Transformer [50.05204240159985]
画像復元のためのアテンション・リトラクタブル・トランス (ART) を提案する。
ARTはネットワーク内の密集モジュールと疎開モジュールの両方を提示する。
画像超解像、デノナイジング、JPEG圧縮アーティファクト削減タスクについて広範な実験を行った。
論文 参考訳(メタデータ) (2022-10-04T07:35:01Z) - Patch-Based Stochastic Attention for Image Editing [4.8201607588546]
PatchMatchアルゴリズムをベースとした,近接する近傍近傍の同定に有効なアテンション層を提案する。
画像インペイント, ガイド画像のカラー化, シングルイメージ超解像など, 画像編集作業におけるPSALの有用性を示す。
論文 参考訳(メタデータ) (2022-02-07T13:42:00Z) - Global and Local Alignment Networks for Unpaired Image-to-Image
Translation [170.08142745705575]
未ペア画像から画像への変換の目的は、対象領域のスタイルを反映した出力画像を作成することである。
既存の手法では内容変化に注意が払われていないため、ソース画像からの意味情報は翻訳中の劣化に悩まされる。
我々はGLA-Net(Global and Local Alignment Networks)という新しいアプローチを導入する。
本手法は既存の手法よりもシャープでリアルな画像を効果的に生成する。
論文 参考訳(メタデータ) (2021-11-19T18:01:54Z) - Context-aware Padding for Semantic Segmentation [82.37483350347559]
画像の拡張のためのコンテキスト認識(CA)パディング手法を提案する。
ResNetベースのセグメンテーションモデルでは、コンテキスト認識パディングを用いることで、従来のゼロパディングよりも高い平均断面積を達成できる。
論文 参考訳(メタデータ) (2021-09-16T10:33:21Z) - An Empirical Method to Quantify the Peripheral Performance Degradation
in Deep Networks [18.808132632482103]
畳み込みニューラルネットワーク(CNN)カーネルは、各畳み込み層に結合する。
より深いネットワークとストライドベースのダウンサンプリングを組み合わせることで、この領域の伝播は、画像の無視できない部分をカバーすることができる。
我々のデータセットは、高解像度の背景にオブジェクトを挿入することで構築され、画像境界に対してターゲットオブジェクトを特定の位置に配置するサブイメージを収穫することができる。
マスクR-CNNの動作を目標位置の選択にわたって探索することにより、画像境界付近、特に画像コーナーにおいて、パフォーマンス劣化の明確なパターンが明らかになる。
論文 参考訳(メタデータ) (2020-12-04T18:00:47Z) - Image Fine-grained Inpainting [89.17316318927621]
拡張畳み込みの密結合を利用してより大きく効果的な受容場を得る一段階モデルを提案する。
この効率的なジェネレータをよく訓練するために、頻繁に使用されるVGG特徴整合損失を除いて、新しい自己誘導回帰損失を設計する。
また、局所的・グローバルな分枝を持つ識別器を用いて、局所的・グローバルな内容の整合性を確保する。
論文 参考訳(メタデータ) (2020-02-07T03:45:25Z) - Localizing Interpretable Multi-scale informative Patches Derived from
Media Classification Task [12.447143226347922]
我々は、慎重に設計されたRFと線形空間アグリゲーションを備えた解釈可能なAnchorNetを構築した。
ローカライズされたパッチは、元の入力の最もセマンティックスやエビデンスを確実に保持できることを示す。
論文 参考訳(メタデータ) (2020-01-31T10:04:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。