論文の概要: Top-Down Networks: A coarse-to-fine reimagination of CNNs
- arxiv url: http://arxiv.org/abs/2004.07629v1
- Date: Thu, 16 Apr 2020 12:29:48 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-12 21:11:13.675644
- Title: Top-Down Networks: A coarse-to-fine reimagination of CNNs
- Title(参考訳): トップダウンネットワーク:CNNの粗大な再想像
- Authors: Ioannis Lelekas, Nergis Tomen, Silvia L. Pintea and Jan C. van Gemert
- Abstract要約: 生物学的ビジョンは、粗い情報処理経路を採用する。
トップダウンネットワークは、高周波ノイズを発生させる敵攻撃に対する防御線を提供する。
本稿では,複数の視覚的タスクにおける様々な既存アーキテクチャへのトップダウン分解処理の適用性を示す実証的な証拠を提供する。
- 参考スコア(独自算出の注目度): 25.079310083166824
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Biological vision adopts a coarse-to-fine information processing pathway,
from initial visual detection and binding of salient features of a visual
scene, to the enhanced and preferential processing given relevant stimuli. On
the contrary, CNNs employ a fine-to-coarse processing, moving from local,
edge-detecting filters to more global ones extracting abstract representations
of the input. In this paper we reverse the feature extraction part of standard
bottom-up architectures and turn them upside-down: We propose top-down
networks. Our proposed coarse-to-fine pathway, by blurring higher frequency
information and restoring it only at later stages, offers a line of defence
against adversarial attacks that introduce high frequency noise. Moreover,
since we increase image resolution with depth, the high resolution of the
feature map in the final convolutional layer contributes to the explainability
of the network's decision making process. This favors object-driven decisions
over context driven ones, and thus provides better localized class activation
maps. This paper offers empirical evidence for the applicability of the
top-down resolution processing to various existing architectures on multiple
visual tasks.
- Abstract(参考訳): 生体視覚は、視覚シーンの突出した特徴の最初の視覚検出と結合から、関連する刺激による強化および優先的な処理まで、粗雑な情報処理経路を採用する。
逆にcnnは、局所的なエッジ検出フィルタから、入力の抽象表現を抽出するよりグローバルな処理へと、細かな対コア処理を採用している。
本稿では,標準ボトムアップアーキテクチャの特徴抽出部分を逆転させ,それらを逆逆転させる:トップダウンネットワークを提案する。
提案手法は,高周波数情報を曖昧にし,後段のみ復元することで,高周波数ノイズを発生させる敵対的攻撃に対する防御線を提供する。
さらに,画像の解像度を奥行きで増やすことで,最終畳み込み層における特徴マップの高分解能がネットワークの意思決定プロセスの説明性に寄与する。
これにより、コンテキスト駆動型よりもオブジェクト駆動決定が好まれるので、ローカライズされたクラスアクティベーションマップがより良く提供されます。
本稿では,複数タスクの既存アーキテクチャに対するトップダウン解像度処理の適用性に関する実証的証拠を提供する。
関連論文リスト
- Shap-CAM: Visual Explanations for Convolutional Neural Networks based on
Shapley Value [86.69600830581912]
クラスアクティベーションマッピングに基づくShap-CAMと呼ばれる新しい視覚的説明法を開発した。
我々は,Shap-CAMが意思決定プロセスの解釈において,より良い視覚的性能と公平性を実現することを実証した。
論文 参考訳(メタデータ) (2022-08-07T00:59:23Z) - Learning Enriched Features for Fast Image Restoration and Enhancement [166.17296369600774]
本稿では,ネットワーク全体を通して空間的精度の高い高解像度表現を維持することを目的とする。
我々は、高解像度の空間的詳細を同時に保存しながら、複数のスケールからの文脈情報を組み合わせた豊富な特徴集合を学習する。
提案手法は,デフォーカス・デブロアリング,画像デノイング,超解像,画像強調など,さまざまな画像処理タスクに対して,最先端の処理結果を実現する。
論文 参考訳(メタデータ) (2022-04-19T17:59:45Z) - High-resolution Iterative Feedback Network for Camouflaged Object
Detection [128.893782016078]
カモフラージュされたオブジェクトを背景に視覚的に同化させることは、オブジェクト検出アルゴリズムにとって難しい。
エッジやバウンダリのぼやけた視界を生じさせる細部劣化を避けるために,高分解能テクスチャの詳細を抽出することを目的としている。
我々は,高解像度特徴量による低解像度表現を反復的フィードバック方式で洗練する新しいHitNetを提案する。
論文 参考訳(メタデータ) (2022-03-22T11:20:21Z) - RigNet: Repetitive Image Guided Network for Depth Completion [20.66405067066299]
近年のアプローチは、高密度な結果を予測するためのイメージガイド学習に重点を置いている。
ぼやけたイメージガイダンスとオブジェクト構造は、まだイメージガイドされたフレームワークのパフォーマンスを妨げている。
画像案内ネットワークにおける反復的な設計を探索し,徐々に深度値の回復を図る。
提案手法は,NYUv2データセットの最先端化を実現し,提出時のKITTIベンチマークで1位にランクインする。
論文 参考訳(メタデータ) (2021-07-29T08:00:33Z) - The Mind's Eye: Visualizing Class-Agnostic Features of CNNs [92.39082696657874]
本稿では,特定のレイヤの最も情報性の高い特徴を表現した対応する画像を作成することにより,画像の集合を視覚的に解釈する手法を提案する。
本手法では, 生成ネットワークを必要とせず, 元のモデルに変更を加えることなく, デュアルオブジェクトのアクティベーションと距離損失を利用する。
論文 参考訳(メタデータ) (2021-01-29T07:46:39Z) - Interpretable Detail-Fidelity Attention Network for Single Image
Super-Resolution [89.1947690981471]
本研究では,スムースとディテールを段階的に分割・収束的に処理する,目的・解釈可能なディテール・ファイダリティ・アテンション・ネットワークを提案する。
特に,詳細推論において顕著な解釈可能な特徴表現のためのヘシアンフィルタを提案する。
実験により,提案手法は最先端手法よりも優れた性能を示すことが示された。
論文 参考訳(メタデータ) (2020-09-28T08:31:23Z) - Learning Enriched Features for Real Image Restoration and Enhancement [166.17296369600774]
畳み込みニューラルネットワーク(CNN)は、画像復元作業における従来のアプローチよりも劇的に改善されている。
ネットワーク全体を通して空間的精度の高い高解像度表現を維持することを目的とした,新しいアーキテクチャを提案する。
提案手法は,高解像度の空間的詳細を同時に保存しながら,複数のスケールからの文脈情報を組み合わせた豊富な特徴集合を学習する。
論文 参考訳(メタデータ) (2020-03-15T11:04:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。