論文の概要: SDA-$x$Net: Selective Depth Attention Networks for Adaptive Multi-scale
Feature Representation
- arxiv url: http://arxiv.org/abs/2209.10327v1
- Date: Wed, 21 Sep 2022 12:49:55 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-22 16:35:47.274741
- Title: SDA-$x$Net: Selective Depth Attention Networks for Adaptive Multi-scale
Feature Representation
- Title(参考訳): SDA-$x$Net: 適応型マルチスケール特徴表現のための選択深度注意ネットワーク
- Authors: Qingbei Guo, Xiao-Jun Wu, Zhiquan Feng, Tianyang Xu and Cong Hu
- Abstract要約: 既存のマルチスケールの解は、小さな受容場を無視しながら、受容場のサイズを増大させるリスクをもたらす。
我々は,チャネル,空間,分岐などの既存の注意次元に加えて,新しい注意次元,すなわち深さを導入する。
本稿では,様々な視覚タスクにおいて,マルチスケールオブジェクトを対称に扱うための,新しい選択的な奥行き注意ネットワークを提案する。
- 参考スコア(独自算出の注目度): 14.7929472540577
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Existing multi-scale solutions lead to a risk of just increasing the
receptive field sizes while neglecting small receptive fields. Thus, it is a
challenging problem to effectively construct adaptive neural networks for
recognizing various spatial-scale objects. To tackle this issue, we first
introduce a new attention dimension, i.e., depth, in addition to existing
attention dimensions such as channel, spatial, and branch, and present a novel
selective depth attention network to symmetrically handle multi-scale objects
in various vision tasks. Specifically, the blocks within each stage of a given
neural network, i.e., ResNet, output hierarchical feature maps sharing the same
resolution but with different receptive field sizes. Based on this structural
property, we design a stage-wise building module, namely SDA, which includes a
trunk branch and a SE-like attention branch. The block outputs of the trunk
branch are fused to globally guide their depth attention allocation through the
attention branch. According to the proposed attention mechanism, we can
dynamically select different depth features, which contributes to adaptively
adjusting the receptive field sizes for the variable-sized input objects. In
this way, the cross-block information interaction leads to a long-range
dependency along the depth direction. Compared with other multi-scale
approaches, our SDA method combines multiple receptive fields from previous
blocks into the stage output, thus offering a wider and richer range of
effective receptive fields. Moreover, our method can be served as a pluggable
module to other multi-scale networks as well as attention networks, coined as
SDA-$x$Net. Their combination further extends the range of the effective
receptive fields towards small receptive fields, enabling interpretable neural
networks. Our source code is available at
\url{https://github.com/QingbeiGuo/SDA-xNet.git}.
- Abstract(参考訳): 既存のマルチスケールソリューションは、小さな受容野を無視しながら、受容野のサイズを増加させるリスクをもたらす。
したがって、様々な空間的対象を認識するための適応型ニューラルネットワークを効果的に構築することが課題である。
この問題に取り組むため,まず,チャネル,空間,分岐といった既存の注意次元に加えて,新たな注意次元,すなわち奥行きを導入し,様々な視覚タスクにおいて多次元オブジェクトを対称に扱うための新しい選択的奥行き注意ネットワークを提案する。
具体的には、与えられたニューラルネットワークの各ステージ、すなわちresnetの各ブロックは、同じ解像度を共有するが、異なるレセプティブフィールドサイズを持つ階層的特徴マップを出力する。
この構造的特性に基づいて、我々は、トランクブランチとSEライクなアテンションブランチを含むステージワイドなビルディングモジュール、すなわちSDAを設計する。
トランクブランチのブロック出力を融合させ、その深さ注意割り当てをアテンションブランチを介してグローバルに誘導する。
提案手法により,可変サイズの入力オブジェクトに対する受容場サイズを適応的に調整するために,異なる深度特徴を動的に選択できる。
このようにして、クロスブロック情報相互作用は深度方向に沿って長距離依存性をもたらす。
他のマルチスケールアプローチと比較して、SDA法は、前のブロックからの複数の受容場をステージ出力に組み合わせ、より広い範囲の効果的な受容場を提供する。
さらに,本手法は,SDA-$x$Netと呼ばれる,他のマルチスケールネットワークやアテンションネットワークにプラグイン可能なモジュールとして提供することができる。
これらの組み合わせは、効果的な受容野の範囲を小さな受容野へと拡張し、解釈可能なニューラルネットワークを可能にする。
我々のソースコードは \url{https://github.com/qingbeiguo/sda-xnet.git}で入手できる。
関連論文リスト
- Poly Kernel Inception Network for Remote Sensing Detection [64.60749113583601]
リモートセンシング画像における物体検出の課題に対処するために,Poly Kernel Inception Network (PKINet)を導入する。
PKINetはディレーションなしでマルチスケールの畳み込みカーネルを使用し、様々なスケールのオブジェクトの特徴を抽出し、ローカルコンテキストをキャプチャする。
これら2つのコンポーネントは、4つの挑戦的なリモートセンシング検出ベンチマーク上でPKINetのパフォーマンスを向上させるために共同で動作する。
論文 参考訳(メタデータ) (2024-03-10T16:56:44Z) - Densely Decoded Networks with Adaptive Deep Supervision for Medical
Image Segmentation [19.302294715542175]
本稿では「クラッチ」ネットワーク接続を選択的に導入し、高密度デコードネットワーク(ddn)を提案する。
ネットワークデコーダの各アップサンプリングステージにおける「クラッチ」接続により、ターゲットのローカライゼーションが向上する。
また、適応的な深層監視(ads)に基づくトレーニング戦略を提案し、入力データセットの特定の属性を利用して適応する。
論文 参考訳(メタデータ) (2024-02-05T00:44:57Z) - HiDAnet: RGB-D Salient Object Detection via Hierarchical Depth Awareness [2.341385717236931]
本稿では,RGB-Dサリエンシ検出のための階層的深度認識ネットワーク(HiDAnet)を提案する。
我々のモチベーションは、幾何学的先行の多粒性特性がニューラルネットワーク階層とよく相関しているという観察から来ています。
当社のHiDAnetは最先端の手法よりも大きなマージンで良好に動作します。
論文 参考訳(メタデータ) (2023-01-18T10:00:59Z) - AF$_2$: Adaptive Focus Framework for Aerial Imagery Segmentation [86.44683367028914]
航空画像のセグメンテーションにはいくつかの独特な課題があり、中でも最も重要なものは前景と背景のアンバランスにある。
本稿では,階層的なセグメンテーション手法を採用し,マルチスケール表現を適応的に活用するAdaptive Focus Framework (AF$)を提案する。
AF$は、広く使われている3つの航空ベンチマークの精度を大幅に改善した。
論文 参考訳(メタデータ) (2022-02-18T10:14:45Z) - Domain Attention Consistency for Multi-Source Domain Adaptation [100.25573559447551]
主な設計は、伝達可能な特徴(属性)を識別することを目的とした機能チャネルアテンションモジュールである。
3つのMSDAベンチマーク実験により、DAC-Netは、それらすべてに対して、新たなパフォーマンスを実現することが示された。
論文 参考訳(メタデータ) (2021-11-06T15:56:53Z) - Attention Cube Network for Image Restoration [39.49175636499541]
より強力な特徴表現と特徴相関学習のための画像復元のための注意キューブネットワーク(A-CubeNet)を提案する。
本研究では,空間次元,チャネルワイド次元,階層次元の3次元から新たな注意機構を設計する。
定量的比較と視覚解析の両面において,最先端画像復元法よりも本手法の方が優れていることを示す実験を行った。
論文 参考訳(メタデータ) (2020-09-13T03:42:14Z) - Channel-wise Alignment for Adaptive Object Detection [66.76486843397267]
遺伝的物体検出は、ディープ畳み込みニューラルネットワークの開発によって大いに促進されている。
このタスクの既存の方法は、通常、画像全体や関心の対象に基づいて、ハイレベルなアライメントに注意を向ける。
本稿では,チャネルワイドアライメント(チャネルワイドアライメント)という,まったく異なる観点からの適応を実現する。
論文 参考訳(メタデータ) (2020-09-07T02:42:18Z) - Automated Search for Resource-Efficient Branched Multi-Task Networks [81.48051635183916]
我々は,多タスクニューラルネットワークにおける分岐構造を自動的に定義する,微分可能なニューラルネットワーク探索に根ざした原理的アプローチを提案する。
本手法は,限られた資源予算内で高い性能の分岐構造を見いだすことができる。
論文 参考訳(メタデータ) (2020-08-24T09:49:19Z) - Feature-Dependent Cross-Connections in Multi-Path Neural Networks [7.230526683545722]
マルチパスネットワークは冗長な特徴を学習する傾向がある。
このような経路に対して,入ってくる特徴写像をインテリジェントに割り当てる機構を導入する。
従来手法や最先端手法と比較して,画像認識精度が向上した。
論文 参考訳(メタデータ) (2020-06-24T17:38:03Z) - Multi-Subspace Neural Network for Image Recognition [33.61205842747625]
画像分類タスクでは, 特徴抽出は常に大きな問題であり, クラス内変動により抽出器の設計が困難になる。
近年、ディープラーニングはデータから機能を自動的に学習することに多くの注意を払っている。
本研究では,畳み込みニューラルネットワーク(CNN)のキーコンポーネントをサブスペースの概念と組み合わせたマルチサブスペースニューラルネットワーク(MSNN)を提案する。
論文 参考訳(メタデータ) (2020-06-17T02:55:34Z) - Hold me tight! Influence of discriminative features on deep network
boundaries [63.627760598441796]
本稿では,データセットの特徴と,サンプルから決定境界までの距離を関連付ける新しい視点を提案する。
これにより、トレーニングサンプルの位置を慎重に調整し、大規模ビジョンデータセットでトレーニングされたCNNの境界における誘発された変化を測定することができる。
論文 参考訳(メタデータ) (2020-02-15T09:29:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。