論文の概要: Attentional Feature Fusion
- arxiv url: http://arxiv.org/abs/2009.14082v2
- Date: Mon, 9 Nov 2020 17:41:20 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-13 06:36:36.328913
- Title: Attentional Feature Fusion
- Title(参考訳): 注意的特徴融合
- Authors: Yimian Dai and Fabian Gieseke and Stefan Oehmcke and Yiquan Wu and
Kobus Barnard
- Abstract要約: 本稿では,一様で汎用的な特徴融合手法を提案する。
我々のモデルは、CIFAR-100とImageNetのデータセットで最先端のネットワークより優れていることを示す。
- 参考スコア(独自算出の注目度): 4.265244011052538
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Feature fusion, the combination of features from different layers or
branches, is an omnipresent part of modern network architectures. It is often
implemented via simple operations, such as summation or concatenation, but this
might not be the best choice. In this work, we propose a uniform and general
scheme, namely attentional feature fusion, which is applicable for most common
scenarios, including feature fusion induced by short and long skip connections
as well as within Inception layers. To better fuse features of inconsistent
semantics and scales, we propose a multi-scale channel attention module, which
addresses issues that arise when fusing features given at different scales. We
also demonstrate that the initial integration of feature maps can become a
bottleneck and that this issue can be alleviated by adding another level of
attention, which we refer to as iterative attentional feature fusion. With
fewer layers or parameters, our models outperform state-of-the-art networks on
both CIFAR-100 and ImageNet datasets, which suggests that more sophisticated
attention mechanisms for feature fusion hold great potential to consistently
yield better results compared to their direct counterparts. Our codes and
trained models are available online.
- Abstract(参考訳): 機能融合(Feature fusion)とは、異なるレイヤやブランチの機能の組み合わせであり、現代のネットワークアーキテクチャの全体像である。
要約や結合といった単純な操作で実装されることが多いが、これは最善の選択ではないかもしれない。
本研究では,短距離および長距離のスキップ接続によって引き起こされる特徴融合やインセプション層内で発生する特徴融合など,最も一般的なシナリオに適用可能な,一様かつ一般的なスキーム,すなわち注意的特徴融合を提案する。
一貫性のないセマンティクスとスケールの機能を融合させるため,異なるスケールの機能を融合する場合に発生する問題に対処するマルチスケールチャネルアテンションモジュールを提案する。
また,機能マップの初期の統合がボトルネックになり得ること,また,これを反復的注目的特徴融合と呼ぶ新たなレベルの注意を加えることで,この問題を緩和できることを実証した。
CIFAR-100とImageNetのデータセットでは、レイヤーやパラメータが少ないため、私たちのモデルは最先端のネットワークよりも優れています。
私たちのコードとトレーニングされたモデルはオンラインで利用可能です。
関連論文リスト
- A Semantic-Aware and Multi-Guided Network for Infrared-Visible Image Fusion [41.34335755315773]
マルチモダリティ画像融合は、2つのソース画像から特定のモダリティ情報と共有モダリティ情報を融合することを目的としている。
本稿では,3分岐エンコーダデコーダアーキテクチャと,それに対応する融合層を融合戦略として提案する。
可視・近赤外画像融合および医用画像融合タスクにおける最先端手法と比較して,本手法は競争力のある結果を得た。
論文 参考訳(メタデータ) (2024-06-11T09:32:40Z) - SOFTS: Efficient Multivariate Time Series Forecasting with Series-Core Fusion [59.96233305733875]
時系列予測は、金融、交通管理、エネルギー、医療など様々な分野で重要な役割を果たしている。
いくつかの方法は、注意やミキサーのようなメカニズムを利用して、チャネル相関をキャプチャすることでこの問題に対処する。
本稿では,効率的なモデルであるSOFTS(Series-cOre Fused Time Series forecaster)を提案する。
論文 参考訳(メタデータ) (2024-04-22T14:06:35Z) - ICAFusion: Iterative Cross-Attention Guided Feature Fusion for
Multispectral Object Detection [25.66305300362193]
大域的特徴相互作用をモデル化するために、二重対向変換器の新たな特徴融合フレームワークを提案する。
このフレームワークは、クエリ誘導のクロスアテンション機構を通じて、オブジェクトの特徴の識別性を高める。
提案手法は,様々なシナリオに適した性能と高速な推論を実現する。
論文 参考訳(メタデータ) (2023-08-15T00:02:10Z) - A Task-guided, Implicitly-searched and Meta-initialized Deep Model for
Image Fusion [69.10255211811007]
本稿では,課題の多い現実シナリオにおいて,画像融合問題に対処するためのタスク誘導,インプリシト検索,メタ一般化(TIM)深層モデルを提案する。
具体的には、画像融合の教師なし学習プロセスを導くために、下流タスクからの情報を組み込む制約付き戦略を提案する。
このフレームワーク内に暗黙の探索スキームを設計し、高速な融合モデルのためのコンパクトなアーキテクチャを自動で発見する。
論文 参考訳(メタデータ) (2023-05-25T08:54:08Z) - CAT: Learning to Collaborate Channel and Spatial Attention from
Multi-Information Fusion [23.72040577828098]
本稿では,空間とチャネルのアテンション間の協調を活性化する「CAT」と呼ばれるプラグイン・アンド・プレイアテンション・モジュールを提案する。
具体的には、特徴を訓練可能な係数(コラ因子)として表現し、異なる注意モジュールの寄与を適応的に組み合わせる。
我々のCATは、オブジェクト検出、インスタンスセグメンテーション、画像分類において、既存の最先端の注意機構よりも優れています。
論文 参考訳(メタデータ) (2022-12-13T02:34:10Z) - CDDFuse: Correlation-Driven Dual-Branch Feature Decomposition for
Multi-Modality Image Fusion [138.40422469153145]
本稿では,CDDFuse(Relationed-Driven Feature Decomposition Fusion)ネットワークを提案する。
近赤外可視画像融合や医用画像融合など,複数の融合タスクにおいてCDDFuseが有望な結果をもたらすことを示す。
論文 参考訳(メタデータ) (2022-11-26T02:40:28Z) - A Generic Shared Attention Mechanism for Various Backbone Neural Networks [53.36677373145012]
自己注意モジュール(SAM)は、異なる層にまたがる強い相関した注意マップを生成する。
Dense-and-Implicit Attention (DIA)はSAMをレイヤ間で共有し、長期間のメモリモジュールを使用する。
我々のシンプルで効果的なDIAは、様々なネットワークバックボーンを一貫して拡張できます。
論文 参考訳(メタデータ) (2022-10-27T13:24:08Z) - Correlation-Aware Deep Tracking [83.51092789908677]
本稿では,自己/横断的意図に着想を得た,新たなターゲット依存型特徴ネットワークを提案する。
我々のネットワークは機能ネットワークの複数の層にクロスイメージの特徴相関を深く埋め込んでいる。
我々のモデルは、豊富な未ペア画像に対して柔軟に事前訓練が可能であり、既存の手法よりも顕著に高速な収束をもたらす。
論文 参考訳(メタデータ) (2022-03-03T11:53:54Z) - Learning Deep Multimodal Feature Representation with Asymmetric
Multi-layer Fusion [63.72912507445662]
本稿では,マルチモーダルな特徴を複数の層に融合する,コンパクトで効果的なフレームワークを提案する。
我々は、エンコーダ内のモダリティ固有のバッチ正規化層を単に維持するだけで、共有シングルネットワーク内でマルチモーダル機能を学習できることを検証する。
次に,マルチモーダルな特徴を段階的に活用できる双方向多層融合方式を提案する。
論文 参考訳(メタデータ) (2021-08-11T03:42:13Z) - MA-Unet: An improved version of Unet based on multi-scale and attention
mechanism for medical image segmentation [4.082245106486775]
畳み込みニューラルネットワーク(CNN)は、医用画像セマンティックセグメンテーションの開発を促進する。
本稿では,アテンションゲート(AG)を追加し,スキップ接続操作における意味的曖昧さを解消する。
本モデルでは,より少ないパラメータを導入しながら,セグメンテーション性能が向上する。
論文 参考訳(メタデータ) (2020-12-20T15:29:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。