論文の概要: FaPN: Feature-aligned Pyramid Network for Dense Image Prediction
- arxiv url: http://arxiv.org/abs/2108.07058v1
- Date: Mon, 16 Aug 2021 12:52:42 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-17 19:54:07.814020
- Title: FaPN: Feature-aligned Pyramid Network for Dense Image Prediction
- Title(参考訳): FaPN:高密度画像予測のための特徴整列ピラミッドネットワーク
- Authors: Shihua, Huang, Zhichao, Lu, Ran, Cheng, Cheng, He
- Abstract要約: 本稿では,画素の変換オフセットから,アップサンプリング機能への変換を学習する機能アライメントモジュールを提案する。
次に、これらの2つのモジュールをトップダウンピラミッドアーキテクチャに統合し、Feature-aligned Pyramid Network (FaPN)を提示します。
特に、私たちのFaPNは Mask-Former に統合された ADE20K 上で56.7% mIoU の最先端を実現している。
- 参考スコア(独自算出の注目度): 6.671771202012392
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent advancements in deep neural networks have made remarkable
leap-forwards in dense image prediction. However, the issue of feature
alignment remains as neglected by most existing approaches for simplicity.
Direct pixel addition between upsampled and local features leads to feature
maps with misaligned contexts that, in turn, translate to mis-classifications
in prediction, especially on object boundaries. In this paper, we propose a
feature alignment module that learns transformation offsets of pixels to
contextually align upsampled higher-level features; and another feature
selection module to emphasize the lower-level features with rich spatial
details. We then integrate these two modules in a top-down pyramidal
architecture and present the Feature-aligned Pyramid Network (FaPN). Extensive
experimental evaluations on four dense prediction tasks and four datasets have
demonstrated the efficacy of FaPN, yielding an overall improvement of 1.2 - 2.6
points in AP / mIoU over FPN when paired with Faster / Mask R-CNN. In
particular, our FaPN achieves the state-of-the-art of 56.7% mIoU on ADE20K when
integrated within Mask-Former. The code is available from
https://github.com/EMI-Group/FaPN.
- Abstract(参考訳): 近年の深層ニューラルネットワークの進歩は、高密度画像予測において飛躍的な進歩を遂げている。
しかし、機能アライメントの問題は、既存のほとんどのシンプルさのアプローチによって無視されているままである。
アップサンプリングされた特徴と局所的な特徴の間の直接のピクセル付加は、不一致コンテキストを持つ特徴写像につながり、その結果、特にオブジェクト境界における予測における誤分類に変換される。
本稿では,画素の変換オフセットを学習し,高次特徴を文脈的に整列させる機能アライメントモジュールと,空間的詳細が充実した低次特徴を強調する機能選択モジュールを提案する。
次に,これら2つのモジュールをトップダウンピラミッドアーキテクチャに統合し,機能整合ピラミッドネットワーク(fapn)を提案する。
4つの密集予測タスクと4つのデータセットに関する大規模な実験的評価は、FaPNの有効性を示し、FPNとFaster / Mask R-CNNを合わせると、AP/mIoUの1.2-2.6ポイントがFPNよりも大幅に改善された。
特に、私たちのFaPNは Mask-Former に統合された ADE20K 上で56.7% mIoU の最先端を実現している。
コードはhttps://github.com/EMI-Group/FaPNから入手できる。
関連論文リスト
- An Efficient MLP-based Point-guided Segmentation Network for Ore Images
with Ambiguous Boundary [12.258442550351178]
本稿では,エッジバーリングの問題を解決することを目的とした,MLP(Multi-Layer Perceptron)に基づく軽量フレームワークを提案する。
提案手法は, 73MBのモデルサイズで, 毎秒27フレーム以上の処理速度を実現する。
提案手法は,性能スコアが60.4,48.9 in$AP_50box$と$AP_50mask$の順に高い精度を提供する。
論文 参考訳(メタデータ) (2024-02-27T10:09:29Z) - CoFiI2P: Coarse-to-Fine Correspondences for Image-to-Point Cloud Registration [9.57539651520755]
CoFiI2Pは、粗い方法で通信を抽出する新しいI2P登録ネットワークである。
粗いマッチングフェーズでは、均一なグローバル情報と不均一なグローバル情報の両方をキャプチャするために、新しいI2Pトランスフォーマーモジュールが使用される。
微細マッチングモジュールにおいて、スーパーポイント/スーパーピクセル対応のガイダンスにより、ポイント/ピクセル対を確立する。
論文 参考訳(メタデータ) (2023-09-26T04:32:38Z) - Mutual-Guided Dynamic Network for Image Fusion [51.615598671899335]
画像融合のための新しい相互誘導動的ネットワーク(MGDN)を提案する。
5つのベンチマークデータセットによる実験結果から,提案手法は4つの画像融合タスクにおいて既存手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2023-08-24T03:50:37Z) - AFPN: Asymptotic Feature Pyramid Network for Object Detection [16.86715579071991]
本稿では,非隣接レベルでの直接対話を支援する機能ピラミッドネットワーク(AFPN)を提案する。
AFPNは隣接する2つの低レベル特徴を融合させ、融合プロセスに高レベル特徴を実現する。
提案したAFPNを2段階および1段階のオブジェクト検出フレームワークに組み込んで,MS-COCO 2017バリデーションとテストデータセットを用いて評価する。
論文 参考訳(メタデータ) (2023-06-28T07:58:49Z) - Learning Implicit Feature Alignment Function for Semantic Segmentation [51.36809814890326]
Implicit Feature Alignment Function (IFA)は、暗黙の神経表現の急速に拡大するトピックにインスパイアされている。
IFAは機能マップを異なるレベルで暗黙的に整列し、任意の解像度でセグメンテーションマップを生成することができることを示す。
提案手法は,様々なアーキテクチャの改善と組み合わせて,一般的なベンチマークにおける最先端の精度のトレードオフを実現する。
論文 参考訳(メタデータ) (2022-06-17T09:40:14Z) - A^2-FPN: Attention Aggregation based Feature Pyramid Network for
Instance Segmentation [68.10621089649486]
アテンションアグリゲーションに基づく機能ピラミッドネットワーク(A2-FPN)を提案し、マルチスケール機能学習を改善します。
A2-FPNは、Cascade Mask R-CNNやHybrid Task Cascadeといった強力なベースラインに統合された場合、2.0%と1.4%のマスクAPを改善する。
論文 参考訳(メタデータ) (2021-05-07T11:51:08Z) - RepMLP: Re-parameterizing Convolutions into Fully-connected Layers for
Image Recognition [123.59890802196797]
画像認識のための多層パーセプトロン型ニューラルネットワーク構築ブロックであるRepMLPを提案する。
トレーニング中にRepMLP内に畳み込み層を構築し,それをFCにマージして推論を行う。
従来のCNNにRepMLPを挿入することで、ImageNetでは1.8%の精度、顔認識では2.9%、FLOPの低いCityscapeでは2.3%のmIoUを改善します。
論文 参考訳(メタデータ) (2021-05-05T06:17:40Z) - Regularized Densely-connected Pyramid Network for Salient Instance
Segmentation [73.17802158095813]
我々は、エンドツーエンドの有能なインスタンスセグメンテーション(SIS)のための新しいパイプラインを提案する。
ディープネットワークにおけるリッチな特徴階層をよりよく活用するために、正規化された高密度接続を提案する。
マスク予測を改善するために,新しいマルチレベルRoIAlignベースのデコーダを導入し,多レベル特徴を適応的に集約する。
論文 参考訳(メタデータ) (2020-08-28T00:13:30Z) - ResFPN: Residual Skip Connections in Multi-Resolution Feature Pyramid
Networks for Accurate Dense Pixel Matching [10.303618438296981]
特徴ピラミッドネットワーク(FPN)は,CNNに基づく密マッチングタスクに適した特徴抽出器であることが証明されている。
複数の残差スキップ接続を有する多分解能特徴ピラミッドネットワークであるResFPNを提案する。
アブレーション実験では,FPNよりも明らかに高い精度で新しいアーキテクチャの有効性を実証した。
論文 参考訳(メタデータ) (2020-06-22T13:31:31Z) - Dense Residual Network: Enhancing Global Dense Feature Flow for
Character Recognition [75.4027660840568]
本稿では,すべての畳み込み層から階層的特徴をフルに活用することにより,局所的・大域的特徴フローを改善する方法について検討する。
技術的には、テキスト認識のための効率的で効果的なCNNフレームワークであるFDRN(Fast Dense Residual Network)を提案する。
論文 参考訳(メタデータ) (2020-01-23T06:55:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。