論文の概要: ResFPN: Residual Skip Connections in Multi-Resolution Feature Pyramid
Networks for Accurate Dense Pixel Matching
- arxiv url: http://arxiv.org/abs/2006.12235v1
- Date: Mon, 22 Jun 2020 13:31:31 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-18 06:22:35.762477
- Title: ResFPN: Residual Skip Connections in Multi-Resolution Feature Pyramid
Networks for Accurate Dense Pixel Matching
- Title(参考訳): ResFPN:高精度画素マッチングのための多解特徴ピラミッドネットワークにおける残留スキップ接続
- Authors: Rishav, Ren\'e Schuster, Ramy Battrawy, Oliver Wasenm\"uller, Didier
Stricker
- Abstract要約: 特徴ピラミッドネットワーク(FPN)は,CNNに基づく密マッチングタスクに適した特徴抽出器であることが証明されている。
複数の残差スキップ接続を有する多分解能特徴ピラミッドネットワークであるResFPNを提案する。
アブレーション実験では,FPNよりも明らかに高い精度で新しいアーキテクチャの有効性を実証した。
- 参考スコア(独自算出の注目度): 10.303618438296981
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Dense pixel matching is required for many computer vision algorithms such as
disparity, optical flow or scene flow estimation. Feature Pyramid Networks
(FPN) have proven to be a suitable feature extractor for CNN-based dense
matching tasks. FPN generates well localized and semantically strong features
at multiple scales. However, the generic FPN is not utilizing its full
potential, due to its reasonable but limited localization accuracy. Thus, we
present ResFPN -- a multi-resolution feature pyramid network with multiple
residual skip connections, where at any scale, we leverage the information from
higher resolution maps for stronger and better localized features. In our
ablation study, we demonstrate the effectiveness of our novel architecture with
clearly higher accuracy than FPN. In addition, we verify the superior accuracy
of ResFPN in many different pixel matching applications on established datasets
like KITTI, Sintel, and FlyingThings3D.
- Abstract(参考訳): 距離画素マッチングは、不均一性、光フロー、シーンフロー推定などの多くのコンピュータビジョンアルゴリズムに必要である。
特徴ピラミッドネットワーク(FPN)は,CNNに基づく密マッチングタスクに適した特徴抽出器であることが証明されている。
FPNは局所的で意味的に強い特徴を複数スケールで生成する。
しかし、一般的なFPNはその正当性はあるが局所化の精度が限られているため、その完全なポテンシャルを生かしていない。
そこで我々はResFPN(ResFPN)を提案する。ResFPN(ResFPN)は複数の残差スキップ接続を持つマルチレゾリューション機能ピラミッドネットワークで、任意のスケールで高解像度マップからの情報を活用して、より強く、より優れたローカライズド機能を実現する。
アブレーション研究において,我々はfpnよりも明らかに高い精度で新しいアーキテクチャの有効性を示す。
さらに、KITTI、Sintel、FlyingThings3Dといった確立したデータセット上で、多くの異なる画素マッチングアプリケーションにおけるResFPNの優れた精度を検証する。
関連論文リスト
- Learning Unified Representations for Multi-Resolution Face Recognition [0.7378853859331619]
Branch-to-Trunk Network (BTNet) はマルチ解像度顔認識のための表現学習手法である。
本実験は,マルチレゾリューション・アイデンティティマッチングと特徴集約の両面において,顔認識ベンチマークにおいて高い性能を示す。
論文 参考訳(メタデータ) (2023-10-14T11:26:43Z) - MultiRes-NetVLAD: Augmenting Place Recognition Training with
Low-Resolution Imagery [28.875236694573815]
我々は低解像度画像ピラミッド符号化によるNetVLAD表現学習を強化した。
結果として得られる多重解像度特徴ピラミッドは、VLADを介して1つのコンパクト表現に便利に集約することができる。
基礎となる学習機能テンソルと既存のマルチスケールアプローチを組み合わせることで,ベースライン性能を向上させることができることを示す。
論文 参考訳(メタデータ) (2022-02-18T11:53:01Z) - Trident Pyramid Networks: The importance of processing at the feature
pyramid level for better object detection [50.008529403150206]
我々はTrident Pyramid Network (TPN)と呼ばれる新しいコアアーキテクチャを提案する。
TPNはより深い設計を可能にし、コミュニケーションベースの処理と自己処理のバランスを改善する。
TPNコアをオブジェクト検出ベンチマークで使用した場合,BifPNベースラインを1.5 APで上回り,一貫した改善が見られた。
論文 参考訳(メタデータ) (2021-10-08T09:59:59Z) - FaPN: Feature-aligned Pyramid Network for Dense Image Prediction [6.613724825924151]
本稿では,画素の変換オフセットから,アップサンプリング機能への変換を学習する機能アライメントモジュールを提案する。
次に、これらの2つのモジュールをトップダウンピラミッドアーキテクチャに統合し、Feature-aligned Pyramid Network (FaPN)を提示します。
特に、私たちのFaPNは Mask-Former に統合された ADE20K 上で56.7% mIoU の最先端を実現している。
論文 参考訳(メタデータ) (2021-08-16T12:52:42Z) - A^2-FPN: Attention Aggregation based Feature Pyramid Network for
Instance Segmentation [68.10621089649486]
アテンションアグリゲーションに基づく機能ピラミッドネットワーク(A2-FPN)を提案し、マルチスケール機能学習を改善します。
A2-FPNは、Cascade Mask R-CNNやHybrid Task Cascadeといった強力なベースラインに統合された場合、2.0%と1.4%のマスクAPを改善する。
論文 参考訳(メタデータ) (2021-05-07T11:51:08Z) - Implicit Feature Pyramid Network for Object Detection [22.530998243247154]
物体検出のための暗黙的特徴ピラミッドネットワーク(i-FPN)を提案する。
本稿では,深平衡モデル(DEQ)で最近導入された暗黙関数を用いてFPNの変換をモデル化する。
MSデータセットによる実験結果から,i-FPNはベースライン検出器と比較して検出性能を大幅に向上することが示された。
論文 参考訳(メタデータ) (2020-12-25T11:30:27Z) - MRDet: A Multi-Head Network for Accurate Oriented Object Detection in
Aerial Images [51.227489316673484]
水平アンカーから変換された指向性提案を生成するために、任意指向領域提案ネットワーク(AO-RPN)を提案する。
正確なバウンディングボックスを得るために,検出タスクを複数のサブタスクに分離し,マルチヘッドネットワークを提案する。
各ヘッドは、対応するタスクに最適な特徴を学習するために特別に設計されており、ネットワークがオブジェクトを正確に検出することができる。
論文 参考訳(メタデータ) (2020-12-24T06:36:48Z) - Dynamic Feature Pyramid Networks for Object Detection [40.24111664691307]
本稿では,各層に異なるカーネルサイズを持つ畳み込みフィルタを組み込んで,受容場を拡大するFPNを提案する。
計算コストの異なる複数の分岐からなる新しい動的FPN(DyFPN)を提案する。
ベンチマーク実験により,提案したDyFPNは計算資源の最適割り当てにより性能を著しく向上することが示された。
論文 参考訳(メタデータ) (2020-12-01T19:03:55Z) - Learning Deep Interleaved Networks with Asymmetric Co-Attention for
Image Restoration [65.11022516031463]
本稿では,高品質(本社)画像再構成のために,異なる状態の情報をどのように組み合わせるべきかを学習するディープインターリーブドネットワーク(DIN)を提案する。
本稿では,各インターリーブノードにアタッチメントされた非対称なコアテンション(AsyCA)を提案し,その特性依存性をモデル化する。
提案したDINはエンドツーエンドで訓練でき、様々な画像復元タスクに適用できる。
論文 参考訳(メタデータ) (2020-10-29T15:32:00Z) - Temporal Pyramid Network for Action Recognition [129.12076009042622]
本稿では,2次元あるいは3次元のバックボーンネットワークに柔軟に統合可能な汎用時間ピラミッドネットワーク(TPN)を提案する。
TPNは、いくつかのアクション認識データセット上で、他の困難なベースラインよりも一貫して改善されている。
論文 参考訳(メタデータ) (2020-04-07T17:17:23Z) - Dense Residual Network: Enhancing Global Dense Feature Flow for
Character Recognition [75.4027660840568]
本稿では,すべての畳み込み層から階層的特徴をフルに活用することにより,局所的・大域的特徴フローを改善する方法について検討する。
技術的には、テキスト認識のための効率的で効果的なCNNフレームワークであるFDRN(Fast Dense Residual Network)を提案する。
論文 参考訳(メタデータ) (2020-01-23T06:55:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。