論文の概要: GraphFPN: Graph Feature Pyramid Network for Object Detection
- arxiv url: http://arxiv.org/abs/2108.00580v1
- Date: Mon, 2 Aug 2021 01:19:38 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-03 15:17:34.114171
- Title: GraphFPN: Graph Feature Pyramid Network for Object Detection
- Title(参考訳): GraphFPN:オブジェクト検出のためのグラフ特徴ピラミッドネットワーク
- Authors: Gangming Zhao, Weifeng Ge, and Yizhou Yu
- Abstract要約: 本稿では,そのトポロジ構造を固有画像構造に適応させることのできるグラフ特徴ピラミッドネットワークを提案する。
提案したグラフ特徴ピラミッドネットワークは,畳み込み特徴ピラミッドネットワークからマルチスケール特徴を拡張できる。
我々は、オブジェクト検出タスクにおいて、より高速なR-CNNアルゴリズムに統合することで、グラフ特徴ピラミッドネットワークを評価する。
- 参考スコア(独自算出の注目度): 44.481481251032264
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Feature pyramids have been proven powerful in image understanding tasks that
require multi-scale features. State-of-the-art methods for multi-scale feature
learning focus on performing feature interactions across space and scales using
neural networks with a fixed topology. In this paper, we propose graph feature
pyramid networks that are capable of adapting their topological structures to
varying intrinsic image structures and supporting simultaneous feature
interactions across all scales. We first define an image-specific superpixel
hierarchy for each input image to represent its intrinsic image structures. The
graph feature pyramid network inherits its structure from this superpixel
hierarchy. Contextual and hierarchical layers are designed to achieve feature
interactions within the same scale and across different scales. To make these
layers more powerful, we introduce two types of local channel attention for
graph neural networks by generalizing global channel attention for
convolutional neural networks. The proposed graph feature pyramid network can
enhance the multiscale features from a convolutional feature pyramid network.
We evaluate our graph feature pyramid network in the object detection task by
integrating it into the Faster R-CNN algorithm. The modified algorithm
outperforms not only previous state-of-the-art feature pyramid-based methods
with a clear margin but also other popular detection methods on both MS-COCO
2017 validation and test datasets.
- Abstract(参考訳): 機能ピラミッドは、マルチスケール機能を必要とする画像理解タスクにおいて強力であることが証明されている。
マルチスケール機能学習のための最先端手法は、固定トポロジを持つニューラルネットワークを用いた空間とスケール間の機能インタラクションの実行に重点を置いている。
本稿では,そのトポロジ構造を固有の画像構造に適応させ,全てのスケールで同時特徴相互作用をサポートするグラフ特徴ピラミッドネットワークを提案する。
まず、各入力画像に対して画像固有のスーパーピクセル階層を定義し、その固有画像構造を表現する。
グラフ特徴ピラミッドネットワークは、このスーパーピクセル階層からその構造を継承する。
コンテキスト層と階層層は同じスケールで異なるスケールで機能インタラクションを実現するように設計されている。
これらの層をより強力にするため,畳み込みニューラルネットワークのグローバルチャネルアテンションを一般化することにより,グラフニューラルネットワークに2種類の局所チャネルアテンションを導入する。
提案したグラフ特徴ピラミッドネットワークは,畳み込み特徴ピラミッドネットワークからマルチスケール特徴を拡張できる。
我々は、オブジェクト検出タスクにおいて、より高速なR-CNNアルゴリズムに統合することで、グラフ特徴ピラミッドネットワークを評価する。
修正アルゴリズムは、明確なマージンを持つ以前の最先端の機能ピラミッドベースメソッドだけでなく、ms-coco 2017バリデーションとテストデータセットの両方で一般的な検出方法よりも優れています。
関連論文リスト
- Learning a Graph Neural Network with Cross Modality Interaction for
Image Fusion [23.296468921842948]
近赤外・可視画像融合は、多モードイメージング技術の分野において、徐々に重要なフォークであることが証明されている。
本稿では,IGNetと呼ばれる,核融合のためのクロスモーダル間の対話型グラフニューラルネットワーク(GNN)アーキテクチャを提案する。
我々のIGNetは、平均2.59%のmAP@.5と7.77%のmIoUを検出およびセグメンテーションで、視覚的に魅力的な融合画像を生成することができる。
論文 参考訳(メタデータ) (2023-08-07T02:25:06Z) - How GNNs Facilitate CNNs in Mining Geometric Information from
Large-Scale Medical Images [2.2699159408903484]
畳み込みニューラルネットワーク(CNN)が捉えたグローバルな画像レベルの表現を強化するための融合フレームワークを提案する。
大腸癌と胃癌の大規模なコホートから得られた組織学的データセットの融合戦略について検討した。
論文 参考訳(メタデータ) (2022-06-15T15:27:48Z) - Two-Stream Graph Convolutional Network for Intra-oral Scanner Image
Segmentation [133.02190910009384]
本稿では,2ストリームグラフ畳み込みネットワーク(TSGCN)を提案する。
TSGCNは3次元歯(表面)セグメンテーションにおいて最先端の方法よりも優れています。
論文 参考訳(メタデータ) (2022-04-19T10:41:09Z) - Learning Hierarchical Graph Representation for Image Manipulation
Detection [50.04902159383709]
画像操作検出の目的は、画像内の操作された領域を特定し、特定することである。
最近のアプローチでは、画像に残っている改ざんするアーティファクトをキャプチャするために、洗練された畳み込みニューラルネットワーク(CNN)が採用されている。
本稿では2つの並列分岐からなる階層型グラフ畳み込みネットワーク(HGCN-Net)を提案する。
論文 参考訳(メタデータ) (2022-01-15T01:54:25Z) - Dist2Cycle: A Simplicial Neural Network for Homology Localization [66.15805004725809]
単純複体は多方向順序関係を明示的にエンコードするグラフの高次元一般化と見なすことができる。
単体錯体の$k$-homological特徴によってパラメータ化された関数のグラフ畳み込みモデルを提案する。
論文 参考訳(メタデータ) (2021-10-28T14:59:41Z) - Spatio-Temporal Inception Graph Convolutional Networks for
Skeleton-Based Action Recognition [126.51241919472356]
我々はスケルトンに基づく行動認識のためのシンプルで高度にモジュール化されたグラフ畳み込みネットワークアーキテクチャを設計する。
ネットワークは,空間的および時間的経路から多粒度情報を集約するビルディングブロックを繰り返すことで構築される。
論文 参考訳(メタデータ) (2020-11-26T14:43:04Z) - PNEN: Pyramid Non-Local Enhanced Networks [23.17149002568982]
我々は,各画素間の接続を構築するために,新しい非局所モジュールであるピラミッド非局所ブロックを提案する。
提案したモジュールに基づいて,エッジ保存画像平滑化のためのピラミッド非局所拡張ネットワークを考案する。
超解像法と超解像法という2つの既存手法に統合し,一貫した性能向上を実現した。
論文 参考訳(メタデータ) (2020-08-22T03:10:48Z) - Cross-layer Feature Pyramid Network for Salient Object Detection [102.20031050972429]
本稿では,有能な物体検出における進行的融合を改善するために,新しいクロス層特徴ピラミッドネットワークを提案する。
レイヤごとの分散機能は、他のすべてのレイヤからセマンティクスと健全な詳細の両方を同時に所有し、重要な情報の損失を減らします。
論文 参考訳(メタデータ) (2020-02-25T14:06:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。