論文の概要: Adaptive Graph Convolution Module for Salient Object Detection
- arxiv url: http://arxiv.org/abs/2303.09801v1
- Date: Fri, 17 Mar 2023 07:07:17 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-20 15:20:57.708207
- Title: Adaptive Graph Convolution Module for Salient Object Detection
- Title(参考訳): 高度物体検出のための適応グラフ畳み込みモジュール
- Authors: Yongwoo Lee, Minhyeok Lee, Suhwan Cho, Sangyoun Lee
- Abstract要約: 本稿では,複雑なシーンを扱うための適応型グラフ畳み込みモジュール(AGCM)を提案する。
学習可能な領域生成層を用いて入力画像からプロトタイプ特徴を抽出する。
提案したAGCMは,SOD性能を定量的かつ定量的に劇的に向上させる。
- 参考スコア(独自算出の注目度): 7.278033100480174
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Salient object detection (SOD) is a task that involves identifying and
segmenting the most visually prominent object in an image. Existing solutions
can accomplish this use a multi-scale feature fusion mechanism to detect the
global context of an image. However, as there is no consideration of the
structures in the image nor the relations between distant pixels, conventional
methods cannot deal with complex scenes effectively. In this paper, we propose
an adaptive graph convolution module (AGCM) to overcome these limitations.
Prototype features are initially extracted from the input image using a
learnable region generation layer that spatially groups features in the image.
The prototype features are then refined by propagating information between them
based on a graph architecture, where each feature is regarded as a node.
Experimental results show that the proposed AGCM dramatically improves the SOD
performance both quantitatively and quantitatively.
- Abstract(参考訳): サリアントオブジェクト検出(Salient Object Detection、SOD)は、画像中の最も目立った物体を識別し、セグメント化するタスクである。
既存のソリューションでは、イメージのグローバルコンテキストを検出するために、マルチスケールの機能融合メカニズムを使用することができる。
しかし、画像の構造や遠方の画素間の関係は考慮されていないため、従来の方法では複雑なシーンを効果的に扱うことはできない。
本稿では,これらの制約を克服するための適応グラフ畳み込みモジュール(AGCM)を提案する。
まず、画像中の特徴を空間的にグループ化する学習可能な領域生成層を用いて、入力画像からプロトタイプ特徴を抽出する。
プロトタイプ機能は、各機能をノードと見なすグラフアーキテクチャに基づいて、それら間で情報を伝達することによって洗練される。
実験の結果,AGCMはSODの性能を定量的かつ定量的に劇的に改善することがわかった。
関連論文リスト
- Rotated Multi-Scale Interaction Network for Referring Remote Sensing Image Segmentation [63.15257949821558]
Referring Remote Sensing Image (RRSIS)は、コンピュータビジョンと自然言語処理を組み合わせた新しい課題である。
従来の参照画像(RIS)アプローチは、空中画像に見られる複雑な空間スケールと向きによって妨げられている。
本稿ではRMSIN(Rotated Multi-Scale Interaction Network)を紹介する。
論文 参考訳(メタデータ) (2023-12-19T08:14:14Z) - Hi-ResNet: A High-Resolution Remote Sensing Network for Semantic
Segmentation [7.216053041550996]
高分解能リモートセンシング(HRS)セマンティックセマンティクスは、高分解能カバレッジ領域からキーオブジェクトを抽出する。
HRS画像内の同じカテゴリのオブジェクトは、多様な地理的環境におけるスケールと形状の顕著な違いを示す。
効率的なネットワーク構造を持つ高分解能リモートセンシングネットワーク(Hi-ResNet)を提案する。
論文 参考訳(メタデータ) (2023-05-22T03:58:25Z) - Adaptive Rotated Convolution for Rotated Object Detection [96.94590550217718]
本稿では、回転物体検出問題に対処するために、適応回転変換(ARC)モジュールを提案する。
ARCモジュールでは、コンボリューションカーネルが適応的に回転し、異なる画像に異なる向きのオブジェクト特徴を抽出する。
提案手法は,81.77%mAPのDOTAデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2023-03-14T11:53:12Z) - Joint Learning of Deep Texture and High-Frequency Features for
Computer-Generated Image Detection [24.098604827919203]
本稿では,CG画像検出のための深いテクスチャと高周波特徴を有する共同学習戦略を提案する。
セマンティックセグメンテーションマップを生成して、アフィン変換操作を誘導する。
原画像と原画像の高周波成分の組み合わせを、注意機構を備えたマルチブランチニューラルネットワークに供給する。
論文 参考訳(メタデータ) (2022-09-07T17:30:40Z) - Occlusion-Aware Instance Segmentation via BiLayer Network Architectures [73.45922226843435]
本稿では,2層畳み込みネットワーク(BCNet)を提案する。このネットワークでは,トップ層がオブジェクト(オブオーバ)を検出し,ボトム層が部分的にオブオーバドされたインスタンス(オブオーバド)を推測する。
一般的な畳み込みネットワーク設計,すなわちFCN(Fully Convolutional Network)とGCN(Graph Convolutional Network)を用いた2層構造の有効性について検討する。
論文 参考訳(メタデータ) (2022-08-08T21:39:26Z) - Semantic Labeling of High Resolution Images Using EfficientUNets and
Transformers [5.177947445379688]
畳み込みニューラルネットワークとディープトランスを組み合わせた新しいセグメンテーションモデルを提案する。
提案手法は,最先端技術と比較してセグメント化精度が向上することを示す。
論文 参考訳(メタデータ) (2022-06-20T12:03:54Z) - Learning Hierarchical Graph Representation for Image Manipulation
Detection [50.04902159383709]
画像操作検出の目的は、画像内の操作された領域を特定し、特定することである。
最近のアプローチでは、画像に残っている改ざんするアーティファクトをキャプチャするために、洗練された畳み込みニューラルネットワーク(CNN)が採用されている。
本稿では2つの並列分岐からなる階層型グラフ畳み込みネットワーク(HGCN-Net)を提案する。
論文 参考訳(メタデータ) (2022-01-15T01:54:25Z) - PnP-DETR: Towards Efficient Visual Analysis with Transformers [146.55679348493587]
近年、DeTRはトランスフォーマーを用いたソリューションビジョンタスクの先駆者であり、画像特徴マップを直接オブジェクト結果に変換する。
最近の変圧器を用いた画像認識モデルとTTは、一貫した効率向上を示す。
論文 参考訳(メタデータ) (2021-09-15T01:10:30Z) - Prior-Induced Information Alignment for Image Matting [28.90998570043986]
我々は、PIIAMatting(Presideed-induced Information Alignment Matting Network)という新しいネットワークを提案する。
ピクセルワイズ対応マップの区別と層ワイズ特徴マップの相関を効率的にモデル化することができる。
PIIAMattingはAlphamatting.com, composition-1K, Distinctions-646データセットの最先端の画像マッチング手法に対して好意的に機能する。
論文 参考訳(メタデータ) (2021-06-28T07:46:59Z) - High-Order Information Matters: Learning Relation and Topology for
Occluded Person Re-Identification [84.43394420267794]
本稿では,高次関係とトポロジ情報を識別的特徴とロバストなアライメントのために学習し,新しい枠組みを提案する。
我々のフレームワークはOccluded-Dukeデータセットで最先端の6.5%mAPスコアを大幅に上回っている。
論文 参考訳(メタデータ) (2020-03-18T12:18:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。