論文の概要: Addressing Multiple Salient Object Detection via Dual-Space Long-Range
Dependencies
- arxiv url: http://arxiv.org/abs/2111.03195v1
- Date: Thu, 4 Nov 2021 23:16:53 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-09 01:26:24.948236
- Title: Addressing Multiple Salient Object Detection via Dual-Space Long-Range
Dependencies
- Title(参考訳): Dual-Space Long-Range Dependencies による多値物体検出
- Authors: Bowen Deng, Andrew P. French, Michael P. Pound
- Abstract要約: 正常なオブジェクト検出は多くの下流タスクで重要な役割を果たす。
空間空間とチャネル空間の両方に非局所的特徴情報を組み込んだネットワークアーキテクチャを提案する。
複雑なシナリオであっても,本手法は複数の有能な領域を正確に特定できることを示す。
- 参考スコア(独自算出の注目度): 3.8824028205733017
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Salient object detection plays an important role in many downstream tasks.
However, complex real-world scenes with varying scales and numbers of salient
objects still pose a challenge. In this paper, we directly address the problem
of detecting multiple salient objects across complex scenes. We propose a
network architecture incorporating non-local feature information in both the
spatial and channel spaces, capturing the long-range dependencies between
separate objects. Traditional bottom-up and non-local features are combined
with edge features within a feature fusion gate that progressively refines the
salient object prediction in the decoder. We show that our approach accurately
locates multiple salient regions even in complex scenarios. To demonstrate the
efficacy of our approach to the multiple salient objects problem, we curate a
new dataset containing only multiple salient objects. Our experiments
demonstrate the proposed method presents state-of-the-art results on five
widely used datasets without any pre-processing and post-processing. We obtain
a further performance improvement against competing techniques on our
multi-objects dataset. The dataset and source code are avaliable at:
https://github.com/EricDengbowen/DSLRDNet.
- Abstract(参考訳): 正常なオブジェクト検出は多くの下流タスクで重要な役割を果たす。
しかし、様々なスケールと多くのサルエントオブジェクトを持つ複雑な現実世界のシーンは依然として課題となっている。
本稿では,複雑なシーンにまたがる複数のサルエント物体を検出する問題に直接対処する。
本研究では,空間空間とチャネル空間の両方に非局所的特徴情報を組み込んだネットワークアーキテクチャを提案する。
従来のボトムアップおよび非ローカル機能は機能融合ゲート内のエッジ機能と組み合わされ、デコーダ内の突出したオブジェクト予測を段階的に洗練する。
提案手法は,複雑なシナリオであっても,複数のサルエント領域を正確に特定できることを示す。
複数のサルエントオブジェクト問題に対するアプローチの有効性を示すために、複数のサルエントオブジェクトのみを含む新しいデータセットをキュレートした。
提案手法は,前処理や後処理を伴わない5つの広く使用されているデータセットに対して,最先端の結果を示す。
我々は、マルチオブジェクトデータセットにおける競合技術に対するさらなるパフォーマンス改善を得る。
データセットとソースコードは、 https://github.com/EricDengbowen/DSLRDNet.comで評価できる。
関連論文リスト
- Anno-incomplete Multi-dataset Detection [67.69438032767613]
我々は「不完全なマルチデータセット検出」という新しい問題を提案する。
複数の注釈付きデータセットで全ての対象カテゴリを正確に検出できるエンドツーエンドのマルチタスク学習アーキテクチャを開発した。
論文 参考訳(メタデータ) (2024-08-29T03:58:21Z) - Learning Spatial-Semantic Features for Robust Video Object Segmentation [108.045326229865]
空間意味的特徴と識別的オブジェクトクエリを備えたロバストなビデオオブジェクトセグメンテーションフレームワークを提案する。
提案手法は,複数のデータセットに対して新しい最先端性能を設定できることを示す。
論文 参考訳(メタデータ) (2024-07-10T15:36:00Z) - Contrastive Lift: 3D Object Instance Segmentation by Slow-Fast
Contrastive Fusion [110.84357383258818]
本稿では,2次元セグメントを3次元に上げ,ニューラルネットワーク表現を用いて融合させる新しい手法を提案する。
このアプローチの中核は、高速なクラスタリング目的関数であり、多数のオブジェクトを持つシーンにスケーラブルで適しています。
我々のアプローチは、ScanNet、Hypersim、Replicaのデータセットからの挑戦的なシーンにおいて、最先端の状況よりも優れています。
論文 参考訳(メタデータ) (2023-06-07T17:57:45Z) - DQnet: Cross-Model Detail Querying for Camouflaged Object Detection [54.82390534024954]
カモフラージュされた物体検出のための畳み込みニューラルネットワーク(CNN)は、完全な対象範囲を無視しながら局所的な識別領域を活性化する傾向がある。
本稿では,CNNの内在的特性から部分的活性化が引き起こされることを論じる。
完全なオブジェクト範囲を活性化できる特徴マップを得るために,クロスモデル詳細クエリネットワーク(DQnet)と呼ばれる新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2022-12-16T06:23:58Z) - Detection Hub: Unifying Object Detection Datasets via Query Adaptation
on Language Embedding [137.3719377780593]
新しいデザイン(De Detection Hubという名前)は、データセット認識とカテゴリ整列である。
データセットの不整合を緩和し、検出器が複数のデータセットをまたいで学習するための一貫性のあるガイダンスを提供する。
データセット間のカテゴリは、ワンホットなカテゴリ表現を単語埋め込みに置き換えることで、意味的に統一された空間に整列される。
論文 参考訳(メタデータ) (2022-06-07T17:59:44Z) - High-resolution Iterative Feedback Network for Camouflaged Object
Detection [128.893782016078]
カモフラージュされたオブジェクトを背景に視覚的に同化させることは、オブジェクト検出アルゴリズムにとって難しい。
エッジやバウンダリのぼやけた視界を生じさせる細部劣化を避けるために,高分解能テクスチャの詳細を抽出することを目的としている。
我々は,高解像度特徴量による低解像度表現を反復的フィードバック方式で洗練する新しいHitNetを提案する。
論文 参考訳(メタデータ) (2022-03-22T11:20:21Z) - Learning to Track Object Position through Occlusion [32.458623495840904]
オクルージョンは、物体検出器やトラッカーが直面する最も重要な課題の1つである。
本稿では,領域ベースビデオオブジェクト検出装置の成功に基づくトラッキング・バイ・検出手法を提案する。
提案手法は,インターネットから収集した家具組立ビデオのデータセットにおいて,優れた結果が得られる。
論文 参考訳(メタデータ) (2021-06-20T22:29:46Z) - Visual Object Recognition in Indoor Environments Using Topologically
Persistent Features [2.2344764434954256]
見えない屋内環境における物体認識は、移動ロボットの視覚的認識にとって難しい問題である。
本稿では,この課題に対処するために,オブジェクトの形状情報に依存するトポロジカルに永続的な特徴を用いることを提案する。
提案手法を実世界のロボットに実装し,その有用性を実証する。
論文 参考訳(メタデータ) (2020-10-07T06:04:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。