論文の概要: Democracy Does Matter: Comprehensive Feature Mining for Co-Salient
Object Detection
- arxiv url: http://arxiv.org/abs/2203.05787v1
- Date: Fri, 11 Mar 2022 08:02:20 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-14 13:06:46.053893
- Title: Democracy Does Matter: Comprehensive Feature Mining for Co-Salient
Object Detection
- Title(参考訳): 民主主義が重要:コサレントなオブジェクト検出のための包括的特徴マイニング
- Authors: Siyue Yu, Jimin Xiao, Bingfeng Zhang, Eng Gee Lim
- Abstract要約: 既存のサリエント物体を検出対象とするコサリエント物体検出が普及している。
最近の研究では、注意機構や余分な情報を使って共通のコサレントな特徴を集約している。
本稿では,民主化による包括的協調型特徴の抽出と背景干渉の低減を目的とする。
- 参考スコア(独自算出の注目度): 31.08198053527017
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Co-salient object detection, with the target of detecting co-existed salient
objects among a group of images, is gaining popularity. Recent works use the
attention mechanism or extra information to aggregate common co-salient
features, leading to incomplete even incorrect responses for target objects. In
this paper, we aim to mine comprehensive co-salient features with democracy and
reduce background interference without introducing any extra information. To
achieve this, we design a democratic prototype generation module to generate
democratic response maps, covering sufficient co-salient regions and thereby
involving more shared attributes of co-salient objects. Then a comprehensive
prototype based on the response maps can be generated as a guide for final
prediction. To suppress the noisy background information in the prototype, we
propose a self-contrastive learning module, where both positive and negative
pairs are formed without relying on additional classification information.
Besides, we also design a democratic feature enhancement module to further
strengthen the co-salient features by readjusting attention values. Extensive
experiments show that our model obtains better performance than previous
state-of-the-art methods, especially on challenging real-world cases (e.g., for
CoCA, we obtain a gain of 2.0% for MAE, 5.4% for maximum F-measure, 2.3% for
maximum E-measure, and 3.7% for S-measure) under the same settings. Code will
be released soon.
- Abstract(参考訳): 画像群間で共存している有向物体を検出することを目的とした共塩物検出が普及している。
最近の研究では、注意機構や余分な情報を使って共通のコサラレントな特徴を集約し、ターゲットオブジェクトに対する不完全な応答さえもたらしている。
本稿では,民主主義と包括的に共存する機能を発掘し,余分な情報を導入することなく背景干渉を低減することを目的とする。
これを実現するために,我々は,民主的応答マップを生成するための民主的プロトタイプ生成モジュールを設計した。
次に、応答マップに基づく包括的なプロトタイプを最終予測のガイドとして生成することができる。
プロトタイプのノイズの多い背景情報を抑えるために,追加の分類情報に頼ることなく,正と負のペアを同時に生成する自己比較学習モジュールを提案する。
また,注意値の調整による協調機能を強化するために,民主的機能拡張モジュールを設計する。
実験の結果,従来の最先端手法よりも優れた性能を示し,特に実世界の挑戦的事例(例えばCoCAでは,MAEが2.0%,最大Fが5.4%,最大Eが2.3%,Sが3.7%)を同じ条件で得られることがわかった。
コードはまもなくリリースされる。
関連論文リスト
- Efficient Feature Aggregation and Scale-Aware Regression for Monocular 3D Object Detection [40.14197775884804]
MonoASRHは、効率的なハイブリッド特徴集約モジュール(EH-FAM)と適応スケール対応3D回帰ヘッド(ASRH)で構成される新しいモノクル3D検出フレームワークである。
EH-FAMは、小規模オブジェクトのセマンティックな特徴を抽出するために、グローバルな受容領域を持つマルチヘッドアテンションを用いる。
ASRHは2次元境界ボックス次元を符号化し、EH-FAMで集約された意味的特徴とスケール特徴を融合する。
論文 参考訳(メタデータ) (2024-11-05T02:33:25Z) - Enhanced Semantic Segmentation for Large-Scale and Imbalanced Point Clouds [6.253217784798542]
小型の物体は、発生頻度が低いため、アンダーサンプリングや誤分類される傾向がある。
本稿では,大規模かつサンプル不均衡なクラウドシーンを対象としたマルチラテラルカスケーディングネットワーク(MCNet)を提案する。
論文 参考訳(メタデータ) (2024-09-21T02:23:01Z) - PoIFusion: Multi-Modal 3D Object Detection via Fusion at Points of Interest [65.48057241587398]
PoIFusionは、関心点(PoIs)におけるRGBイメージとLiDARポイントクラウドに関する情報を融合するフレームワークである。
提案手法は,各モダリティの視点を維持し,計算にやさしいプロジェクションと計算によってマルチモーダル特徴を得る。
我々はnuScenesとArgoverse2データセットについて広範囲に実験を行い、我々のアプローチを評価した。
論文 参考訳(メタデータ) (2024-03-14T09:28:12Z) - Camouflaged Object Detection via Context-aware Cross-level Fusion [10.942917945534678]
カモフラージュされた物体検出(COD)は、自然界に隠れている物体を識別することを目的としている。
本稿では,コンテキスト認識型クロスレベル統合ネットワーク(C2F-Net)を提案する。
C2F-Netは効果的なCODモデルであり、最先端(SOTA)モデルよりも優れています。
論文 参考訳(メタデータ) (2022-07-27T08:34:16Z) - EPNet++: Cascade Bi-directional Fusion for Multi-Modal 3D Object
Detection [56.03081616213012]
本稿では,新しいCasscade Bi-directional Fusion(CB-Fusion)モジュールを導入することで,マルチモーダル3Dオブジェクト検出のためのEPNet++を提案する。
提案したCB-Fusionモジュールは、カスケード双方向相互作用融合方式で画像特徴と点特徴の豊富な意味情報を高める。
KITTI、JRDB、SUN-RGBDデータセットの実験結果は、最先端の手法よりもEPNet++の方が優れていることを示している。
論文 参考訳(メタデータ) (2021-12-21T10:48:34Z) - MBDF-Net: Multi-Branch Deep Fusion Network for 3D Object Detection [17.295359521427073]
3次元物体検出のためのMulti-Branch Deep Fusion Network (MBDF-Net)を提案する。
最初の段階では、マルチブランチ機能抽出ネットワークは、Adaptive Attention Fusionモジュールを使用して、単一モーダルなセマンティックな特徴からクロスモーダルな融合機能を生成する。
第2段階では、関心領域(RoI)をプールした核融合モジュールを用いて局所的な特徴を改良する。
論文 参考訳(メタデータ) (2021-08-29T15:40:15Z) - Robust and Accurate Object Detection via Adversarial Learning [111.36192453882195]
この研究は、逆の例を探索することで、物体検出器の微調整段階を補強する。
提案手法は,オブジェクト検出ベンチマークにおいて,最先端のEfficientDetsの性能を+1.1mAP向上させる。
論文 参考訳(メタデータ) (2021-03-23T19:45:26Z) - Salient Object Detection via Integrity Learning [104.13483971954233]
整合性とは、ある有能な対象に属するすべての部分を強調する概念である。
ICON(Inteinity Cognition Network)の設計により,高感度物体検出のための整合性学習を容易にする。
ICONは3つの重要なコンポーネントを探索し、強力な整合性機能を学びます。
論文 参考訳(メタデータ) (2021-01-19T14:53:12Z) - DecAug: Augmenting HOI Detection via Decomposition [54.65572599920679]
現在のアルゴリズムでは、データセット内のトレーニングサンプルやカテゴリの不均衡が不足している。
本稿では,HOI検出のためのDECAugと呼ばれる効率的かつ効率的なデータ拡張手法を提案する。
実験の結果,V-COCOおよびHICODETデータセットの3.3mAPと1.6mAPの改善が得られた。
論文 参考訳(メタデータ) (2020-10-02T13:59:05Z) - Multi-Person Pose Estimation with Enhanced Feature Aggregation and
Selection [33.15192824888279]
複数人物のポーズ推定のためのEFASNet(Enhanced Feature Aggregation and Selection Network)を提案する。
我々の手法は、混み合った、散らばった、ぎこちないシーンをうまく扱える。
総合的な実験により、提案手法は最先端の手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2020-03-20T08:33:25Z) - EHSOD: CAM-Guided End-to-end Hybrid-Supervised Object Detection with
Cascade Refinement [53.69674636044927]
本稿では,エンド・ツー・エンドのハイブリッド型オブジェクト検出システムであるEHSODについて述べる。
完全なアノテートと弱いアノテートの両方で、ワンショットでトレーニングすることができる。
完全なアノテートされたデータの30%しか持たない複数のオブジェクト検出ベンチマークで、同等の結果が得られる。
論文 参考訳(メタデータ) (2020-02-18T08:04:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。