論文の概要: A Tri-Layer Plugin to Improve Occluded Detection
- arxiv url: http://arxiv.org/abs/2210.10046v1
- Date: Tue, 18 Oct 2022 17:59:51 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-19 15:14:42.056675
- Title: A Tri-Layer Plugin to Improve Occluded Detection
- Title(参考訳): 集積検出を改善する三層プラグイン
- Authors: Guanqi Zhan, Weidi Xie, Andrew Zisserman
- Abstract要約: 本研究では,2段階物体検出装置の頭部検出のための単純な''モジュールを提案し,部分閉塞物体のリコールを改善する。
モジュールは、ターゲットオブジェクト、オクルーダー、オクラデーのセグメンテーションマスクの三層を予測し、それによってターゲットオブジェクトのマスクをより正確に予測することができる。
また,COCO評価データセットを構築し,部分閉塞オブジェクトと分離オブジェクトのリコール性能を測定した。
- 参考スコア(独自算出の注目度): 100.99802831241583
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Detecting occluded objects still remains a challenge for state-of-the-art
object detectors. The objective of this work is to improve the detection for
such objects, and thereby improve the overall performance of a modern object
detector.
To this end we make the following four contributions: (1) We propose a simple
'plugin' module for the detection head of two-stage object detectors to improve
the recall of partially occluded objects. The module predicts a tri-layer of
segmentation masks for the target object, the occluder and the occludee, and by
doing so is able to better predict the mask of the target object. (2) We
propose a scalable pipeline for generating training data for the module by
using amodal completion of existing object detection and instance segmentation
training datasets to establish occlusion relationships. (3) We also establish a
COCO evaluation dataset to measure the recall performance of partially occluded
and separated objects. (4) We show that the plugin module inserted into a
two-stage detector can boost the performance significantly, by only fine-tuning
the detection head, and with additional improvements if the entire architecture
is fine-tuned. COCO results are reported for Mask R-CNN with Swin-T or Swin-S
backbones, and Cascade Mask R-CNN with a Swin-B backbone.
- Abstract(参考訳): 隠された物体を検出することは、まだ最先端の物体検出器にとって難しい課題である。
本研究の目的は、そのような物体の検出を改善し、近代的な物体検出器の全体的な性能を向上させることである。
この目的のために,(1) 部分閉塞物体のリコールを改善するため, 2段物体検出器の頭部検出のための単純な「プラグイン」モジュールを提案する。
モジュールは、ターゲットオブジェクト、オクルーダー、オクラデーのセグメンテーションマスクの三層を予測し、それによってターゲットオブジェクトのマスクをより正確に予測することができる。
2)既存のオブジェクト検出とインスタンスセグメンテーショントレーニングデータセットのアモーダル補完を用いて,モジュールのトレーニングデータを生成するスケーラブルなパイプラインを提案し,オクルージョン関係を確立する。
3) また, 部分オクルードおよび分離オブジェクトのリコール性能を測定するためのcoco評価データセットを構築した。
(4)2段検出器に挿入されたプラグインモジュールは,検出ヘッドを微調整するだけで性能を大幅に向上でき,アーキテクチャ全体を微調整すればさらに改善できることを示す。
COCOは、Swin-TまたはSwin-Sのバックボーンを持つMask R-CNNと、Swin-Bのバックボーンを持つCascade Mask R-CNNに対して報告されている。
関連論文リスト
- Sparse Semi-DETR: Sparse Learnable Queries for Semi-Supervised Object Detection [12.417754433715903]
Sparse Semi-DETRは、トランスフォーマーをベースとした、エンドツーエンドの半教師付きオブジェクト検出ソリューションである。
Sparse Semi-DETR には Query Refinement Module が組み込まれており、オブジェクトクエリの品質を高め、小型で部分的に隠されたオブジェクトの検出能力を著しく改善している。
MS-COCOおよびPascal VOCオブジェクト検出ベンチマークでは、Sparse Semi-DETRは現在の最先端手法よりも大幅に改善されている。
論文 参考訳(メタデータ) (2024-04-02T10:22:23Z) - SeMoLi: What Moves Together Belongs Together [51.72754014130369]
動作手がかりに基づく半教師付き物体検出に挑戦する。
近年,移動物体の擬似ラベルインスタンスに対して,動きに基づくクラスタリング手法が適用可能であることが示唆された。
我々は、このアプローチを再考し、オブジェクト検出とモーションインスパイアされた擬似ラベルの両方が、データ駆動方式で取り組めることを示唆する。
論文 参考訳(メタデータ) (2024-02-29T18:54:53Z) - Object-Centric Multiple Object Tracking [124.30650395969126]
本稿では,多目的追跡パイプラインのためのビデオオブジェクト中心モデルを提案する。
オブジェクト中心のスロットを検出出力に適応するインデックスマージモジュールと、オブジェクトメモリモジュールで構成される。
オブジェクト中心学習に特化して、オブジェクトのローカライゼーションと機能バインディングのためのスパース検出ラベルしか必要としない。
論文 参考訳(メタデータ) (2023-09-01T03:34:12Z) - SSC3OD: Sparsely Supervised Collaborative 3D Object Detection from LiDAR
Point Clouds [16.612824810651897]
疎密な協調3Dオブジェクト検出フレームワークSSC3ODを提案する。
各エージェントは、シーン内の1つのオブジェクトをランダムにラベルするだけです。
疎調整された3Dオブジェクト検出器の性能を効果的に向上させることができる。
論文 参考訳(メタデータ) (2023-07-03T02:42:14Z) - 3DMODT: Attention-Guided Affinities for Joint Detection & Tracking in 3D
Point Clouds [95.54285993019843]
本稿では,3次元点雲における複数物体の同時検出と追跡手法を提案する。
本モデルでは,複数のフレームを用いた時間情報を利用してオブジェクトを検出し,一つのネットワーク上で追跡する。
論文 参考訳(メタデータ) (2022-11-01T20:59:38Z) - VIN: Voxel-based Implicit Network for Joint 3D Object Detection and
Segmentation for Lidars [12.343333815270402]
統合ニューラルネットワーク構造は、ジョイント3Dオブジェクト検出とポイントクラウドセグメンテーションのために提示される。
私たちは、検出ラベルとセグメンテーションラベルの両方からの豊富な監視を活用しています。
論文 参考訳(メタデータ) (2021-07-07T02:16:20Z) - Robust and Accurate Object Detection via Adversarial Learning [111.36192453882195]
この研究は、逆の例を探索することで、物体検出器の微調整段階を補強する。
提案手法は,オブジェクト検出ベンチマークにおいて,最先端のEfficientDetsの性能を+1.1mAP向上させる。
論文 参考訳(メタデータ) (2021-03-23T19:45:26Z) - Transformer-Encoder Detector Module: Using Context to Improve Robustness
to Adversarial Attacks on Object Detection [12.521662223741673]
本稿では、オブジェクトインスタンスのラベル付けを改善するために、オブジェクト検出器に適用可能な新しいコンテキストモジュールを提案する。
提案モデルは,ベースラインのFaster-RCNN検出器と比較して,mAP,F1スコア,AUC平均スコアを最大13%向上させる。
論文 参考訳(メタデータ) (2020-11-13T15:52:53Z) - Attention-based Joint Detection of Object and Semantic Part [4.389917490809522]
我々のモデルは2つのFaster-RCNNモデルに基づいて作成され、それらの特徴を共有して両方の表現を拡張します。
PASCAL-Part 2010データセットの実験では、関節検出は物体検出と部分検出の両方を同時に改善できることが示された。
論文 参考訳(メタデータ) (2020-07-05T18:54:10Z) - EHSOD: CAM-Guided End-to-end Hybrid-Supervised Object Detection with
Cascade Refinement [53.69674636044927]
本稿では,エンド・ツー・エンドのハイブリッド型オブジェクト検出システムであるEHSODについて述べる。
完全なアノテートと弱いアノテートの両方で、ワンショットでトレーニングすることができる。
完全なアノテートされたデータの30%しか持たない複数のオブジェクト検出ベンチマークで、同等の結果が得られる。
論文 参考訳(メタデータ) (2020-02-18T08:04:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。