論文の概要: IterDet: Iterative Scheme for Object Detection in Crowded Environments
- arxiv url: http://arxiv.org/abs/2005.05708v2
- Date: Fri, 29 Jan 2021 07:26:14 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-03 19:17:17.146400
- Title: IterDet: Iterative Scheme for Object Detection in Crowded Environments
- Title(参考訳): IterDet: クラウド環境におけるオブジェクト検出の反復的スキーム
- Authors: Danila Rukhovich, Konstantin Sofiiuk, Danil Galeev, Olga Barinova,
Anton Konushin
- Abstract要約: ディープラーニングベースの検出器は通常、冗長なオブジェクト境界ボックスを生成する。
これらのボックスは、興味のある対象ごとに正確に1つのバウンディングボックスを選択するために、NMS(Non-maximum suppress)を使用してフィルタリングされる。
この欲求スキームは単純で、孤立したオブジェクトに対して十分な精度を提供するが、しばしば混み合った環境で失敗する。
本研究では、各イテレーションで新しいオブジェクトのサブセットを検出する、代替的な反復スキームを開発する。
- 参考スコア(独自算出の注目度): 6.2997667081978825
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep learning-based detectors usually produce a redundant set of object
bounding boxes including many duplicate detections of the same object. These
boxes are then filtered using non-maximum suppression (NMS) in order to select
exactly one bounding box per object of interest. This greedy scheme is simple
and provides sufficient accuracy for isolated objects but often fails in
crowded environments, since one needs to both preserve boxes for different
objects and suppress duplicate detections. In this work we develop an
alternative iterative scheme, where a new subset of objects is detected at each
iteration. Detected boxes from the previous iterations are passed to the
network at the following iterations to ensure that the same object would not be
detected twice. This iterative scheme can be applied to both one-stage and
two-stage object detectors with just minor modifications of the training and
inference procedures. We perform extensive experiments with two different
baseline detectors on four datasets and show significant improvement over the
baseline, leading to state-of-the-art performance on CrowdHuman and WiderPerson
datasets. The source code and the trained models are available at
https://github.com/saic-vul/iterdet.
- Abstract(参考訳): ディープラーニングベースの検出器は通常、同じオブジェクトの重複検出を含む冗長なオブジェクトバウンディングボックスを生成する。
これらのボックスは、興味のある対象ごとに正確に1つのバウンディングボックスを選択するために、非最大抑圧(NMS)を使用してフィルタリングされる。
このグレディスキームは単純で、孤立したオブジェクトに対して十分な精度を提供するが、異なるオブジェクトのボックスを保存し、重複検出を抑える必要があるため、しばしば混み合った環境で失敗する。
この作業では、オブジェクトの新たなサブセットを各イテレーションで検出する、別の反復スキームを開発します。
前のイテレーションから検出されたボックスは、次のイテレーションでネットワークに渡され、同じオブジェクトが2回検出されないようにする。
この反復的なスキームは、1段階と2段階の物体検出器の両方に適用でき、訓練と推論の手順を少し修正するだけでよい。
4つのデータセットで2つの異なるベースライン検出器を用いて広範囲な実験を行い、ベースラインに対して大幅な改善を示し、人的およびより広い人的データセットにおける最先端のパフォーマンスをもたらす。
ソースコードとトレーニングされたモデルはhttps://github.com/saic-vul/iterdetで入手できる。
関連論文リスト
- Exploiting Unlabeled Data with Multiple Expert Teachers for Open Vocabulary Aerial Object Detection and Its Orientation Adaptation [58.37525311718006]
OVAD(Open-vocabulary Aero Object Detection)という,航空物体検出問題の新しい定式化を行った。
本稿では,CLIP-activated students-Teacher DetectionフレームワークであるCastDetを提案する。
本フレームワークは,ロバストなローカライズ教師といくつかのボックス選択戦略を統合し,新しいオブジェクトの高品質な提案を生成する。
論文 参考訳(メタデータ) (2024-11-04T12:59:13Z) - Bayesian Detector Combination for Object Detection with Crowdsourced Annotations [49.43709660948812]
制約のない画像できめ細かなオブジェクト検出アノテーションを取得するのは、時間がかかり、コストがかかり、ノイズに悩まされる。
ノイズの多いクラウドソースアノテーションでオブジェクト検出をより効果的に訓練するための新しいベイズ検出結合(BDC)フレームワークを提案する。
BDCはモデルに依存しず、アノテータのスキルレベルに関する事前の知識を必要とせず、既存のオブジェクト検出モデルとシームレスに統合される。
論文 参考訳(メタデータ) (2024-07-10T18:00:54Z) - Object-Centric Multiple Object Tracking [124.30650395969126]
本稿では,多目的追跡パイプラインのためのビデオオブジェクト中心モデルを提案する。
オブジェクト中心のスロットを検出出力に適応するインデックスマージモジュールと、オブジェクトメモリモジュールで構成される。
オブジェクト中心学習に特化して、オブジェクトのローカライゼーションと機能バインディングのためのスパース検出ラベルしか必要としない。
論文 参考訳(メタデータ) (2023-09-01T03:34:12Z) - Linear Object Detection in Document Images using Multiple Object
Tracking [58.720142291102135]
線形オブジェクトは文書構造に関する実質的な情報を伝達する。
多くのアプローチはベクトル表現を復元できるが、1994年に導入された1つのクローズドソース技術のみである。
複数オブジェクト追跡を用いた文書画像中の線形オブジェクトの正確なインスタンスセグメンテーションのためのフレームワークを提案する。
論文 参考訳(メタデータ) (2023-05-26T14:22:03Z) - Real-time Multi-Object Tracking Based on Bi-directional Matching [0.0]
本研究では,多目的追跡のための双方向マッチングアルゴリズムを提案する。
ストランド領域はマッチングアルゴリズムで使われ、追跡できないオブジェクトを一時的に保存する。
MOT17チャレンジでは、提案アルゴリズムは63.4%のMOTA、55.3%のIDF1、20.1のFPS追跡速度を達成した。
論文 参考訳(メタデータ) (2023-03-15T08:38:08Z) - CASAPose: Class-Adaptive and Semantic-Aware Multi-Object Pose Estimation [2.861848675707602]
CASAPoseと呼ばれる新しい単一ステージアーキテクチャを提案する。
RGB画像中の複数の異なるオブジェクトのポーズ推定のための2D-3D対応を1パスで決定する。
高速でメモリ効率が高く、複数のオブジェクトに対して高い精度を実現する。
論文 参考訳(メタデータ) (2022-10-11T10:20:01Z) - W2N:Switching From Weak Supervision to Noisy Supervision for Object
Detection [64.10643170523414]
弱い監督からうるさい監督(W2N)に切り替える新しいパラダイムを持つ新しいWSODフレームワークを提案する。
ローカライズ適応モジュールでは、元の擬似接地構造における識別部分の割合を減らすために正規化損失を提案する。
我々のW2Nは、既存の純粋なWSODメソッドや転送学習メソッドよりも優れています。
論文 参考訳(メタデータ) (2022-07-25T12:13:48Z) - Few-shot Object Counting and Detection [25.61294147822642]
我々は、ターゲットオブジェクトクラスのいくつかの例のバウンディングボックスを考慮に入れ、ターゲットクラスのすべてのオブジェクトをカウントし、検出する新しいタスクに取り組む。
このタスクは、数ショットのオブジェクトカウントと同じ監督を共有しますが、オブジェクトのバウンディングボックスと総オブジェクトカウントを出力します。
本稿では,新しい2段階トレーニング戦略と,新しい不確実性に留意した小ショットオブジェクト検出器であるCounting-DETRを紹介する。
論文 参考訳(メタデータ) (2022-07-22T10:09:18Z) - Multi-Grid Redundant Bounding Box Annotation for Accurate Object
Detection [0.0]
YOLOv3は、入力画像を取り込み、それを同じ大きさのグリッドマトリックスに分割する最先端のワンショット検出器である。
本稿では,オブジェクト毎に複数のグリッドを割り当て,厳密な境界ボックス予測を行う数学的手法を提案する。
論文 参考訳(メタデータ) (2022-01-05T23:01:55Z) - Decoupled Adaptation for Cross-Domain Object Detection [69.5852335091519]
クロスドメインオブジェクト検出は、オブジェクト分類よりも難しい。
D-adaptは4つのクロスドメインオブジェクト検出タスクで最先端の結果を達成する。
論文 参考訳(メタデータ) (2021-10-06T08:43:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。