論文の概要: Improving Crowded Object Detection via Copy-Paste
- arxiv url: http://arxiv.org/abs/2211.12110v1
- Date: Tue, 22 Nov 2022 09:25:15 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-23 18:11:51.413466
- Title: Improving Crowded Object Detection via Copy-Paste
- Title(参考訳): コピーペーストによる群集物検出の改善
- Authors: Jiangfan Deng, Dewen Fan, Xiaosong Qiu, Feng Zhou
- Abstract要約: 類似した物体同士の重なり合いによって引き起こされる群集性は、2次元視覚的物体検出の分野においてユビキタスな課題である。
1) IoU-confidence correlation disturbances (ICD) と 2) confused de-duplication (CDD) の2つの主な効果について述べる。
- 参考スコア(独自算出の注目度): 6.941267349187447
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Crowdedness caused by overlapping among similar objects is a ubiquitous
challenge in the field of 2D visual object detection. In this paper, we first
underline two main effects of the crowdedness issue: 1) IoU-confidence
correlation disturbances (ICD) and 2) confused de-duplication (CDD). Then we
explore a pathway of cracking these nuts from the perspective of data
augmentation. Primarily, a particular copy-paste scheme is proposed towards
making crowded scenes. Based on this operation, we first design a "consensus
learning" method to further resist the ICD problem and then find out the
pasting process naturally reveals a pseudo "depth" of object in the scene,
which can be potentially used for alleviating CDD dilemma. Both methods are
derived from magical using of the copy-pasting without extra cost for
hand-labeling. Experiments show that our approach can easily improve the
state-of-the-art detector in typical crowded detection task by more than 2%
without any bells and whistles. Moreover, this work can outperform existing
data augmentation strategies in crowded scenario.
- Abstract(参考訳): 類似した物体同士の重なり合いによって引き起こされる混み合いは、2次元視覚物体検出の分野におけるユビキタスな課題である。
本稿では,まず,混雑問題の主な2つの影響について述べる。
1)iou-confidence correlation disturbances(icd)および
2) 混同重複(CDD)。
次に,これらのナッツを分解する経路を,データ拡張の観点から検討する。
主に、混み合う場面を作るための特定のコピーペーストスキームが提案されている。
そこで本研究では,まずicd問題にさらに抵抗する「コンセンサス・ラーニング」法を設計,次に,cddジレンマの緩和に使用可能なシーン内の物体の擬似「奥行き」を,自然なペーストプロセスで明らかにする手法を提案する。
どちらの方法も、手作業の余計なコストなしでコピーペーストを魔法のように使うことから派生している。
実験の結果, ベルやホイッスルを使わずに, 通常の密集検知タスクにおいて, 最先端検出器を2%以上改善できることがわかった。
さらに、この作業は、混雑したシナリオで既存のデータ拡張戦略より優れている。
関連論文リスト
- UniForensics: Face Forgery Detection via General Facial Representation [60.5421627990707]
高レベルの意味的特徴は摂動の影響を受けにくく、フォージェリー固有の人工物に限らないため、より強い一般化がある。
我々は、トランスフォーマーベースのビデオネットワークを活用する新しいディープフェイク検出フレームワークUniForensicsを導入し、顔の豊かな表現のためのメタファンクショナルな顔分類を行う。
論文 参考訳(メタデータ) (2024-07-26T20:51:54Z) - A Dense Reward View on Aligning Text-to-Image Diffusion with Preference [54.43177605637759]
本稿では,T2I逆鎖の初期ステップを強調する,トラクタブルアライメントの目的を提案する。
単一および複数プロンプト生成の実験では,本手法は強い関連するベースラインと競合する。
論文 参考訳(メタデータ) (2024-02-13T07:37:24Z) - Dual-Perspective Knowledge Enrichment for Semi-Supervised 3D Object
Detection [55.210991151015534]
本稿では, DPKE という新しい2次元知識豊か化手法を提案する。
我々のDPKEは、データパースペクティブと機能パースペクティブという2つの観点から、限られたトレーニングデータ、特にラベルなしデータの知識を豊かにしています。
論文 参考訳(メタデータ) (2024-01-10T08:56:07Z) - Occlusion-Aware Detection and Re-ID Calibrated Network for Multi-Object
Tracking [38.36872739816151]
検出器内のOAA(Occlusion-Aware Attention)モジュールは、隠蔽された背景領域を抑えながらオブジェクトの特徴を強調する。
OAAは、隠蔽される可能性のある物体の検出器を強化する変調器として機能する。
最適輸送問題に基づくRe-ID埋め込みマッチングブロックを設計する。
論文 参考訳(メタデータ) (2023-08-30T06:56:53Z) - Discrepancy-Guided Reconstruction Learning for Image Forgery Detection [10.221066530624373]
本稿ではまず,不規則な視覚パターンを抽出するDisrepancy-Guided (DisGE)を提案する。
次にDouHR(Dou-Head Reconstruction)モジュールを導入し、異なる粒度空間における真のコンパクトな視覚パターンを強化する。
さらに、DouHRでは、これらの真のコンパクトな視覚パターンを集約するDiscrepancy-Aggregation Detector (DisAD)を導入する。
論文 参考訳(メタデータ) (2023-04-26T07:40:43Z) - DiffuPose: Monocular 3D Human Pose Estimation via Denoising Diffusion
Probabilistic Model [25.223801390996435]
本稿では,1つの2次元キーポイント検出から3次元ポーズを再構築することに焦点を当てた。
我々は,市販の2D検出器から多種多様な3Dポーズを効果的にサンプリングするための,拡散に基づく新しいフレームワークを構築した。
我々は,広く採用されているHuman3.6MとHumanEva-Iデータセットについて評価を行った。
論文 参考訳(メタデータ) (2022-12-06T07:22:20Z) - Revisiting Consistency Regularization for Semi-supervised Change
Detection in Remote Sensing Images [60.89777029184023]
教師付きクロスエントロピー(CE)損失に加えて、教師なしCD損失を定式化する半教師付きCDモデルを提案する。
2つの公開CDデータセットを用いて実験を行った結果,提案手法は教師付きCDの性能に近づきやすいことがわかった。
論文 参考訳(メタデータ) (2022-04-18T17:59:01Z) - Move to See Better: Self-Improving Embodied Object Detection [35.461141354989714]
本研究では,テスト環境における物体検出の改善手法を提案する。
エージェントは、多視点データを収集し、2Dおよび3D擬似ラベルを生成し、その検出器を自己監督的に微調整する。
論文 参考訳(メタデータ) (2020-11-30T19:16:51Z) - Deep Spatial Gradient and Temporal Depth Learning for Face Anti-spoofing [61.82466976737915]
深層学習は、顔の反偽造の最も効果的な方法の1つとして証明されている。
2つの洞察に基づいて,複数フレームからの提示攻撃を検出する新しい手法を提案する。
提案手法は,5つのベンチマークデータセットの最先端結果を実現する。
論文 参考訳(メタデータ) (2020-03-18T06:11:20Z) - Progressive Object Transfer Detection [84.48927705173494]
本稿では,新しいプログレッシブオブジェクト転送検出(POTD)フレームワークを提案する。
第一に、POTDは様々なドメインの様々なオブジェクトを効果的にプログレッシブな検出手順に活用することができる。
第2に、POTDは2つの微妙な転送段階、すなわち、LSTD(low-Shot Transfer Detection)とWSTD(Weakly Supervised Transfer Detection)から構成される。
論文 参考訳(メタデータ) (2020-02-12T00:16:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。