論文の概要: Shift Equivariance in Object Detection
- arxiv url: http://arxiv.org/abs/2008.05787v1
- Date: Thu, 13 Aug 2020 10:02:02 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-30 23:32:45.483329
- Title: Shift Equivariance in Object Detection
- Title(参考訳): 物体検出におけるシフト等価性
- Authors: Marco Manfredi and Yu Wang
- Abstract要約: 近年の研究では、CNNベースの分類器はシフト不変ではないことが示されている。
このことが物体検出にどの程度影響を与えるかは、主に2つの構造の違いと現代の検出器の予測空間の寸法の違いから明らかでない。
シフトした画像集合上での平均値の平均値と平均値の下位値と上位値のグリーディ探索に基づく評価指標を提案する。
- 参考スコア(独自算出の注目度): 8.03777903218606
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Robustness to small image translations is a highly desirable property for
object detectors. However, recent works have shown that CNN-based classifiers
are not shift invariant. It is unclear to what extent this could impact object
detection, mainly because of the architectural differences between the two and
the dimensionality of the prediction space of modern detectors. To assess shift
equivariance of object detection models end-to-end, in this paper we propose an
evaluation metric, built upon a greedy search of the lower and upper bounds of
the mean average precision on a shifted image set. Our new metric shows that
modern object detection architectures, no matter if one-stage or two-stage,
anchor-based or anchor-free, are sensitive to even one pixel shift to the input
images. Furthermore, we investigate several possible solutions to this problem,
both taken from the literature and newly proposed, quantifying the
effectiveness of each one with the suggested metric. Our results indicate that
none of these methods can provide full shift equivariance. Measuring and
analyzing the extent of shift variance of different models and the
contributions of possible factors, is a first step towards being able to devise
methods that mitigate or even leverage such variabilities.
- Abstract(参考訳): 小さな画像変換に対するロバスト性は、物体検出器にとって非常に望ましい特性である。
しかし、近年の研究では、cnnベースの分類器はシフト不変ではないことが示されている。
このことが物体検出にどの程度影響を与えるかは、主に2つの構造の違いと現代の検出器の予測空間の寸法の違いから明らかでない。
本稿では, 物体検出モデルのエンドツーエンドへのシフト同値性を評価するために, シフトした画像集合上での平均平均精度の下限と上限のグリーディ探索に基づく評価指標を提案する。
新しい測定基準は、1ステージまたは2ステージ、アンカーベースまたはアンカーフリーであっても、現在のオブジェクト検出アーキテクチャが入力画像への1ピクセルシフトにも敏感であることを示している。
さらに,本研究は文献から考察し,提案手法を用いて提案手法の有効性を定量化した。
以上の結果から, いずれの方法も完全シフト同値性は得られないことが示唆された。
異なるモデルのシフト分散度と可能な要因の寄与度の測定と分析は、そのような変動を緩和したり、活用したりする方法を考案するための第一歩である。
関連論文リスト
- A Novel Unified Architecture for Low-Shot Counting by Detection and Segmentation [10.461109095311546]
ローショットオブジェクトカウンタは、注釈付き例題をほとんどあるいは全く使用せずに画像内のオブジェクト数を推定する。
既存のアプローチは、しばしば過一般化と偽陽性検出につながる。
本稿では,オブジェクト検出,セグメンテーション,カウント推定を行う新しいローショットカウンタであるGeCoを紹介する。
論文 参考訳(メタデータ) (2024-09-27T12:20:29Z) - Unsupervised Object Detection with Theoretical Guarantees [15.779730667509915]
我々は、教師なしオブジェクト検出アーキテクチャを開発し、学習された変数が、小さなシフトまでの真のオブジェクト位置に対応することを証明した。
理論的予測は個々のピクセルの精度まで検証する。
現行のSOTAオブジェクト検出法とは異なり,提案手法の予測誤差は常に理論的境界内にある。
論文 参考訳(メタデータ) (2024-06-11T14:12:31Z) - Size-invariance Matters: Rethinking Metrics and Losses for Imbalanced Multi-object Salient Object Detection [133.66006666465447]
現在のメトリクスはサイズに敏感で、大きなオブジェクトが集中し、小さなオブジェクトが無視される傾向があります。
サイズに基づくバイアスは、追加のセマンティック情報なしでは不適切であるため、評価はサイズ不変であるべきだと論じる。
我々は,この目標に適した最適化フレームワークを開発し,異なる大きさのオブジェクトの検出において,大幅な改善を実現した。
論文 参考訳(メタデータ) (2024-05-16T03:01:06Z) - Fast and Accurate Object Detection on Asymmetrical Receptive Field [0.0]
本稿では,物体検出精度を受容場の変化の観点から改善する手法を提案する。
YOLOv5の頭部の構造は、非対称なプール層を付加することによって改変される。
本稿では, 従来の YOLOv5 モデルと比較し, いくつかのパラメータから解析する。
論文 参考訳(メタデータ) (2023-03-15T23:59:18Z) - Learning Transformations To Reduce the Geometric Shift in Object
Detection [60.20931827772482]
画像キャプチャプロセスの変動から生じる幾何シフトに対処する。
我々は、これらのシフトを最小限に抑えるために幾何変換の集合を学習する自己学習アプローチを導入する。
我々は,カメラの視野変化(FoV)と視点変化(視点変化)の2つの異なるシフトについて,本手法の評価を行った。
論文 参考訳(メタデータ) (2023-01-13T11:55:30Z) - Suitability of Different Metric Choices for Concept Drift Detection [9.76294323004155]
ドリフト検出のための多くの教師なしのアプローチは、2つの時間窓のサンプル間の差を測定することに依存している。
ほとんどのドリフト検出法は、どの計量を使用するか、この計量がどのように推定されるか、どのように決定しきい値が見つかるかで区別できる。
我々は,異なる種類の推定器と測定器を理論的,実証的に比較し,単一の測定器の関連性について検討する。
論文 参考訳(メタデータ) (2022-02-19T01:11:32Z) - Meta Learning Low Rank Covariance Factors for Energy-Based Deterministic
Uncertainty [58.144520501201995]
ニューラルネットワーク層のBi-Lipschitz正規化は、各レイヤの特徴空間におけるデータインスタンス間の相対距離を保存する。
注意セットエンコーダを用いて,タスク固有の共分散行列を効率的に構築するために,対角的,対角的,低ランクな要素のメタ学習を提案する。
また,最終的な予測分布を達成するために,スケールしたエネルギーを利用する推論手法を提案する。
論文 参考訳(メタデータ) (2021-10-12T22:04:19Z) - Decoupled Adaptation for Cross-Domain Object Detection [69.5852335091519]
クロスドメインオブジェクト検出は、オブジェクト分類よりも難しい。
D-adaptは4つのクロスドメインオブジェクト検出タスクで最先端の結果を達成する。
論文 参考訳(メタデータ) (2021-10-06T08:43:59Z) - Slender Object Detection: Diagnoses and Improvements [74.40792217534]
本稿では,超高アスペクト比,すなわちtextbfslender オブジェクトの特定タイプの検出について検討する。
古典的物体検出法では、細い物体に対してのみ評価される場合、COCO上の18.9%のmAPの劇的な低下が観察される。
論文 参考訳(メタデータ) (2020-11-17T09:39:42Z) - Multi-scale Interactive Network for Salient Object Detection [91.43066633305662]
本稿では,隣接レベルからの機能を統合するためのアグリゲート・インタラクション・モジュールを提案する。
より効率的なマルチスケール機能を得るために、各デコーダユニットに自己相互作用モジュールを埋め込む。
5つのベンチマークデータセットによる実験結果から,提案手法は後処理を一切行わず,23の最先端手法に対して良好に動作することが示された。
論文 参考訳(メタデータ) (2020-07-17T15:41:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。