論文の概要: Why Accuracy Is Not Enough: The Need for Consistency in Object Detection
- arxiv url: http://arxiv.org/abs/2207.13890v1
- Date: Thu, 28 Jul 2022 05:51:18 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-29 12:28:53.776642
- Title: Why Accuracy Is Not Enough: The Need for Consistency in Object Detection
- Title(参考訳): なぜ正確でないのか:オブジェクト検出における一貫性の必要性
- Authors: Caleb Tung, Abhinav Goel, Fischer Bordwell, Nick Eliopoulos, Xiao Hu,
George K. Thiruvathukal, Yung-Hsiang Lu
- Abstract要約: 現代のオブジェクト検出器の一貫性は、異なるビデオデータセット上で83.2%から97.1%の範囲である。
WEBP画像圧縮やUnsharp Maskingなどの画像歪み補正を適用することで、一貫性を最大5.1%向上させることができる。
- 参考スコア(独自算出の注目度): 3.1320553947135203
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Object detectors are vital to many modern computer vision applications.
However, even state-of-the-art object detectors are not perfect. On two images
that look similar to human eyes, the same detector can make different
predictions because of small image distortions like camera sensor noise and
lighting changes. This problem is called inconsistency. Existing accuracy
metrics do not properly account for inconsistency, and similar work in this
area only targets improvements on artificial image distortions. Therefore, we
propose a method to use non-artificial video frames to measure object detection
consistency over time, across frames. Using this method, we show that the
consistency of modern object detectors ranges from 83.2% to 97.1% on different
video datasets from the Multiple Object Tracking Challenge. We conclude by
showing that applying image distortion corrections like .WEBP Image Compression
and Unsharp Masking can improve consistency by as much as 5.1%, with no loss in
accuracy.
- Abstract(参考訳): オブジェクト検出器は多くの現代のコンピュータビジョンアプリケーションにとって不可欠である。
しかし、最先端の物体検出器でさえ完璧ではない。
人間の目と似ている2つの画像に対して、同じ検出器は、カメラセンサーのノイズや照明の変化などの小さな画像歪みのために、異なる予測を行うことができる。
この問題は矛盾と呼ばれる。
既存の精度指標は不整合を適切に考慮していないため、この領域でも同様な作業は人工画像歪みの改善だけを対象としている。
そこで本研究では,非人工映像フレームを用いて時間とともに,フレーム間の物体検出の一貫性を測定する手法を提案する。
この手法を用いて,マルチオブジェクト追跡課題の異なるビデオデータセットにおいて,現代の物体検出器の一貫性が83.2%から97.1%まで変化することを示した。
画像の歪み補正を施すことで結論づける。
WEBP画像圧縮とアンシャープマスキングは、精度を損なうことなく、最大5.1%の一貫性を向上させることができる。
関連論文リスト
- Reducing False Alarms in Video Surveillance by Deep Feature Statistical
Modeling [16.311150636417256]
我々は, 深部特徴の高次元統計的モデリングに基づいて, 弱教師付きa-コントラリオ検証法を開発した。
実験結果から,提案したa-contrarioバリデーションにより,画素レベルとオブジェクトレベルの偽アラームの回数を大幅に削減できることがわかった。
論文 参考訳(メタデータ) (2023-07-09T12:37:17Z) - Fast and Accurate Object Detection on Asymmetrical Receptive Field [4.392212820170972]
本稿では,物体検出精度を受容場の変化の観点から改善する手法を提案する。
YOLOv5の頭部の構造は、非対称なプール層を付加することによって改変される。
本稿では, 従来の YOLOv5 モデルと比較し, いくつかのパラメータから解析する。
論文 参考訳(メタデータ) (2023-03-15T23:59:18Z) - Fewer is More: Efficient Object Detection in Large Aerial Images [59.683235514193505]
本稿では,検出者がより少ないパッチに注目するのに対して,より効率的な推論とより正確な結果を得るのに役立つObjectness Activation Network(OAN)を提案する。
OANを用いて、5つの検出器は3つの大規模な空中画像データセットで30.0%以上のスピードアップを取得する。
我々はOANをドライブシーン物体検出と4Kビデオ物体検出に拡張し,検出速度をそれぞれ112.1%,75.0%向上させた。
論文 参考訳(メタデータ) (2022-12-26T12:49:47Z) - Adversarially-Aware Robust Object Detector [85.10894272034135]
本稿では,ロバスト検出器 (RobustDet) を提案する。
本モデルは, クリーン画像の検出能力を維持しながら, 傾きを効果的に解き, 検出堅牢性を著しく向上させる。
論文 参考訳(メタデータ) (2022-07-13T13:59:59Z) - Context-Aware Transfer Attacks for Object Detection [51.65308857232767]
本稿では,オブジェクト検出のためのコンテキスト認識攻撃を新たに生成する手法を提案する。
オブジェクトとその相対的な位置と大きさの共起をコンテキスト情報として利用することにより、ターゲットの誤分類攻撃をうまく生成できることを示す。
論文 参考訳(メタデータ) (2021-12-06T18:26:39Z) - Object Disparity [0.0]
本稿では,高密度画素差を直接検出して3次元物体距離検出を行う方法を提案する。
圧縮ネットオブジェクト分散-SSDの例は、Kittiデータセットの分散基底真理と比較した場合の精度で、効率的なオブジェクト分散検出を示すために構築された。
論文 参考訳(メタデータ) (2021-08-18T02:11:28Z) - You Better Look Twice: a new perspective for designing accurate
detectors with reduced computations [56.34005280792013]
BLT-netは、新しい低計算の2段階オブジェクト検出アーキテクチャである。
非常にエレガントな第1ステージを使用して、オブジェクトをバックグラウンドから分離することで、計算を削減します。
結果のイメージ提案は、高度に正確なモデルによって第2段階で処理される。
論文 参考訳(メタデータ) (2021-07-21T12:39:51Z) - Contemplating real-world object classification [53.10151901863263]
Barbuらが最近提案したObjectNetデータセットを再分析した。
日常の状況に物を含むこと。
分離されたオブジェクトにディープモデルを適用すると、元の論文のようにシーン全体ではなく、約20~30%の性能改善が得られます。
論文 参考訳(メタデータ) (2021-03-08T23:29:59Z) - Identifying Invariant Texture Violation for Robust Deepfake Detection [17.306386179823576]
Invariant Texture Learning frameworkは,低画質で公開されたデータセットにのみアクセスすることができる。
本手法は, 被写体から転写したテクスチャによって, 被写体表面の微視的顔のテクスチャが必然的に侵害されることを前提とした。
論文 参考訳(メタデータ) (2020-12-19T03:02:15Z) - Shift Equivariance in Object Detection [8.03777903218606]
近年の研究では、CNNベースの分類器はシフト不変ではないことが示されている。
このことが物体検出にどの程度影響を与えるかは、主に2つの構造の違いと現代の検出器の予測空間の寸法の違いから明らかでない。
シフトした画像集合上での平均値の平均値と平均値の下位値と上位値のグリーディ探索に基づく評価指標を提案する。
論文 参考訳(メタデータ) (2020-08-13T10:02:02Z) - Leveraging Photometric Consistency over Time for Sparsely Supervised
Hand-Object Reconstruction [118.21363599332493]
本稿では,ビデオ中のフレームの粗いサブセットに対してのみアノテーションが利用できる場合に,時間とともに光度整合性を活用する手法を提案する。
本モデルでは,ポーズを推定することにより,手や物体を3Dで共同で再構成するカラーイメージをエンドツーエンドに訓練する。
提案手法は,3次元手動画像再構成の精度向上に有効であることを示す。
論文 参考訳(メタデータ) (2020-04-28T12:03:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。