論文の概要: Why Accuracy Is Not Enough: The Need for Consistency in Object Detection
- arxiv url: http://arxiv.org/abs/2207.13890v1
- Date: Thu, 28 Jul 2022 05:51:18 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-29 12:28:53.776642
- Title: Why Accuracy Is Not Enough: The Need for Consistency in Object Detection
- Title(参考訳): なぜ正確でないのか:オブジェクト検出における一貫性の必要性
- Authors: Caleb Tung, Abhinav Goel, Fischer Bordwell, Nick Eliopoulos, Xiao Hu,
George K. Thiruvathukal, Yung-Hsiang Lu
- Abstract要約: 現代のオブジェクト検出器の一貫性は、異なるビデオデータセット上で83.2%から97.1%の範囲である。
WEBP画像圧縮やUnsharp Maskingなどの画像歪み補正を適用することで、一貫性を最大5.1%向上させることができる。
- 参考スコア(独自算出の注目度): 3.1320553947135203
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Object detectors are vital to many modern computer vision applications.
However, even state-of-the-art object detectors are not perfect. On two images
that look similar to human eyes, the same detector can make different
predictions because of small image distortions like camera sensor noise and
lighting changes. This problem is called inconsistency. Existing accuracy
metrics do not properly account for inconsistency, and similar work in this
area only targets improvements on artificial image distortions. Therefore, we
propose a method to use non-artificial video frames to measure object detection
consistency over time, across frames. Using this method, we show that the
consistency of modern object detectors ranges from 83.2% to 97.1% on different
video datasets from the Multiple Object Tracking Challenge. We conclude by
showing that applying image distortion corrections like .WEBP Image Compression
and Unsharp Masking can improve consistency by as much as 5.1%, with no loss in
accuracy.
- Abstract(参考訳): オブジェクト検出器は多くの現代のコンピュータビジョンアプリケーションにとって不可欠である。
しかし、最先端の物体検出器でさえ完璧ではない。
人間の目と似ている2つの画像に対して、同じ検出器は、カメラセンサーのノイズや照明の変化などの小さな画像歪みのために、異なる予測を行うことができる。
この問題は矛盾と呼ばれる。
既存の精度指標は不整合を適切に考慮していないため、この領域でも同様な作業は人工画像歪みの改善だけを対象としている。
そこで本研究では,非人工映像フレームを用いて時間とともに,フレーム間の物体検出の一貫性を測定する手法を提案する。
この手法を用いて,マルチオブジェクト追跡課題の異なるビデオデータセットにおいて,現代の物体検出器の一貫性が83.2%から97.1%まで変化することを示した。
画像の歪み補正を施すことで結論づける。
WEBP画像圧縮とアンシャープマスキングは、精度を損なうことなく、最大5.1%の一貫性を向上させることができる。
関連論文リスト
- Uncertainty Estimation for 3D Object Detection via Evidential Learning [63.61283174146648]
本稿では,3次元検出器における鳥の視線表示における明らかな学習損失を利用して,3次元物体検出の不確かさを定量化するためのフレームワークを提案する。
本研究では,これらの不確実性評価の有効性と重要性を,分布外シーンの特定,局所化の不十分な物体の発見,および(偽陰性)検出の欠如について示す。
論文 参考訳(メタデータ) (2024-10-31T13:13:32Z) - On the Effectiveness of Dataset Alignment for Fake Image Detection [28.68129042301801]
優れた検出器は、セマンティックコンテンツ、解像度、ファイルフォーマットなどの画像特性を無視しながら、生成モデル指紋に焦点を当てるべきである。
この研究では、これらのアルゴリズムの選択に加えて、堅牢な検出器をトレーニングするためには、リアル/フェイク画像の整列したデータセットも必要である、と論じる。
そこで本研究では, LDMの家族に対して, LDMのオートエンコーダを用いて実画像の再構成を行う手法を提案する。
論文 参考訳(メタデータ) (2024-10-15T17:58:07Z) - Zero-Shot Detection of AI-Generated Images [54.01282123570917]
AI生成画像を検出するゼロショットエントロピー検出器(ZED)を提案する。
機械によるテキスト検出の最近の研究に触発された私たちのアイデアは、分析対象の画像が実際の画像のモデルと比較してどれだけ驚くかを測定することである。
ZEDは精度の点でSoTAよりも平均3%以上改善されている。
論文 参考訳(メタデータ) (2024-09-24T08:46:13Z) - Learning to Make Keypoints Sub-Pixel Accurate [80.55676599677824]
本研究は,2次元局所特徴の検出におけるサブピクセル精度の課題に対処する。
本稿では,検出された特徴に対するオフセットベクトルを学習することにより,サブピクセル精度で検出器を拡張できる新しいネットワークを提案する。
論文 参考訳(メタデータ) (2024-07-16T12:39:56Z) - Towards Consistent Object Detection via LiDAR-Camera Synergy [17.665362927472973]
物体の位置を点雲と画像の両方で検出できる既存のモデルは存在しない。
本稿では,エンドツーエンドの一貫性オブジェクト検出(COD)アルゴリズムフレームワークを提案する。
本稿では,点雲と画像間の物体相関の精度を評価するために,新しい評価指標である一貫性精度(Consistency Precision)を提案する。
論文 参考訳(メタデータ) (2024-05-02T13:04:26Z) - Overcoming Scene Context Constraints for Object Detection in wild using Defilters [3.038642416291856]
物体検出、認識、セグメンテーションなどの高レベルのコンピュータビジョンタスクは、特に画像歪みに敏感である。
物体検出に先立って画像歪みを補正する画像デファイラを提案する。
この方法では、非歪画像のトレーニング時にモデルが最適に実行されるため、オブジェクト検出精度が向上する。
論文 参考訳(メタデータ) (2024-04-12T07:30:52Z) - Fewer is More: Efficient Object Detection in Large Aerial Images [59.683235514193505]
本稿では,検出者がより少ないパッチに注目するのに対して,より効率的な推論とより正確な結果を得るのに役立つObjectness Activation Network(OAN)を提案する。
OANを用いて、5つの検出器は3つの大規模な空中画像データセットで30.0%以上のスピードアップを取得する。
我々はOANをドライブシーン物体検出と4Kビデオ物体検出に拡張し,検出速度をそれぞれ112.1%,75.0%向上させた。
論文 参考訳(メタデータ) (2022-12-26T12:49:47Z) - Object Disparity [0.0]
本稿では,高密度画素差を直接検出して3次元物体距離検出を行う方法を提案する。
圧縮ネットオブジェクト分散-SSDの例は、Kittiデータセットの分散基底真理と比較した場合の精度で、効率的なオブジェクト分散検出を示すために構築された。
論文 参考訳(メタデータ) (2021-08-18T02:11:28Z) - You Better Look Twice: a new perspective for designing accurate
detectors with reduced computations [56.34005280792013]
BLT-netは、新しい低計算の2段階オブジェクト検出アーキテクチャである。
非常にエレガントな第1ステージを使用して、オブジェクトをバックグラウンドから分離することで、計算を削減します。
結果のイメージ提案は、高度に正確なモデルによって第2段階で処理される。
論文 参考訳(メタデータ) (2021-07-21T12:39:51Z) - Contemplating real-world object classification [53.10151901863263]
Barbuらが最近提案したObjectNetデータセットを再分析した。
日常の状況に物を含むこと。
分離されたオブジェクトにディープモデルを適用すると、元の論文のようにシーン全体ではなく、約20~30%の性能改善が得られます。
論文 参考訳(メタデータ) (2021-03-08T23:29:59Z) - Shift Equivariance in Object Detection [8.03777903218606]
近年の研究では、CNNベースの分類器はシフト不変ではないことが示されている。
このことが物体検出にどの程度影響を与えるかは、主に2つの構造の違いと現代の検出器の予測空間の寸法の違いから明らかでない。
シフトした画像集合上での平均値の平均値と平均値の下位値と上位値のグリーディ探索に基づく評価指標を提案する。
論文 参考訳(メタデータ) (2020-08-13T10:02:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。