論文の概要: Understanding the Impact of Image Quality and Distance of Objects to
Object Detection Performance
- arxiv url: http://arxiv.org/abs/2209.08237v1
- Date: Sat, 17 Sep 2022 04:05:01 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-20 17:51:55.896624
- Title: Understanding the Impact of Image Quality and Distance of Objects to
Object Detection Performance
- Title(参考訳): 画像品質と物体の距離が物体検出性能に与える影響の理解
- Authors: Yu Hao, Haoyang Pei, Yixuan Lyu, Zhongzheng Yuan, John-Ross Rizzo, Yao
Wang, Yi Fang
- Abstract要約: 本稿では,物体検出精度と計算コストに及ぼす空間分解能,振幅分解能,物体距離の影響について検討する。
入力画像の空間分解能に基づいて特徴ピラミッドと検出ヘッドのスケール数を変化させる解像度適応型 YOLOv5 (RA-YOLO) を開発した。
- 参考スコア(独自算出の注目度): 11.856281907276145
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deep learning has made great strides for object detection in images. The
detection accuracy and computational cost of object detection depend on the
spatial resolution of an image, which may be constrained by both the camera and
storage considerations. Compression is often achieved by reducing either
spatial or amplitude resolution or, at times, both, both of which have
well-known effects on performance. Detection accuracy also depends on the
distance of the object of interest from the camera. Our work examines the
impact of spatial and amplitude resolution, as well as object distance, on
object detection accuracy and computational cost. We develop a
resolution-adaptive variant of YOLOv5 (RA-YOLO), which varies the number of
scales in the feature pyramid and detection head based on the spatial
resolution of the input image. To train and evaluate this new method, we
created a dataset of images with diverse spatial and amplitude resolutions by
combining images from the TJU and Eurocity datasets and generating different
resolutions by applying spatial resizing and compression. We first show that
RA-YOLO achieves a good trade-off between detection accuracy and inference time
over a large range of spatial resolutions. We then evaluate the impact of
spatial and amplitude resolutions on object detection accuracy using the
proposed RA-YOLO model. We demonstrate that the optimal spatial resolution that
leads to the highest detection accuracy depends on the 'tolerated' image size.
We further assess the impact of the distance of an object to the camera on the
detection accuracy and show that higher spatial resolution enables a greater
detection range. These results provide important guidelines for choosing the
image spatial resolution and compression settings predicated on available
bandwidth, storage, desired inference time, and/or desired detection range, in
practical applications.
- Abstract(参考訳): 深層学習は画像の物体検出に大きく貢献している。
物体検出の精度と計算コストは画像の空間分解能に依存しており、カメラと記憶の双方に制約される可能性がある。
圧縮はしばしば、空間分解能または振幅分解能のどちらかを減らすことによって達成される。
検出精度は、カメラからの関心対象の距離にも依存する。
本研究では,物体検出精度と計算コストに対する空間分解能,振幅分解能,物体距離の影響について検討する。
入力画像の空間分解能に基づいて特徴ピラミッドと検出ヘッドのスケール数を変化させる解像度適応型 YOLOv5 (RA-YOLO) を開発した。
本手法の訓練と評価のために,TJUデータセットとEurocityデータセットの画像を組み合わせ,空間的リサイズと圧縮を適用して異なる解像度を生成することにより,多様な空間的・振幅的解像度を持つ画像のデータセットを構築した。
RA-YOLOは,空間分解能の広い範囲において,検出精度と推定時間とのトレードオフが良好であることを示す。
提案したRA-YOLOモデルを用いて,空間分解能と振幅分解能が物体検出精度に与える影響を評価する。
高い検出精度をもたらす最適な空間分解能は「許容された」画像サイズに依存することを実証する。
さらに,被写体とカメラの距離が検出精度に与える影響を評価し,高い空間分解能で検出範囲が大きくなることを示す。
これらの結果は, 利用可能な帯域幅, ストレージ, 所望の推測時間および/または所望の検出範囲に基づいて, 画像空間解像度と圧縮設定を選択するための重要なガイドラインを提供する。
関連論文リスト
- SaccadeDet: A Novel Dual-Stage Architecture for Rapid and Accurate Detection in Gigapixel Images [50.742420049839474]
SaccadeDetは、人間の目の動きにインスパイアされた、ギガピクセルレベルの物体検出のための革新的なアーキテクチャである。
PANDAデータセットを用いて評価した本手法は,最先端手法の8倍の高速化を実現する。
また、全スライドイメージングへの応用を通じて、ギガピクセルレベルの病理解析に有意な可能性を示す。
論文 参考訳(メタデータ) (2024-07-25T11:22:54Z) - DyRA: Portable Dynamic Resolution Adjustment Network for Existing Detectors [0.669087470775851]
本稿では,既存の検出器に画像特異的なスケールファクタを提供する動的解像度調整ネットワークDyRAを紹介する。
ロス関数は、スケールのための異なるサイズのオブジェクトの異なる目的に対する精度低下を最小限に抑えるために考案された。
論文 参考訳(メタデータ) (2023-11-28T07:52:41Z) - OBSUM: An object-based spatial unmixing model for spatiotemporal fusion
of remote sensing images [12.94382743563284]
本研究では,オブジェクトベース画像解析と空間アンミックスを組み込んだオブジェクトベース空間アンミックスモデル(OBSUM)を提案する。
OBSUMは、ベース解像度日に1つの微細画像と、ベース解像度日に1つの粗い画像のみを用いることで、ベース日付時に粗い画像を必要とせずに適用することができる。
様々なリモートセンシングアプリケーションをサポートするために、高精度で高解像度の時系列を生成することができる。
論文 参考訳(メタデータ) (2023-10-14T07:07:27Z) - A Coarse to Fine Framework for Object Detection in High Resolution Image [8.316322664637537]
オブジェクト検出の現在のアプローチでは、高解像度画像における小さなオブジェクトや大規模な分散問題を検出することはめったにない。
本稿では,オブジェクト検出の精度を,特に小さなオブジェクトや大規模分散シーンに対して向上させる,シンプルで効率的なアプローチを提案する。
提案手法は,高分解能画像における物体の空間と情報を有効利用することにより,より効率的に検出できる。
論文 参考訳(メタデータ) (2023-03-02T13:04:33Z) - Towards Spatial Equilibrium Object Detection [88.9747319572368]
本稿では,現代物体検出器の空間的不平衡問題について考察する。
本稿では,ゾーンにおける検出性能の測定により,この問題の定量化を提案する。
これは、より一般化された測度を設計する動機となり、空間平衡精度と呼ばれる。
論文 参考訳(メタデータ) (2023-01-14T17:33:26Z) - Progressive Domain Adaptation with Contrastive Learning for Object
Detection in the Satellite Imagery [0.0]
最先端のオブジェクト検出手法は、小さくて密度の高いオブジェクトを特定するのにほとんど失敗している。
本稿では,特徴抽出プロセスを改善する小型物体検出パイプラインを提案する。
未確認データセットにおけるオブジェクト識別の劣化を緩和できることを示す。
論文 参考訳(メタデータ) (2022-09-06T15:16:35Z) - Fast Fourier Convolution Based Remote Sensor Image Object Detection for
Earth Observation [0.0]
リモートセンシングオブジェクト検出のための周波数対応特徴ピラミッドフレームワーク(FFPF)を提案する。
F-ResNetは、周波数領域の畳み込みをバックボーンの各ステージに差し込み、スペクトルコンテキスト情報を知覚するために提案される。
BSFPNは、双方向サンプリング戦略とスキップ接続を用いて、異なるスケールの物体の特徴の関連をより良くモデル化するように設計されている。
論文 参考訳(メタデータ) (2022-09-01T15:50:58Z) - Towards Model Generalization for Monocular 3D Object Detection [57.25828870799331]
我々は,Mono3Dオブジェクト検出に有効な統合カメラ一般化パラダイム(CGP)を提案する。
また,インスタンスレベルの拡張によりギャップを埋める2D-3D幾何一貫性オブジェクトスケーリング戦略(GCOS)を提案する。
DGMono3Dと呼ばれる手法は、評価された全てのデータセットに対して顕著な性能を達成し、SoTAの教師なしドメイン適応スキームを上回ります。
論文 参考訳(メタデータ) (2022-05-23T23:05:07Z) - SALISA: Saliency-based Input Sampling for Efficient Video Object
Detection [58.22508131162269]
ビデオオブジェクト検出のための新しい一様SALiencyベースの入力SAmpling技術であるSALISAを提案する。
SALISAは小物体の検出を著しく改善することを示す。
論文 参考訳(メタデータ) (2022-04-05T17:59:51Z) - You Better Look Twice: a new perspective for designing accurate
detectors with reduced computations [56.34005280792013]
BLT-netは、新しい低計算の2段階オブジェクト検出アーキテクチャである。
非常にエレガントな第1ステージを使用して、オブジェクトをバックグラウンドから分離することで、計算を削減します。
結果のイメージ提案は、高度に正確なモデルによって第2段階で処理される。
論文 参考訳(メタデータ) (2021-07-21T12:39:51Z) - AdaZoom: Adaptive Zoom Network for Multi-Scale Object Detection in Large
Scenes [57.969186815591186]
大規模なシーンの検出は、小さなオブジェクトと極端なスケールの変動のために難しい問題である。
本稿では,物体検出のための焦点領域を適応的に拡大するために,フレキシブルな形状と焦点長を有する選択的拡大器として,新しい適応型Zoom(AdaZoom)ネットワークを提案する。
論文 参考訳(メタデータ) (2021-06-19T03:30:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。