論文の概要: Localizing Grouped Instances for Efficient Detection in Low-Resource
Scenarios
- arxiv url: http://arxiv.org/abs/2004.12623v1
- Date: Mon, 27 Apr 2020 07:56:53 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-09 05:30:37.319772
- Title: Localizing Grouped Instances for Efficient Detection in Low-Resource
Scenarios
- Title(参考訳): 低リソースシナリオにおける効率的な検出のためのグループインスタンスの配置
- Authors: Amelie Royer, Christoph H. Lampert
- Abstract要約: 可変物体の大きさや密度に適応するフレキシブルな検出手法を提案する。
我々は検出段階の連続に頼り、それぞれが個人だけでなく、対象の群を予測できる能力を持っている。
本稿では,2つの航空画像データセットの実験結果について報告し,提案手法が標準単発検出器よりも精度が高く,計算効率も高いことを示す。
- 参考スコア(独自算出の注目度): 27.920304852537534
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: State-of-the-art detection systems are generally evaluated on their ability
to exhaustively retrieve objects densely distributed in the image, across a
wide variety of appearances and semantic categories. Orthogonal to this, many
real-life object detection applications, for example in remote sensing, instead
require dealing with large images that contain only a few small objects of a
single class, scattered heterogeneously across the space. In addition, they are
often subject to strict computational constraints, such as limited battery
capacity and computing power. To tackle these more practical scenarios, we
propose a novel flexible detection scheme that efficiently adapts to variable
object sizes and densities: We rely on a sequence of detection stages, each of
which has the ability to predict groups of objects as well as individuals.
Similar to a detection cascade, this multi-stage architecture spares
computational effort by discarding large irrelevant regions of the image early
during the detection process. The ability to group objects provides further
computational and memory savings, as it allows working with lower image
resolutions in early stages, where groups are more easily detected than
individuals, as they are more salient. We report experimental results on two
aerial image datasets, and show that the proposed method is as accurate yet
computationally more efficient than standard single-shot detectors,
consistently across three different backbone architectures.
- Abstract(参考訳): 最先端検出システムは、画像に高密度に分散したオブジェクトを、様々な外観や意味カテゴリーにわたって徹底的に検索する能力に基づいて、一般的に評価される。
これと直交して、例えばリモートセンシングのような多くの実生活オブジェクト検出アプリケーションは、その代わりに、空間に不均一に散在する単一のクラスの小さなオブジェクトだけを含む大きなイメージを扱う必要がある。
加えて、バッテリ容量の制限や計算能力の制限など、厳格な計算制約を受けることが多い。
これらのより実用的なシナリオに取り組むために、我々は可変オブジェクトサイズと密度に効率的に適応する新しい柔軟な検出手法を提案する。
検出カスケードと同様に、この多段アーキテクチャは、検出プロセス中に画像の大きな無関係な領域を早期に破棄することで計算作業を省く。
オブジェクトをグループ化する能力は、より計算量とメモリの節約をもたらし、初期の段階ではより低い解像度で作業できる。
本稿では,2つの航空画像データセットの実験結果について報告し,提案手法が標準単発検出器よりも精度が高く,計算効率も高いことを示す。
関連論文リスト
- ESOD: Efficient Small Object Detection on High-Resolution Images [36.80623357577051]
小さなオブジェクトは通常、わずかに分散され、局所的にクラスタ化される。
画像の非対象背景領域において、大量の特徴抽出計算を無駄にする。
本稿では,検出器のバックボーンを再利用して,特徴レベルのオブジェクト探索とパッチスライシングを行う方法を提案する。
論文 参考訳(メタデータ) (2024-07-23T12:21:23Z) - Weakly-supervised deepfake localization in diffusion-generated images [4.548755617115687]
本稿では,Xception ネットワークをバックボーンアーキテクチャとして用いた弱教師付きローカライズ問題を提案する。
本研究では,(局所スコアに基づく)最良動作検出法は,データセットやジェネレータのミスマッチよりも,より緩やかな監視に敏感であることを示す。
論文 参考訳(メタデータ) (2023-11-08T10:27:36Z) - Two Approaches to Supervised Image Segmentation [55.616364225463066]
本研究は、深層学習とマルチセットニューロンのアプローチの比較実験を開発する。
ディープラーニングアプローチは、画像セグメンテーションの実行の可能性を確認した。
代替のマルチセット手法では、計算資源をほとんど必要とせずに精度を向上することができた。
論文 参考訳(メタデータ) (2023-07-19T16:42:52Z) - A Coarse to Fine Framework for Object Detection in High Resolution Image [8.316322664637537]
オブジェクト検出の現在のアプローチでは、高解像度画像における小さなオブジェクトや大規模な分散問題を検出することはめったにない。
本稿では,オブジェクト検出の精度を,特に小さなオブジェクトや大規模分散シーンに対して向上させる,シンプルで効率的なアプローチを提案する。
提案手法は,高分解能画像における物体の空間と情報を有効利用することにより,より効率的に検出できる。
論文 参考訳(メタデータ) (2023-03-02T13:04:33Z) - Disambiguation of One-Shot Visual Classification Tasks: A Simplex-Based
Approach [8.436437583394998]
本稿では,複数の物体の存在を検出するための戦略を提案する。
この戦略は、高次元空間における単純体の角を識別することに基づいている。
提案手法は,極端設定における精度をわずかながら統計的に向上させる能力を示す。
論文 参考訳(メタデータ) (2023-01-16T11:37:05Z) - Fusing Local Similarities for Retrieval-based 3D Orientation Estimation
of Unseen Objects [70.49392581592089]
我々は,モノクロ画像から未確認物体の3次元配向を推定する作業に取り組む。
我々は検索ベースの戦略に従い、ネットワークがオブジェクト固有の特徴を学習するのを防ぐ。
また,LineMOD,LineMOD-Occluded,T-LESSのデータセットを用いた実験により,本手法が従来の手法よりもはるかに優れた一般化をもたらすことが示された。
論文 参考訳(メタデータ) (2022-03-16T08:53:00Z) - You Better Look Twice: a new perspective for designing accurate
detectors with reduced computations [56.34005280792013]
BLT-netは、新しい低計算の2段階オブジェクト検出アーキテクチャである。
非常にエレガントな第1ステージを使用して、オブジェクトをバックグラウンドから分離することで、計算を削減します。
結果のイメージ提案は、高度に正確なモデルによって第2段階で処理される。
論文 参考訳(メタデータ) (2021-07-21T12:39:51Z) - Self-supervised Human Detection and Segmentation via Multi-view
Consensus [116.92405645348185]
本稿では,トレーニング中に幾何学的制約を多視点一貫性という形で組み込むマルチカメラフレームワークを提案する。
本手法は,標準ベンチマークから視覚的に外れた画像に対して,最先端の自己監視的人物検出とセグメンテーション技術に勝ることを示す。
論文 参考訳(メタデータ) (2020-12-09T15:47:21Z) - Self-supervised Segmentation via Background Inpainting [96.10971980098196]
移動可能なカメラで撮影された単一の画像で、自己教師付き検出とセグメンテーションのアプローチを導入する。
我々は、提案に基づくセグメンテーションネットワークのトレーニングに利用する自己教師付き損失関数を利用する。
本手法は,標準ベンチマークから視覚的に切り離された画像の人間の検出とセグメント化に応用し,既存の自己監督手法より優れていることを示す。
論文 参考訳(メタデータ) (2020-11-11T08:34:40Z) - One-Shot Object Detection without Fine-Tuning [62.39210447209698]
本稿では,第1ステージのMatching-FCOSネットワークと第2ステージのStructure-Aware Relation Moduleからなる2段階モデルを提案する。
また,検出性能を効果的に向上する新たなトレーニング戦略を提案する。
提案手法は,複数のデータセット上で一貫した最先端のワンショット性能を上回る。
論文 参考訳(メタデータ) (2020-05-08T01:59:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。