論文の概要: Detective: An Attentive Recurrent Model for Sparse Object Detection
- arxiv url: http://arxiv.org/abs/2004.12197v1
- Date: Sat, 25 Apr 2020 17:41:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2022-12-09 22:02:08.001749
- Title: Detective: An Attentive Recurrent Model for Sparse Object Detection
- Title(参考訳): detective: スパースオブジェクト検出のための注意的リカレントモデル
- Authors: Amine Kechaou, Manuel Martinez, Monica Haurilet and Rainer
Stiefelhagen
- Abstract要約: ディテクティヴ(英: Detective)は、画像中の物体を連続的に識別する注意オブジェクト検出器である。
Detectiveはスパースオブジェクト検出器で、オブジェクトインスタンス毎に単一のバウンディングボックスを生成する。
ハンガリーのアルゴリズムに基づく学習機構と,局所化と分類タスクのバランスをとる損失を提案する。
- 参考スコア(独自算出の注目度): 25.5804429439316
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this work, we present Detective - an attentive object detector that
identifies objects in images in a sequential manner. Our network is based on an
encoder-decoder architecture, where the encoder is a convolutional neural
network, and the decoder is a convolutional recurrent neural network coupled
with an attention mechanism. At each iteration, our decoder focuses on the
relevant parts of the image using an attention mechanism, and then estimates
the object's class and the bounding box coordinates. Current object detection
models generate dense predictions and rely on post-processing to remove
duplicate predictions. Detective is a sparse object detector that generates a
single bounding box per object instance. However, training a sparse object
detector is challenging, as it requires the model to reason at the instance
level and not just at the class and spatial levels. We propose a training
mechanism based on the Hungarian algorithm and a loss that balances the
localization and classification tasks. This allows Detective to achieve
promising results on the PASCAL VOC object detection dataset. Our experiments
demonstrate that sparse object detection is possible and has a great potential
for future developments in applications where the order of the objects to be
predicted is of interest.
- Abstract(参考訳): 本研究では,画像中の物体を逐次的に識別する注意対象検出器である detective を提案する。
私たちのネットワークは、エンコーダが畳み込みニューラルネットワークであり、デコーダは、注意機構と結合した畳み込みリカレントニューラルネットワークである、エンコーダ/デコーダアーキテクチャに基づいています。
各イテレーションにおいて、デコーダは注意機構を用いて画像の関連部分に焦点を当て、オブジェクトのクラスと境界ボックス座標を推定します。
現在のオブジェクト検出モデルは、密な予測を生成し、重複した予測を削除するために後処理に依存する。
detectiveはスパースオブジェクト検出器で、オブジェクトインスタンスごとに単一のバウンディングボックスを生成する。
しかし、スパースオブジェクト検出器のトレーニングは、モデルがクラスや空間レベルだけでなく、インスタンスレベルでの推論を必要とするため、難しい。
本稿では,ハンガリーアルゴリズムに基づく学習機構と,局所化と分類タスクのバランスをとる損失を提案する。
これにより、TectiveはPASCAL VOCオブジェクト検出データセット上で有望な結果を達成することができる。
我々の実験は、スパースなオブジェクト検出が可能であり、予測対象の順序が興味深いアプリケーションにおける将来の発展に大きな可能性を秘めている。
関連論文リスト
- Object Detection in Aerial Images with Uncertainty-Aware Graph Network [61.02591506040606]
本稿では,ノードとエッジがオブジェクトによって表現される構造化グラフを用いた,新しい不確実性を考慮したオブジェクト検出フレームワークを提案する。
我々は我々のモデルをオブジェクトDETection(UAGDet)のための不確実性対応グラフネットワークと呼ぶ。
論文 参考訳(メタデータ) (2022-08-23T07:29:03Z) - Instance-Aware Observer Network for Out-of-Distribution Object
Segmentation [94.73449180972239]
我々は、インスタンスワイドマスク予測を利用して、ObsNetのアプローチを拡張します。
提案手法は,3つのデータセット上の分布内オブジェクトから分布内オブジェクトを正確に分離する。
論文 参考訳(メタデータ) (2022-07-18T17:38:40Z) - Multi-Grid Redundant Bounding Box Annotation for Accurate Object
Detection [0.0]
YOLOv3は、入力画像を取り込み、それを同じ大きさのグリッドマトリックスに分割する最先端のワンショット検出器である。
本稿では,オブジェクト毎に複数のグリッドを割り当て,厳密な境界ボックス予測を行う数学的手法を提案する。
論文 参考訳(メタデータ) (2022-01-05T23:01:55Z) - Robust Region Feature Synthesizer for Zero-Shot Object Detection [87.79902339984142]
我々は,クラス内セマンティック・ディバージングコンポーネントとクラス間構造保存コンポーネントを含む,新しいゼロショットオブジェクト検出フレームワークを構築した。
リモートセンシング画像においてゼロショット物体検出を行う最初の研究である。
論文 参考訳(メタデータ) (2022-01-01T03:09:15Z) - Pix2seq: A Language Modeling Framework for Object Detection [12.788663431798588]
Pix2Seqはオブジェクト検出のためのシンプルで汎用的なフレームワークである。
我々はニューラルネットをトレーニングし、画像を認識し、所望のシーケンスを生成する。
私たちのアプローチは主に、ニューラルネットワークがオブジェクトの場所と場所を知っていれば、その読み方を教える必要がある、という直感に基づいています。
論文 参考訳(メタデータ) (2021-09-22T17:26:36Z) - AdaCon: Adaptive Context-Aware Object Detection for Resource-Constrained
Embedded Devices [2.5345835184316536]
畳み込みニューラルネットワークは、オブジェクト検出タスクにおいて最先端の精度を達成する。
リソース制約のあるエッジデバイスへの展開に挑戦する計算とエネルギーの要求が大きい。
本稿では,物体検出モデルの効率を高めるために,異なる対象カテゴリが共同で発生する確率に関する事前知識を活用する。
COCOデータセットを用いた実験の結果, 適応物体検出モデルでは, エネルギー消費量が最大45%減少し, 遅延が最大27%減少し, 物体検出の平均精度(AP)が低下することがわかった。
論文 参考訳(メタデータ) (2021-08-16T01:21:55Z) - Instance Localization for Self-supervised Detection Pretraining [68.24102560821623]
インスタンスローカリゼーションと呼ばれる,新たな自己監視型プリテキストタスクを提案する。
境界ボックスを事前学習に組み込むことで、より優れたタスクアライメントとアーキテクチャアライメントが促進されることを示す。
実験結果から, オブジェクト検出のための最先端の転送学習結果が得られた。
論文 参考訳(メタデータ) (2021-02-16T17:58:57Z) - Class-agnostic Object Detection [16.97782147401037]
本稿では,オブジェクトのクラスに関係なくオブジェクトを検出することに焦点を当てた新しい問題として,クラスに依存しないオブジェクト検出を提案する。
具体的には、イメージ内のすべてのオブジェクトのバウンディングボックスを予測することであり、オブジェクトクラスではない。
本稿では,この領域における今後の研究を進めるために,クラス非依存検出器のベンチマークのためのトレーニングおよび評価プロトコルを提案する。
論文 参考訳(メタデータ) (2020-11-28T19:22:38Z) - Slender Object Detection: Diagnoses and Improvements [74.40792217534]
本稿では,超高アスペクト比,すなわちtextbfslender オブジェクトの特定タイプの検出について検討する。
古典的物体検出法では、細い物体に対してのみ評価される場合、COCO上の18.9%のmAPの劇的な低下が観察される。
論文 参考訳(メタデータ) (2020-11-17T09:39:42Z) - Synthesizing the Unseen for Zero-shot Object Detection [72.38031440014463]
そこで本研究では,視覚領域における視覚的特徴と視覚的対象の両方を学習するために,視覚的特徴を合成することを提案する。
クラスセマンティックスを用いた新しい生成モデルを用いて特徴を生成するだけでなく,特徴を識別的に分離する。
論文 参考訳(メタデータ) (2020-10-19T12:36:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。