論文の概要: Few-Shot Object Detection and Viewpoint Estimation for Objects in the
Wild
- arxiv url: http://arxiv.org/abs/2007.12107v2
- Date: Wed, 12 Oct 2022 14:46:41 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-07 12:48:47.310056
- Title: Few-Shot Object Detection and Viewpoint Estimation for Objects in the
Wild
- Title(参考訳): 野生における物体のFew-Shot物体検出と視点推定
- Authors: Yang Xiao, Vincent Lepetit, Renaud Marlet
- Abstract要約: 少数ショットオブジェクト検出と少数ショット視点推定の問題に対処する。
両タスクにおいて,データから抽出したクラス表現機能を用いて,ネットワーク予測を導出する利点を実証する。
提案手法は,様々なデータセットに対して,最先端の手法よりも広いマージンで性能を向上する。
- 参考スコア(独自算出の注目度): 40.132988301147776
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Detecting objects and estimating their viewpoints in images are key tasks of
3D scene understanding. Recent approaches have achieved excellent results on
very large benchmarks for object detection and viewpoint estimation. However,
performances are still lagging behind for novel object categories with few
samples. In this paper, we tackle the problems of few-shot object detection and
few-shot viewpoint estimation. We demonstrate on both tasks the benefits of
guiding the network prediction with class-representative features extracted
from data in different modalities: image patches for object detection, and
aligned 3D models for viewpoint estimation. Despite its simplicity, our method
outperforms state-of-the-art methods by a large margin on a range of datasets,
including PASCAL and COCO for few-shot object detection, and Pascal3D+ and
ObjectNet3D for few-shot viewpoint estimation. Furthermore, when the 3D model
is not available, we introduce a simple category-agnostic viewpoint estimation
method by exploiting geometrical similarities and consistent pose labelling
across different classes. While it moderately reduces performance, this
approach still obtains better results than previous methods in this setting.
Last, for the first time, we tackle the combination of both few-shot tasks, on
three challenging benchmarks for viewpoint estimation in the wild, ObjectNet3D,
Pascal3D+ and Pix3D, showing very promising results.
- Abstract(参考訳): 物体の検出と画像の視点推定は3Dシーン理解の重要な課題である。
最近のアプローチは、オブジェクト検出と視点推定の非常に大きなベンチマークで優れた結果を得た。
しかし、わずかなサンプルで新しいオブジェクトカテゴリではパフォーマンスが遅れている。
本稿では,少数ショット物体検出と少数ショット視点推定の問題に対処する。
両タスクにおいて,オブジェクト検出用イメージパッチと視点推定用アライメント3Dモデルを用いて,異なるモーダルデータから抽出したクラス表現特徴を用いて,ネットワーク予測を導出する利点を実証する。
その単純さにもかかわらず,本手法は,PASCALやCOCO,Pascal3D+やObjectNet3Dなど,多種多様なデータセットに対して,最先端の手法よりも高い精度で性能を向上する。
さらに,3次元モデルが利用できない場合,異なるクラスにまたがる幾何学的類似性と一貫したポーズラベリングを活用し,単純なカテゴリー非依存視点推定手法を導入する。
パフォーマンスは緩やかに低下するが、このアプローチはこの設定の以前の方法よりも良い結果を得る。
最後に、私たちは、野生のObjectNet3D、Pascal3D+、Pix3Dの視点推定のための3つの挑戦的なベンチマークで、両方のショットタスクの組み合わせに初めて取り組み、非常に有望な結果を示しました。
関連論文リスト
- LocaliseBot: Multi-view 3D object localisation with differentiable
rendering for robot grasping [9.690844449175948]
オブジェクトのポーズ推定に重点を置いています。
このアプローチは,オブジェクトの複数ビュー,それらの視点におけるカメラのパラメータ,オブジェクトの3次元CADモデルという3つの情報に依存している。
推定対象のポーズが99.65%の精度で真理把握候補を把握できることが示される。
論文 参考訳(メタデータ) (2023-11-14T14:27:53Z) - PoseMatcher: One-shot 6D Object Pose Estimation by Deep Feature Matching [51.142988196855484]
本稿では,PoseMatcherを提案する。
3ビューシステムに基づくオブジェクトと画像のマッチングのための新しいトレーニングパイプラインを作成します。
PoseMatcherは、画像とポイントクラウドの異なる入力モダリティに対応できるように、IO-Layerを導入します。
論文 参考訳(メタデータ) (2023-04-03T21:14:59Z) - NOPE: Novel Object Pose Estimation from a Single Image [67.11073133072527]
本稿では,新しいオブジェクトの1つのイメージを入力として取り込んで,オブジェクトの3Dモデルに関する事前知識を必要とせずに,新しいイメージにおけるオブジェクトの相対的なポーズを予測するアプローチを提案する。
我々は、オブジェクトを取り巻く視点に対する識別的埋め込みを直接予測するモデルを訓練することで、これを実現する。
この予測は単純なU-Netアーキテクチャを用いて行われ、要求されたポーズに注意を向け、条件を定め、非常に高速な推論をもたらす。
論文 参考訳(メタデータ) (2023-03-23T18:55:43Z) - Unseen Object 6D Pose Estimation: A Benchmark and Baselines [62.8809734237213]
本稿では,新しい物体の6次元ポーズ推定をアルゴリズムで行えるようにするための新しいタスクを提案する。
実画像と合成画像の両方でデータセットを収集し、テストセットで最大48個の未確認オブジェクトを収集する。
エンド・ツー・エンドの3D対応ネットワークをトレーニングすることにより、未確認物体と部分ビューRGBD画像との対応点を高精度かつ効率的に見つけることができる。
論文 参考訳(メタデータ) (2022-06-23T16:29:53Z) - Analysis of voxel-based 3D object detection methods efficiency for
real-time embedded systems [93.73198973454944]
本稿では, ボクセルをベースとした2つの3次元物体検出手法について述べる。
実験の結果,これらの手法は入力点雲が遠距離にあるため,遠距離の小さな物体を検出できないことが確認できた。
この結果から,既存手法の計算のかなりの部分は,検出に寄与しないシーンの位置に着目していることが示唆された。
論文 参考訳(メタデータ) (2021-05-21T12:40:59Z) - Objects are Different: Flexible Monocular 3D Object Detection [87.82253067302561]
そこで本研究では,乱れたオブジェクトを明示的に分離し,オブジェクト深度推定のための複数のアプローチを適応的に組み合わせたモノクル3次元オブジェクト検出のためのフレキシブルなフレームワークを提案する。
実験の結果,本手法はkittiベンチマークテストセットにおいて,中等度レベルが27%,硬度が30%と,最先端法を27%上回った。
論文 参考訳(メタデータ) (2021-04-06T07:01:28Z) - Few-shot Object Detection on Remote Sensing Images [11.40135025181393]
リモートセンシング画像におけるオブジェクト検出のための数ショットの学習手法を提案する。
我々は、YOLOv3アーキテクチャに基づいて、少数ショットオブジェクト検出モデルを構築し、マルチスケールオブジェクト検出フレームワークを開発する。
論文 参考訳(メタデータ) (2020-06-14T07:18:10Z) - Object as Hotspots: An Anchor-Free 3D Object Detection Approach via
Firing of Hotspots [37.16690737208046]
オブジェクトレベルのアンカーを用いた既存のメソッドとは逆のアプローチを論じる。
構成モデルに着想を得て、内部の空でないボクセルの組成として、ホットスポットと呼ばれる物体を提案する。
提案手法は,OHSに基づく新しい地中真理割当て戦略を用いたアンカーフリー検出ヘッドを提案する。
論文 参考訳(メタデータ) (2019-12-30T03:02:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。