論文の概要: DR-WLC: Dimensionality Reduction cognition for object detection and pose
estimation by Watching, Learning and Checking
- arxiv url: http://arxiv.org/abs/2301.06944v1
- Date: Tue, 17 Jan 2023 15:08:32 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-18 13:53:40.246530
- Title: DR-WLC: Dimensionality Reduction cognition for object detection and pose
estimation by Watching, Learning and Checking
- Title(参考訳): DR-WLC: 視聴・学習・チェックによる物体検出・ポーズ推定のための次元化認識
- Authors: Yu Gao, Xi Xu, Tianji Jiang, Siyuan Chen, Yi Yang, Yufeng Yue, Mengyin
Fu
- Abstract要約: 既存の物体検出法とポーズ推定法は、主に訓練に同次元のデータを用いる。
次元減少認知モデルであるDR-WLCは、物体検出と推定タスクを同時に行うことができる。
- 参考スコア(独自算出の注目度): 30.58114448119465
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Object detection and pose estimation are difficult tasks in robotics and
autonomous driving. Existing object detection and pose estimation methods
mostly adopt the same-dimensional data for training. For example, 2D object
detection usually requires a large amount of 2D annotation data with high cost.
Using high-dimensional information to supervise lower-dimensional tasks is a
feasible way to reduce datasets size. In this work, the DR-WLC, a
dimensionality reduction cognitive model, which can perform both object
detection and pose estimation tasks at the same time is proposed. The model
only requires 3D model of objects and unlabeled environment images (with or
without objects) to finish the training. In addition, a bounding boxes
generation strategy is also proposed to build the relationship between 3D model
and 2D object detection task. Experiments show that our method can qualify the
work without any manual annotations and it is easy to deploy for practical
applications. Source code is at https://github.com/IN2-ViAUn/DR-WLC.
- Abstract(参考訳): 物体検出とポーズ推定はロボット工学や自動運転において難しい課題である。
既存のオブジェクト検出とポーズ推定手法は、トレーニングにほぼ同じ次元のデータを採用する。
例えば、2Dオブジェクト検出は通常、高コストで大量の2Dアノテーションデータを必要とする。
低次元タスクを監督するために高次元情報を使用することは、データセットのサイズを減らすための実現可能な方法である。
本研究では,物体検出とポーズ推定を同時に行うことができる次元低減認知モデルであるdr-wlcを提案する。
このモデルは、トレーニングを終えるために、オブジェクトの3dモデルと(オブジェクトの有無に関わらず)ラベルのない環境イメージのみを必要とする。
さらに,3次元モデルと2次元物体検出タスクの関係を構築するためのバウンディングボックス生成戦略も提案されている。
実験の結果,本手法では手作業によるアノテーションを使わずに作業の資格を確保でき,実用アプリケーションへのデプロイが容易であることがわかった。
ソースコードはhttps://github.com/IN2-ViAUn/DR-WLCにある。
関連論文リスト
- STONE: A Submodular Optimization Framework for Active 3D Object Detection [20.54906045954377]
正確な3Dオブジェクト検出器をトレーニングするための鍵となる要件は、大量のLiDARベースのポイントクラウドデータが利用できることである。
本稿では,3次元物体検出装置のトレーニングにおけるラベル付けコストを大幅に削減する,統合されたアクティブな3次元物体検出フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-04T20:45:33Z) - Generalized Few-Shot 3D Object Detection of LiDAR Point Cloud for
Autonomous Driving [91.39625612027386]
我々は,一般的な(ベース)オブジェクトに対して大量のトレーニングデータを持つが,レア(ノーベル)クラスに対してはごく少数のデータしか持たない,一般化された数発の3Dオブジェクト検出という新しいタスクを提案する。
具体的には、画像と点雲の奥行きの違いを分析し、3D LiDARデータセットにおける少数ショット設定の実践的原理を示す。
この課題を解決するために,既存の3次元検出モデルを拡張し,一般的なオブジェクトと稀なオブジェクトの両方を認識するためのインクリメンタルな微調整手法を提案する。
論文 参考訳(メタデータ) (2023-02-08T07:11:36Z) - Objects as Spatio-Temporal 2.5D points [5.588892124219713]
本研究では,ネットワークの単一フィードフォワードパスにおける2次元物体検出シーンの深度予測を協調学習することにより,物体の3次元位置を推定する弱い教師付き手法を提案する。
提案手法は,単点型オブジェクト検出装置を拡張し,各オブジェクトを時間的にBEVとしてモデル化し,クエリ時に3DやBEVアノテーションやLiDARデータを必要としない新しいオブジェクト表現を提案する。
論文 参考訳(メタデータ) (2022-12-06T05:14:30Z) - Unseen Object 6D Pose Estimation: A Benchmark and Baselines [62.8809734237213]
本稿では,新しい物体の6次元ポーズ推定をアルゴリズムで行えるようにするための新しいタスクを提案する。
実画像と合成画像の両方でデータセットを収集し、テストセットで最大48個の未確認オブジェクトを収集する。
エンド・ツー・エンドの3D対応ネットワークをトレーニングすることにより、未確認物体と部分ビューRGBD画像との対応点を高精度かつ効率的に見つけることができる。
論文 参考訳(メタデータ) (2022-06-23T16:29:53Z) - RandomRooms: Unsupervised Pre-training from Synthetic Shapes and
Randomized Layouts for 3D Object Detection [138.2892824662943]
有望な解決策は、CADオブジェクトモデルで構成される合成データセットをよりよく利用して、実際のデータセットでの学習を促進することである。
最近の3次元事前学習の研究は、合成物体から他の実世界の応用へ学習した伝達特性が失敗することを示している。
本研究では,この目的を達成するためにRandomRoomsという新しい手法を提案する。
論文 参考訳(メタデータ) (2021-08-17T17:56:12Z) - Learning Geometry-Guided Depth via Projective Modeling for Monocular 3D Object Detection [70.71934539556916]
射影モデルを用いて幾何学誘導深度推定を学習し, モノクル3次元物体検出を推し進める。
具体的には,モノクロ3次元物体検出ネットワークにおける2次元および3次元深度予測の投影モデルを用いた原理的幾何式を考案した。
本手法は, 適度なテスト設定において, 余分なデータを2.80%も加えることなく, 最先端単分子法の検出性能を著しく向上させる。
論文 参考訳(メタデータ) (2021-07-29T12:30:39Z) - PLUME: Efficient 3D Object Detection from Stereo Images [95.31278688164646]
既存の手法では、2つのステップでこの問題に対処する: 第一深度推定を行い、その深さ推定から擬似LiDAR点雲表現を計算し、3次元空間で物体検出を行う。
この2つのタスクを同一のメトリック空間で統一するモデルを提案する。
提案手法は,既存の手法と比較して推定時間を大幅に削減し,挑戦的なKITTIベンチマークの最先端性能を実現する。
論文 参考訳(メタデータ) (2021-01-17T05:11:38Z) - 3D for Free: Crossmodal Transfer Learning using HD Maps [36.70550754737353]
最新の2Dデータセットの大規模なクラスタコノミクスと、最先端2D検出手法の堅牢性を活用している。
私たちは、自動運転車からラベルのないマルチモーダル運転ログ1151のコレクションをマイニングしています。
よりラベルのないデータをマイニングすることにより,検出器の性能が向上することを示す。
論文 参考訳(メタデータ) (2020-08-24T17:54:51Z) - DOPS: Learning to Detect 3D Objects and Predict their 3D Shapes [54.239416488865565]
LIDARデータに対する高速な1段3次元物体検出法を提案する。
我々の手法の中核となる新規性は高速かつシングルパスアーキテクチャであり、どちらも3次元の物体を検出し、それらの形状を推定する。
提案手法は,ScanNetシーンのオブジェクト検出で5%,オープンデータセットでは3.4%の精度で結果が得られた。
論文 参考訳(メタデータ) (2020-04-02T17:48:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。