論文の概要: Monocular 3D Object Detection using Multi-Stage Approaches with
Attention and Slicing aided hyper inference
- arxiv url: http://arxiv.org/abs/2212.11804v1
- Date: Thu, 22 Dec 2022 15:36:07 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-23 13:50:04.905780
- Title: Monocular 3D Object Detection using Multi-Stage Approaches with
Attention and Slicing aided hyper inference
- Title(参考訳): 注意とスライシング支援ハイパー推論を用いた多段階アプローチによる単眼3次元物体検出
- Authors: Abonia Sojasingarayar, Ashish Patel
- Abstract要約: 3Dオブジェクト検出は、世界のオブジェクトのサイズ、向き、位置をキャプチャできるため、不可欠です。
拡張現実(Augmented Reality, AR)や自動運転車、ロボットなど、現実世界のアプリケーションでは、この3D検出が利用できるようになるでしょう。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: 3D object detection is vital as it would enable us to capture objects' sizes,
orientation, and position in the world. As a result, we would be able to use
this 3D detection in real-world applications such as Augmented Reality (AR),
self-driving cars, and robotics which perceive the world the same way we do as
humans. Monocular 3D Object Detection is the task to draw 3D bounding box
around objects in a single 2D RGB image. It is localization task but without
any extra information like depth or other sensors or multiple images. Monocular
3D object detection is an important yet challenging task. Beyond the
significant progress in image-based 2D object detection, 3D understanding of
real-world objects is an open challenge that has not been explored extensively
thus far. In addition to the most closely related studies.
- Abstract(参考訳): 3dオブジェクト検出は、オブジェクトのサイズ、方向、および世界の位置をキャプチャできるため、不可欠です。
結果として、拡張現実(Augmented Reality, AR)や自動運転車、そして人間と同じように世界を知覚するロボット工学といった現実世界の応用で、この3D検出を利用できるようになるでしょう。
モノクロ3Dオブジェクト検出は、単一の2D RGBイメージでオブジェクトの周りに3Dバウンディングボックスを描画するタスクである。
ローカライズ作業だが、奥行きなどのセンサーや複数の画像などの追加情報がない。
モノクロ3Dオブジェクト検出は重要な課題である。
画像に基づく2dオブジェクト検出の大幅な進歩以外にも、現実世界のオブジェクトの3d理解は、これまで広く研究されていないオープンチャレンジである。
また、最も密接な研究も行った。
関連論文リスト
- Counting Stacked Objects from Multi-View Images [57.68870743111393]
本稿では,タスクを2つの相補的なサブプロブレムに分解する新しい3Dカウント手法を提案する。
幾何学的再構成と深層学習に基づく深度解析を組み合わせることで,コンテナ内の同一物体を正確にカウントすることができる。
多様な実世界および大規模合成データセット上での3Dカウントパイプラインの検証を行う。
論文 参考訳(メタデータ) (2024-11-28T13:51:16Z) - Improving Distant 3D Object Detection Using 2D Box Supervision [97.80225758259147]
遠方の物体の欠損した深さを回復するフレームワークであるLR3Dを提案する。
我々のフレームワークは汎用的であり、3D検出手法を広く活用する可能性がある。
論文 参考訳(メタデータ) (2024-03-14T09:54:31Z) - SurroundOcc: Multi-Camera 3D Occupancy Prediction for Autonomous Driving [98.74706005223685]
3Dシーン理解は、視覚に基づく自動運転において重要な役割を果たす。
マルチカメラ画像を用いたSurroundOcc法を提案する。
論文 参考訳(メタデータ) (2023-03-16T17:59:08Z) - OmniObject3D: Large-Vocabulary 3D Object Dataset for Realistic
Perception, Reconstruction and Generation [107.71752592196138]
OmniObject3Dを提案する。OmniObject3Dは,大規模で高品質な3Dオブジェクトを持つ大語彙の3Dオブジェクトデータセットである。
190のカテゴリーで6,000のスキャン対象からなり、一般的な2Dデータセットと共通クラスを共有する。
それぞれの3Dオブジェクトは、2Dと3Dの両方のセンサーでキャプチャされ、テクスチャメッシュ、ポイントクラウド、マルチビューレンダリング画像、複数の実写ビデオを提供する。
論文 参考訳(メタデータ) (2023-01-18T18:14:18Z) - 3D Object Aided Self-Supervised Monocular Depth Estimation [5.579605877061333]
本研究では,モノクロ3次元物体検出による動的物体の動きに対処する新しい手法を提案する。
具体的には、まず画像中の3Dオブジェクトを検出し、検出されたオブジェクトのポーズと動的ピクセル間の対応性を構築する。
このようにして、各ピクセルの深さは有意義な幾何学モデルによって学習することができる。
論文 参考訳(メタデータ) (2022-12-04T08:52:33Z) - TANDEM3D: Active Tactile Exploration for 3D Object Recognition [16.548376556543015]
触覚信号を用いた3次元物体認識のための協調学習フレームワークであるTANDEM3Dを提案する。
TANDEM3Dは、PointNet++を使って接触位置と正規値から3Dオブジェクト表現を構築する新しいエンコーダに基づいている。
本手法はシミュレーションで完全に訓練され,実世界の実験で検証される。
論文 参考訳(メタデータ) (2022-09-19T05:54:26Z) - Aerial Monocular 3D Object Detection [67.20369963664314]
DVDETは2次元画像空間と3次元物理空間の両方で空中単分子3次元物体検出を実現するために提案される。
高度視差変形問題に対処するため,新しい測地変形変換モジュールを提案する。
より多くの研究者がこの領域を調査するよう促すため、データセットと関連するコードをリリースします。
論文 参考訳(メタデータ) (2022-08-08T08:32:56Z) - Graph-DETR3D: Rethinking Overlapping Regions for Multi-View 3D Object
Detection [17.526914782562528]
グラフ構造学習(GSL)による多視点画像情報を自動的に集約するグラフDETR3Dを提案する。
我々の最良のモデルは、nuScenesテストリーダーボード上で49.5 NDSを達成し、様々な画像ビュー3Dオブジェクト検出器と比較して新しい最先端技術を実現している。
論文 参考訳(メタデータ) (2022-04-25T12:10:34Z) - FCOS3D: Fully Convolutional One-Stage Monocular 3D Object Detection [78.00922683083776]
一般的な2D検出器をこの3Dタスクで動作させることは簡単ではない。
本報告では,完全畳み込み型単段検出器を用いた手法を用いてこの問題を考察する。
私たちのソリューションは、NeurIPS 2020のnuScenes 3D検出チャレンジのすべてのビジョンのみの方法の中で1位を獲得します。
論文 参考訳(メタデータ) (2021-04-22T09:35:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。