論文の概要: Objects are Different: Flexible Monocular 3D Object Detection
- arxiv url: http://arxiv.org/abs/2104.02323v1
- Date: Tue, 6 Apr 2021 07:01:28 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-07 14:07:03.865057
- Title: Objects are Different: Flexible Monocular 3D Object Detection
- Title(参考訳): オブジェクトは違う:フレキシブルなモノクロ3dオブジェクト検出
- Authors: Yunpeng Zhang, Jiwen Lu, Jie Zhou
- Abstract要約: そこで本研究では,乱れたオブジェクトを明示的に分離し,オブジェクト深度推定のための複数のアプローチを適応的に組み合わせたモノクル3次元オブジェクト検出のためのフレキシブルなフレームワークを提案する。
実験の結果,本手法はkittiベンチマークテストセットにおいて,中等度レベルが27%,硬度が30%と,最先端法を27%上回った。
- 参考スコア(独自算出の注目度): 87.82253067302561
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The precise localization of 3D objects from a single image without depth
information is a highly challenging problem. Most existing methods adopt the
same approach for all objects regardless of their diverse distributions,
leading to limited performance for truncated objects. In this paper, we propose
a flexible framework for monocular 3D object detection which explicitly
decouples the truncated objects and adaptively combines multiple approaches for
object depth estimation. Specifically, we decouple the edge of the feature map
for predicting long-tail truncated objects so that the optimization of normal
objects is not influenced. Furthermore, we formulate the object depth
estimation as an uncertainty-guided ensemble of directly regressed object depth
and solved depths from different groups of keypoints. Experiments demonstrate
that our method outperforms the state-of-the-art method by relatively 27\% for
the moderate level and 30\% for the hard level in the test set of KITTI
benchmark while maintaining real-time efficiency. Code will be available at
\url{https://github.com/zhangyp15/MonoFlex}.
- Abstract(参考訳): 深度情報のない単一画像からの3Dオブジェクトの正確な位置決定は、非常に難しい問題である。
既存のほとんどのメソッドは、様々な分布にかかわらず、すべてのオブジェクトに対して同じアプローチを採用しており、切り捨てられたオブジェクトのパフォーマンスが制限される。
本稿では, 乱れた物体を明示的に分離し, 物体深度推定のための複数のアプローチを適応的に組み合わせた, モノクロ3次元物体検出のための柔軟なフレームワークを提案する。
具体的には,長尾乱れオブジェクトを予測するための特徴マップのエッジを分離し,通常のオブジェクトの最適化に影響を与えないようにする。
さらに, 対象深度推定を, 直接回帰対象深さの不確実性誘導アンサンブルとして定式化し, 異なるキーポイント群からの深さを解いた。
実験により, 実時間効率を維持しつつ, KITTIベンチマークの試験セットにおいて, 適度レベルが27 %, ハードレベルが30 %, 最先端手法が27 %向上することを示した。
コードは \url{https://github.com/zhangyp15/MonoFlex} で入手できる。
関連論文リスト
- Depth-discriminative Metric Learning for Monocular 3D Object Detection [14.554132525651868]
本稿では,視覚的属性に関係なく,モデルが深度識別的特徴を抽出することを奨励する新しい計量学習手法を提案する。
本手法は, 各種ベースラインの性能を平均23.51%, 5.78%向上させる。
論文 参考訳(メタデータ) (2024-01-02T07:34:09Z) - What You See Is What You Detect: Towards better Object Densification in
3D detection [2.3436632098950456]
広く使われているフル形状のコンプリートアプローチは、特に遠く離れた物や歩行者のような小さな物に対して、エラーのアップバウンドを高くする。
従来の手法が生成した予測ポイントの11.3%しか必要としない可視部分補完法を提案する。
密表現を復元するために,目に見える前景オブジェクトに関連付けられた点集合を拡大するメッシュデフォーメーションに基づく手法を提案する。
論文 参考訳(メタデータ) (2023-10-27T01:46:37Z) - DORT: Modeling Dynamic Objects in Recurrent for Multi-Camera 3D Object
Detection and Tracking [67.34803048690428]
本稿では、この問題を解決するためにRecurrenT(DORT)の動的オブジェクトをモデル化することを提案する。
DORTは、重い計算負担を軽減する動き推定のために、オブジェクトワイズローカルボリュームを抽出する。
フレキシブルで実用的で、ほとんどのカメラベースの3Dオブジェクト検出器に差し込むことができる。
論文 参考訳(メタデータ) (2023-03-29T12:33:55Z) - 3D Video Object Detection with Learnable Object-Centric Global
Optimization [65.68977894460222]
対応性に基づく最適化は3次元シーン再構成の基盤となるが、3次元ビデオオブジェクト検出では研究されていない。
オブジェクト中心の時間対応学習と特徴量付きオブジェクトバンドル調整を備えた、エンドツーエンドで最適化可能なオブジェクト検出器であるBA-Detを提案する。
論文 参考訳(メタデータ) (2023-03-27T17:39:39Z) - LocPoseNet: Robust Location Prior for Unseen Object Pose Estimation [69.70498875887611]
LocPoseNetは、見えないオブジェクトに先立って、ロバストにロケーションを学習することができる。
提案手法は,LINEMOD と GenMOP において,既存の作業よりも優れた性能を示す。
論文 参考訳(メタデータ) (2022-11-29T15:21:34Z) - Diversity Matters: Fully Exploiting Depth Clues for Reliable Monocular
3D Object Detection [37.37316176663782]
本研究では,モノクロ3次元画像のサブタスクから視覚的手がかりを完全に探索する深度問題解決システムを提案する。
提案手法は,KITTIの3次元オブジェクト検出ベンチマークにおいて,テスト分割のモードレベルに対して,現行のベストメソッドを20%以上上回っている。
論文 参考訳(メタデータ) (2022-05-19T08:12:55Z) - ImpDet: Exploring Implicit Fields for 3D Object Detection [74.63774221984725]
我々は、境界ボックス回帰を暗黙の関数として見る新しい視点を導入する。
これは、Implicit DetectionまたはImpDetと呼ばれる提案されたフレームワークにつながります。
我々のImpDetは、異なる局所的な3次元空間の点に特定の値を割り当て、高品質な境界を生成することができる。
論文 参考訳(メタデータ) (2022-03-31T17:52:12Z) - ZebraPose: Coarse to Fine Surface Encoding for 6DoF Object Pose
Estimation [76.31125154523056]
物体表面を高密度に表現できる離散ディスクリプタを提案する。
また,微粒化対応予測が可能な微粒化学習戦略を提案する。
論文 参考訳(メタデータ) (2022-03-17T16:16:24Z) - Iterative Corresponding Geometry: Fusing Region and Depth for Highly
Efficient 3D Tracking of Textureless Objects [25.448657318818764]
ICGは領域と深度情報を融合させる新しい確率的トラッカーであり、物体形状のみを必要とする。
本手法では, 対応線を配置し, ポーズを反復的に洗練する。
YCB-Video、OPT、Choiデータセットの実験は、テクスチャ化されたオブジェクトであっても、我々のアプローチが現在の技術よりも優れていることを示した。
論文 参考訳(メタデータ) (2022-03-10T12:30:50Z) - Few-Shot Object Detection and Viewpoint Estimation for Objects in the
Wild [40.132988301147776]
少数ショットオブジェクト検出と少数ショット視点推定の問題に対処する。
両タスクにおいて,データから抽出したクラス表現機能を用いて,ネットワーク予測を導出する利点を実証する。
提案手法は,様々なデータセットに対して,最先端の手法よりも広いマージンで性能を向上する。
論文 参考訳(メタデータ) (2020-07-23T16:17:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。