論文の概要: CHARM3R: Towards Unseen Camera Height Robust Monocular 3D Detector
- arxiv url: http://arxiv.org/abs/2508.11185v1
- Date: Fri, 15 Aug 2025 03:27:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-18 14:51:23.728439
- Title: CHARM3R: Towards Unseen Camera Height Robust Monocular 3D Detector
- Title(参考訳): CHARM3R:目立たないカメラでロバストなモノクロ3D検出器を目指す
- Authors: Abhinav Kumar, Yuliang Guo, Zhihao Zhang, Xinyu Huang, Liu Ren, Xiaoming Liu,
- Abstract要約: 単眼の3Dオブジェクト検出器は、一方のエゴカメラの高さからのデータに効果があるが、見えないカメラの高さや分布外カメラの高さに苦戦している。
既存の方法は、しばしばPluckerの埋め込み、画像変換、データ拡張に依存している。
本稿では、まず、カメラ高さの変化が最新式(SoTA)Mono3Dモデルに与える影響について検討する。
- 参考スコア(独自算出の注目度): 23.669656655302703
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Monocular 3D object detectors, while effective on data from one ego camera height, struggle with unseen or out-of-distribution camera heights. Existing methods often rely on Plucker embeddings, image transformations or data augmentation. This paper takes a step towards this understudied problem by first investigating the impact of camera height variations on state-of-the-art (SoTA) Mono3D models. With a systematic analysis on the extended CARLA dataset with multiple camera heights, we observe that depth estimation is a primary factor influencing performance under height variations. We mathematically prove and also empirically observe consistent negative and positive trends in mean depth error of regressed and ground-based depth models, respectively, under camera height changes. To mitigate this, we propose Camera Height Robust Monocular 3D Detector (CHARM3R), which averages both depth estimates within the model. CHARM3R improves generalization to unseen camera heights by more than $45\%$, achieving SoTA performance on the CARLA dataset. Codes and Models at https://github.com/abhi1kumar/CHARM3R
- Abstract(参考訳): 単眼の3Dオブジェクト検出器は、一方のエゴカメラの高さからのデータに効果があるが、見えないカメラの高さや分布外カメラの高さに苦戦している。
既存の方法は、しばしばPluckerの埋め込み、画像変換、データ拡張に依存している。
本稿では、まず、カメラ高さの変化が最新式(SoTA)Mono3Dモデルに与える影響について検討する。
複数のカメラ高さを持つ拡張CARLAデータセットのシステマティック解析により,深さ推定が高さ変動による性能への影響を主要因とすることがわかった。
我々は, カメラの高さ変化の下で, 回帰モデルと接地深度モデルの平均深度誤差における一貫した負の傾向と正の傾向を数学的に証明し, 実証的に観察する。
これを軽減するために、モデル内の両方の深さ推定を平均化するカメラハイトロバストモノクロ3D検出器(CHARM3R)を提案する。
CHARM3Rは、CARLAデータセット上でSoTAのパフォーマンスを達成し、カメラの高さが見えないように一般化を45\%以上改善する。
Codes and Models at https://github.com/abhi1kumar/CHARM3R
関連論文リスト
- UniK3D: Universal Camera Monocular 3D Estimation [62.06785782635153]
カメラをモデル化可能なモノクル3D推定法として,UniK3Dを提案する。
本手法では, 球面3次元表現を導入し, カメラとシーンの形状をよりよく切り離すことができる。
13の多様なデータセットに対する包括的なゼロショット評価は、3D、ディープ、カメラメトリクスにわたるUniK3Dの最先端のパフォーマンスを示している。
論文 参考訳(メタデータ) (2025-03-20T17:49:23Z) - CameraHMR: Aligning People with Perspective [54.05758012879385]
モノクロ画像からの正確な3次元ポーズと形状推定の課題に対処する。
既存のトレーニングデータセットには、擬似基底真理(pGT)を持つ実画像が含まれている。
pGTの精度を向上させる2つの貢献をしている。
論文 参考訳(メタデータ) (2024-11-12T19:12:12Z) - Rotation Matters: Generalized Monocular 3D Object Detection for Various
Camera Systems [15.47493325786152]
トレーニングデータセットをキャプチャするシステムとは異なるカメラシステムに適用した場合、3Dオブジェクト検出性能は大幅に低下する。
乗客の車のデータセットに基づいて訓練された3D検出器は、バスに搭載されたカメラの正確な3Dバウンディングボックスを後退させるのにほとんど失敗する。
本稿では,様々なカメラシステムに適用可能な汎用3次元物体検出手法を提案する。
論文 参考訳(メタデータ) (2023-10-09T02:52:22Z) - Monocular 3D Object Detection with Depth from Motion [74.29588921594853]
我々は、正確な物体深度推定と検出にカメラエゴモーションを利用する。
我々のフレームワークはDfM(Depth from Motion)と呼ばれ、2D画像の特徴を3D空間に持ち上げて3Dオブジェクトを検出する。
我々のフレームワークは、KITTIベンチマークにおいて最先端の手法よりも大きなマージンで優れている。
論文 参考訳(メタデータ) (2022-07-26T15:48:46Z) - Towards Model Generalization for Monocular 3D Object Detection [57.25828870799331]
我々は,Mono3Dオブジェクト検出に有効な統合カメラ一般化パラダイム(CGP)を提案する。
また,インスタンスレベルの拡張によりギャップを埋める2D-3D幾何一貫性オブジェクトスケーリング戦略(GCOS)を提案する。
DGMono3Dと呼ばれる手法は、評価された全てのデータセットに対して顕著な性能を達成し、SoTAの教師なしドメイン適応スキームを上回ります。
論文 参考訳(メタデータ) (2022-05-23T23:05:07Z) - MonoCInIS: Camera Independent Monocular 3D Object Detection using
Instance Segmentation [55.96577490779591]
大規模で異質なトレーニングデータを活用するためには、"カメラ独立"の度合いが必要である。
大規模で異質なトレーニングデータの恩恵を受けるためには、より多くのデータがパフォーマンスを自動で保証するのではなく、"カメラ独立"の度合いを持つ必要がある。
論文 参考訳(メタデータ) (2021-10-01T14:56:37Z) - MetaPose: Fast 3D Pose from Multiple Views without 3D Supervision [72.5863451123577]
正確な3Dポーズとカメラ推定が可能なニューラルモデルをトレーニングする方法を示す。
本手法は,古典的バンドル調整と弱教師付き単分子3Dベースラインの両方に優れる。
論文 参考訳(メタデータ) (2021-08-10T18:39:56Z) - Geometry-aware data augmentation for monocular 3D object detection [18.67567745336633]
本稿では,自動運転システムにおける必須モジュールの一つであるモノキュラー3次元物体検出について述べる。
重要な課題は、深さ回復問題は単眼データに不備があることです。
我々は,既存の手法が,異なる幾何学的シフトが発生した場合の深さをロバストに推定できないことを明らかにするために,詳細な解析を行う。
上記の操作を,対応する4つの3D対応データ拡張手法に変換する。
論文 参考訳(メタデータ) (2021-04-12T23:12:48Z) - Height estimation from single aerial images using a deep ordinal
regression network [12.991266182762597]
単体画像からの高度推定の曖昧で未解決な問題に対処する。
深層学習、特に深層畳み込みニューラルネットワーク(CNN)の成功により、いくつかの研究は、単一の空中画像から高さ情報を推定することを提案した。
本稿では,高さ値を間隔増加間隔に分割し,回帰問題を順序回帰問題に変換することを提案する。
論文 参考訳(メタデータ) (2020-06-04T12:03:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。