論文の概要: MonoPRIO: Adaptive Prior Conditioning for Unified Monocular 3D Object Detection
- arxiv url: http://arxiv.org/abs/2605.14781v1
- Date: Thu, 14 May 2026 12:50:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-15 21:45:34.827945
- Title: MonoPRIO: Adaptive Prior Conditioning for Unified Monocular 3D Object Detection
- Title(参考訳): MonoPRIO: 統一されたモノクロ3Dオブジェクト検出のための適応的事前条件付け
- Authors: Leon Davies, Qinggang Meng, Mohamad Saada, Baihua Li, Simon Sølvsten,
- Abstract要約: 適応型事前条件付けにより,このボトルネックを狙う統一単分子3D検出器MonoPRIOを提案する。
MonoPRIOは、クラス対応サイズのプロトタイプをオフラインで構築し、デコーダクエリを事前にソフトミックスにルーティングする。
完全なCar、Pedestrian、Cyclistのメトリクスを報告するメソッドの中で、最も強力な完全に報告された統一されたマルチクラス結果を達成する。
- 参考スコア(独自算出の注目度): 2.282939711931315
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Monocular 3D object detection remains challenging because metric size and depth are underdetermined by single-view evidence, particularly under occlusion, truncation, and projection-induced scale-depth ambiguity. Although recent methods improve depth and geometric reasoning, metric size remains unstable in unified multi-class settings, where class variability and partial visibility broaden plausible size modes. We propose MonoPRIO, a unified monocular 3D detector that targets this bottleneck through adaptive prior conditioning in the size pathway. MonoPRIO constructs class-aware size prototypes offline, routes each decoder query to a soft mixture prior, applies uncertainty-aware log-space conditioning, and uses Cluster-Aligned Prior (CAP) regularisation on matched positives during training. On the official KITTI test server, MonoPRIO achieves the strongest fully reported unified multi-class result among methods reporting complete Car, Pedestrian, and Cyclist metrics. In the car-only setting, it also achieves the strongest 3D bounding-box AP across Easy/Moderate/Hard categories among compared methods without extra data, while using substantially less compute than MonoCLUE. Ablations and diagnostics show complementary gains from routed injection and CAP, with the largest benefits in ambiguity-prone, partially occluded, and low-data regimes. These findings indicate that adaptive priors are most effective when image evidence underdetermines metric size, while atypical geometry or extreme visibility loss can still cause mismatch between routed priors and true instance geometry. Code, trained models, result logs, and reproducibility material are available at https://github.com/bigggs/MonoPRIO.
- Abstract(参考訳): なぜなら、メートル法の大きさと深さは、特に閉塞、切り離し、および射影誘起のスケール-深さのあいまいさの下で、単視点の証拠によって過小評価されるからである。
近年の手法は深度と幾何的推論を改善するが、統一された多クラス設定ではメートル法のサイズは不安定であり、クラス変数と部分的な可視性は可視的なサイズモードを広げる。
サイズパスの適応的事前条件付けにより、このボトルネックを狙う統一された単分子3D検出器であるMonoPRIOを提案する。
MonoPRIOは、クラス対応サイズのプロトタイプをオフラインで構築し、各デコーダクエリを事前にソフトミックスにルーティングし、不確実性対応のログスペース条件を適用し、トレーニング中に一致した正に対してクラスタアラインドプライオリティ(CAP)正規化を使用する。
公式のKITTIテストサーバでは、完全なCar、Pedestrian、Cyclistメトリクスをレポートするメソッドの中で、MonoPRIOは最も強力な完全に報告された統一されたマルチクラス結果を達成する。
自動車のみの設定では、MonoCLUEよりも計算量が大幅に少ないのに対して、比較対象のメソッドのうち、Easy/Moderate/Hardカテゴリで最強の3DバウンディングボックスAPを実現している。
アブレーションと診断は、経路注入とCAPの相補的な増加を示し、あいまい性、部分閉塞、低データ体制の最大の利点である。
これらの結果は、画像証拠がメートル法のサイズを決定づける際、適応的先行は最も効果的であることを示しているが、非定型的幾何や極端視認性損失は、経路付き先行と真のインスタンス幾何のミスマッチを引き起こす可能性がある。
コード、トレーニングされたモデル、結果ログ、再現性材料はhttps://github.com/bigggs/MonoPRIO.comで入手できる。
関連論文リスト
- MonoSAOD: Monocular 3D Object Detection with Sparsely Annotated Label [18.96639950492612]
本稿では,2つのキーモジュールを用いた特異な注釈付きモノクロ3Dオブジェクト検出のための新しいフレームワークを提案する。
RAPAは3次元の幾何的一貫性を維持しながら、分割されたオブジェクトパッチを道路領域に拡張する。
PBFはプロトタイプの類似性と深さの不確実性によって予測をフィルタリングすることで高品質な擬似ラベルを生成する。
トレーニング戦略は,幾何保存強化とプロトタイプ誘導擬似ラベルを組み合わせることで,疎度監視下で頑健な検出を実現する。
論文 参考訳(メタデータ) (2026-04-02T05:43:57Z) - Unified Unsupervised Anomaly Detection via Matching Cost Filtering [113.43366521994396]
教師なし異常検出(UAD)は、通常のトレーニングデータのみを用いて画像レベルの異常と画素レベルの異常を識別することを目的としている。
UADモデルの異常コスト量を補正するための汎用的なポストホック精錬フレームワークであるUnified Cost Filtering (UCF) を提案する。
論文 参考訳(メタデータ) (2025-10-03T03:28:18Z) - UniDepth: Universal Monocular Metric Depth Estimation [81.80512457953903]
ドメインをまたいだ単一の画像からメートル法3Dシーンを再構成できる新しいモデルUniDepthを提案する。
我々のモデルは擬似球面出力表現を利用しており、カメラと奥行きの表現を歪めている。
ゼロショット方式における10のデータセットの詳細な評価は、一貫してUniDepthの優れた性能を示している。
論文 参考訳(メタデータ) (2024-03-27T18:06:31Z) - Rethinking Few-shot 3D Point Cloud Semantic Segmentation [62.80639841429669]
本稿では,FS-PCSによる3Dポイント・クラウドセマンティックセマンティックセグメンテーションについて再検討する。
我々は、最先端の2つの重要な問題、前景の漏洩とスパースポイントの分布に焦点をあてる。
これらの問題に対処するために、新しいベンチマークを構築するための標準化されたFS-PCS設定を導入する。
論文 参考訳(メタデータ) (2024-03-01T15:14:47Z) - MonoSKD: General Distillation Framework for Monocular 3D Object
Detection via Spearman Correlation Coefficient [11.48914285491747]
既存のモノクロ3D検出知識蒸留法は、通常、LiDARをイメージプレーンに投射し、それに従って教師ネットワークを訓練する。
本研究では,スピアマン相関係数に基づくモノクル3次元検出のための新しい知識蒸留フレームワークMonoSKDを提案する。
提案フレームワークは,推論計算コストを加算せずに提案するまでの最先端性能を実現する。
論文 参考訳(メタデータ) (2023-10-17T14:48:02Z) - MoPA: Multi-Modal Prior Aided Domain Adaptation for 3D Semantic
Segmentation [38.42077782990957]
マルチモーダル・アン教師付きドメイン適応(MM-UDA)は、高価なポイントワイドアノテーションを使わずに自律システムに意味理解を組み込むための実用的なソリューションである。
従来のMM-UDAメソッドは、クラス不均衡な性能に悩まされ、実際のアプリケーションでの利用を制限する。
本稿では,レアオブジェクトの性能向上を目的としたマルチモーダルプライオリティ・エイドド(MoPA)ドメイン適応を提案する。
論文 参考訳(メタデータ) (2023-09-21T07:30:21Z) - Weakly Supervised Monocular 3D Object Detection using Multi-View
Projection and Direction Consistency [78.76508318592552]
モノクロ3Dオブジェクト検出は、その容易なアプリケーションのための自動駆動において、主流のアプローチとなっている。
現在のほとんどの方法は、トレーニングフェーズで使用される真実をラベル付けするために、まだ3Dポイントのクラウドデータに依存しています。
画像にマークされた2次元ラベルだけでモデルを訓練できる,弱教師付きモノクル3次元オブジェクト検出法を提案する。
論文 参考訳(メタデータ) (2023-03-15T15:14:00Z) - Embracing Single Stride 3D Object Detector with Sparse Transformer [63.179720817019096]
自律走行のためのLiDARを用いた3次元物体検出では、物体サイズと入力シーンサイズとの比が2次元検出の場合に比べて有意に小さい。
多くの3D検出器は2D検出器の一般的な慣習に従っており、点雲の定量化後も特徴マップを分解する。
本稿では,SST(Single-stride Sparse Transformer)を提案する。
論文 参考訳(メタデータ) (2021-12-13T02:12:02Z) - Monocular 3D Detection with Geometric Constraints Embedding and
Semi-supervised Training [3.8073142980733]
我々は,KM3D-Netと呼ばれる,RGB画像のみを用いたモノクル3Dオブジェクト検出のための新しいフレームワークを提案する。
我々は、対象のキーポイント、次元、方向を予測するための完全な畳み込みモデルを設計し、これらの推定を視点幾何学的制約と組み合わせて位置属性を計算する。
論文 参考訳(メタデータ) (2020-09-02T00:51:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。