Fugu-MT 論文翻訳(概要): Scene Reconstruction as Mapping Priors for 3D Detection

論文の概要: Scene Reconstruction as Mapping Priors for 3D Detection

arxiv url: http://arxiv.org/abs/2605.22997v1
Date: Thu, 21 May 2026 19:52:22 GMT
ステータス: 翻訳完了
システム内更新日: 2026-05-25 17:29:20.085234
Title: Scene Reconstruction as Mapping Priors for 3D Detection
Title（参考訳）: 3次元画像検出に先立つシーン再構成
Authors: Yang Fu, Yuliang Zou, Hao Xiang, Xin Huang, Yijing Bai, Chen Song, Weijing Shi, Govind Thattai, Dragomir Anguelov, Mingxing Tan, Yingwei Li,
Abstract要約: 本稿では,2つの主要な課題を克服して3次元検出を改善するために,マッピングを活用するスケーラブルなソリューションを提案する。まず、集約されたセンサデータから高密度マッピングを自動構築するパイプラインを導入し、人間のラベル付けの必要性を解消する。第2に,センサモードの異なるマッピング先行を効果的に統合する,新しいマッピング先行3次元検出フレームワークを設計する。
参考スコア（独自算出の注目度）: 36.881735507300185
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: In autonomous driving, mapping is critical for motion planning but remains an under-utilized resource for perception tasks such as 3D object detection. Maps can provide robust structural priors of the static environment, helping resolve ambiguities and correct for sensor data sparsity or noise, especially for distant objects or under adverse weather conditions. However, conventional High-Definition (HD) maps are resource-intensive to obtain and maintain, which presents a challenge for efficient, large-scale deployment. In this paper, we propose a scalable solution to systematically leverage mapping to improve 3D detection by overcoming two primary challenges. First, we introduce a pipeline to automatically build dense mapping priors from aggregated sensor data, eliminating the need for human labeling. Second, we design a novel Mapping Priors Augmented 3D Detection (MPA3D) framework to effectively integrate mapping priors with different sensor modalities. Extensive experiments on the Waymo Open Dataset demonstrate that our approach achieves new state-of-the-art results, proving the effectiveness of scalable reconstructed scene priors for enhancing 3D detection.
Abstract（参考訳）: 自律運転では、マッピングは運動計画において重要であるが、3Dオブジェクト検出のような知覚タスクの未利用資源として残されている。マップは静的環境の堅牢な構造的事前を提供し、あいまいさを解消し、センサーデータの空間性やノイズ、特に遠くの物体や悪天候下での修正に役立つ。しかし,従来のハイディフィニション (HD) マップは資源集約型であり,効率的な大規模展開が困難である。本稿では,2つの主要な課題を克服して3次元検出を改善するために,マッピングを体系的に活用するスケーラブルなソリューションを提案する。まず、集約されたセンサデータから高密度マッピングを自動構築するパイプラインを導入し、人間のラベル付けの必要性を解消する。第2に、センサの異なるマッピング先を効果的に統合するために、新しいMPA3Dフレームワークを設計する。 Waymo Open Datasetでの大規模な実験により、我々のアプローチが新しい最先端の成果を達成し、3D検出の強化にスケーラブルな再構成シーンの事前の有効性が証明された。

関連論文リスト

S-LAM3D: Segmentation-Guided Monocular 3D Object Detection via Feature Space Fusion [0.0]
モノクロ3Dオブジェクト検出は、使用する入力の性質のため、コンピュータビジョンの課題を表す。本稿では,事前計算されたセグメンテーション情報を挿入し,特徴空間に直接ファインダをファインダに注入して検出を誘導する分離戦略を提案する。提案手法はKITTI 3D Object Detection Benchmarkで評価され,RGB画像にのみ依存する等価なアーキテクチャをシーン内の小さなオブジェクトに対して実現している。
論文参考訳（メタデータ） (2025-09-07T10:14:56Z)
Divide and Conquer: Improving Multi-Camera 3D Perception with 2D Semantic-Depth Priors and Input-Dependent Queries [30.17281824826716]
既存の手法は、しばしば意味と深さの手がかりの相乗効果を無視し、分類と位置推定誤差をもたらす。本稿では,SemanticsとDepthを先行として活用した入力対応トランスフォーマーフレームワークを提案する。我々のアプローチは、意味と深さの事前を明示的にモデル化するS-Dを用いることで、オブジェクトの分類と位置推定の学習プロセスを阻害する。
論文参考訳（メタデータ） (2024-08-13T13:51:34Z)
Domain Generalization of 3D Object Detection by Density-Resampling [14.510085711178217]
ポイントクラウドベースの3Dオブジェクト検出は、新しいドメインギャップを持つデータに遭遇する際のパフォーマンス劣化に悩まされる。対象領域に対する3次元物体検出の一般化性を向上させるためのSDG法を提案する。本研究では,新しいデータ拡張手法を導入し,その方法論に新しいマルチタスク学習戦略を貢献する。
論文参考訳（メタデータ） (2023-11-17T20:01:29Z)
3DiffTection: 3D Object Detection with Geometry-Aware Diffusion Features [70.50665869806188]
3DiffTectionは、単一の画像から3Dオブジェクトを検出する最先端の方法である。拡散モデルを微調整し、単一の画像に条件付けされた新しいビュー合成を行う。さらに、検出監視により、ターゲットデータ上でモデルをトレーニングする。
論文参考訳（メタデータ） (2023-11-07T23:46:41Z)
AGO-Net: Association-Guided 3D Point Cloud Object Detection Network [86.10213302724085]
ドメイン適応によるオブジェクトの無傷な特徴を関連付ける新しい3D検出フレームワークを提案する。我々は,KITTIの3D検出ベンチマークにおいて,精度と速度の両面で最新の性能を実現する。
論文参考訳（メタデータ） (2022-08-24T16:54:38Z)
Improving 3D Object Detection with Channel-wise Transformer [58.668922561622466]
我々は手作りの最小限の設計で2段階の3Dオブジェクト検出フレームワーク(CT3D)を提案する。 CT3Dは、提案対応の埋め込みとチャンネルワイドコンテキストアグリゲーションを同時に行う。これはKITTIテスト3D検出ベンチマークで中等車カテゴリーで81.77%のAPを達成した。
論文参考訳（メタデータ） (2021-08-23T02:03:40Z)
ST3D: Self-training for Unsupervised Domain Adaptation on 3D ObjectDetection [78.71826145162092]
点雲からの3次元物体検出における教師なし領域適応のための新しい領域適応型自己学習パイプラインST3Dを提案する。当社のST3Dは、評価されたすべてのデータセットで最先端のパフォーマンスを達成し、KITTI 3Dオブジェクト検出ベンチマークで完全に監視された結果を超えます。
論文参考訳（メタデータ） (2021-03-09T10:51:24Z)
Reinforced Axial Refinement Network for Monocular 3D Object Detection [160.34246529816085]
モノクロ3次元物体検出は、2次元入力画像から物体の位置と特性を抽出することを目的としている。従来のアプローチでは、空間から3D境界ボックスをサンプリングし、対象オブジェクトと各オブジェクトの関係を推定するが、有効サンプルの確率は3D空間で比較的小さい。我々は,まず最初の予測から始めて,各ステップで1つの3dパラメータだけを変えて,基礎的真理に向けて徐々に洗練することを提案する。これは、いくつかのステップの後に報酬を得るポリシーを設計する必要があるため、最適化するために強化学習を採用します。
論文参考訳（メタデータ） (2020-08-31T17:10:48Z)
Improving 3D Object Detection through Progressive Population Based Augmentation [91.56261177665762]
本稿では3次元オブジェクト検出のためのデータ拡張ポリシーの設計を自動化するための最初の試みを示す。このアルゴリズムは,探索空間を狭め,過去の反復で発見された最良のパラメータを採用することで,拡張戦略の最適化を学習する。 PPBAは, 拡張のないベースライン3次元検出モデルよりも最大10倍のデータ効率が高く, ラベル付きモデルよりもはるかに少ない精度で3次元検出モデルが競合精度を達成できる可能性が示唆された。
論文参考訳（メタデータ） (2020-04-02T05:57:02Z)
SMOKE: Single-Stage Monocular 3D Object Detection via Keypoint Estimation [3.1542695050861544]
3Dの向きとオブジェクトの変換を推定することは、インフラストラクチャレスの自律走行と運転に不可欠である。 SMOKEと呼ばれる新しい3次元オブジェクト検出手法を提案する。構造的単純さにもかかわらず、提案するSMOKEネットワークは、KITTIデータセット上の既存のモノクル3D検出方法よりも優れている。
論文参考訳（メタデータ） (2020-02-24T08:15:36Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。