Fugu-MT 論文翻訳(概要): SEF-MAP: Subspace-Decomposed Expert Fusion for Robust Multimodal HD Map Prediction

論文の概要: SEF-MAP: Subspace-Decomposed Expert Fusion for Robust Multimodal HD Map Prediction

arxiv url: http://arxiv.org/abs/2602.21589v1
Date: Wed, 25 Feb 2026 05:32:23 GMT
ステータス: 翻訳完了
システム内更新日: 2026-02-26 18:19:16.713181
Title: SEF-MAP: Subspace-Decomposed Expert Fusion for Robust Multimodal HD Map Prediction
Title（参考訳）: SEF-MAP:ロバストなマルチモーダルHDマップ予測のためのサブスペース分解型エキスパートフュージョン
Authors: Haoxiang Fu, Lingfeng Zhang, Hao Li, Ruibing Hu, Zhengrong Li, Guanjing Liu, Zimu Tan, Long Chen, Hangjun Ye, Xiaoshuai Hao,
Abstract要約: 堅牢なマルチモーダルHDマップ予測のためのサブスペース・エクスプット・フュージョンフレームワークSEFMAPを提案する。主要なアイデアは、BEV機能を4つのセマンティックサブスペース(LiDAR-private、Image-private、Shared、Interaction)にまとめることである。 nuScenesとArgoverse2ベンチマークの実験は、SEFMAPが最先端のパフォーマンスを達成することを示した。
参考スコア（独自算出の注目度）: 14.515804493179482
License: http://creativecommons.org/licenses/by/4.0/
Abstract: High-definition (HD) maps are essential for autonomous driving, yet multi-modal fusion often suffers from inconsistency between camera and LiDAR modalities, leading to performance degradation under low-light conditions, occlusions, or sparse point clouds. To address this, we propose SEFMAP, a Subspace-Expert Fusion framework for robust multimodal HD map prediction. The key idea is to explicitly disentangle BEV features into four semantic subspaces: LiDAR-private, Image-private, Shared, and Interaction. Each subspace is assigned a dedicated expert, thereby preserving modality-specific cues while capturing cross-modal consensus. To adaptively combine expert outputs, we introduce an uncertainty-aware gating mechanism at the BEV-cell level, where unreliable experts are down-weighted based on predictive variance, complemented by a usage balance regularizer to prevent expert collapse. To enhance robustness in degraded conditions and promote role specialization, we further propose distribution-aware masking: during training, modality-drop scenarios are simulated using EMA-statistical surrogate features, and a specialization loss enforces distinct behaviors of private, shared, and interaction experts across complete and masked inputs. Experiments on nuScenes and Argoverse2 benchmarks demonstrate that SEFMAP achieves state-of-the-art performance, surpassing prior methods by +4.2% and +4.8% in mAP, respectively. SEF-MAPprovides a robust and effective solution for multi-modal HD map prediction under diverse and degraded conditions.
Abstract（参考訳）: ハイデフィニション(HD)マップは自律走行には不可欠であるが、マルチモーダル融合はしばしばカメラとLiDARのモダリティの不整合に悩まされ、低照度条件、オクルージョン、スパース点雲による性能劣化を引き起こす。そこで本研究では,マルチモーダルHDマップのロバストな予測のためのサブスペース・エクスプット・フュージョンフレームワークSEFMAPを提案する。キーとなるアイデアは、BEV機能を4つのセマンティックサブスペース(LiDAR-private、Image-private、Shared、Interaction)に明示的に分離することだ。各部分空間には専用の専門家が割り当てられており、モダリティ固有の手がかりを保ちながら、クロスモーダルなコンセンサスを捉えている。専門家の出力を適応的に組み合わせるために,不確実性を考慮したゲーティング機構をBEVセルレベルで導入する。劣化条件の堅牢性を高め, 役割の専門化を促進するために, さらに, トレーニング中は, EMA統計代行機能を用いてモダリティ・ドロップシナリオをシミュレートし, 特殊化損失は, 完全かつマスキングされた入力に対して, 個人的, 共有的, 相互作用の専門家の異なる振る舞いを強制する。 nuScenes と Argoverse2 ベンチマークの実験では、SEFMAP は、それぞれ mAP の 4.2% と +4.8% を上回り、最先端のパフォーマンスを達成している。 SEF-MAPは多変量および劣化条件下でのマルチモーダルHDマップ予測のための堅牢で効果的な解法である。

関連論文リスト

HBridge: H-Shape Bridging of Heterogeneous Experts for Unified Multimodal Understanding and Generation [72.69742127579508]
最近の統一モデルでは、理解の専門家(LLMなど)と生成の専門家(拡散モデルなど)を統合している。本研究では,非対称なH字型アーキテクチャであるHBridgeを提案する。複数のベンチマークにわたる大規模な実験は、HBridgeの有効性と優れた性能を示している。
論文参考訳（メタデータ） (2025-11-25T17:23:38Z)
Beyond Redundancy: Diverse and Specialized Multi-Expert Sparse Autoencoder [59.89996751196727]
スパースオートエンコーダ(SAE)は、大規模な言語モデルを解釈するための強力なツールとして登場した。 SAEの隠蔽層は、空間的制約を満たすために高い次元性を持ち、結果として禁止的なトレーニングと推論コストをもたらす。近年のMixture of Experts (MoE) アプローチは、SAEsによってゲートアクティベーションを持つより狭い専門家ネットワークにこの問題に対処しようとしている。本稿では,(1)専門化を促進するために意味的に重み付けされた専門家サブセットを同時に関与する複数の専門家活性化,(2)適応的な高周波スケーリングによって多様性を高める特徴スケーリングという2つの重要なイノベーションを提案する。
論文参考訳（メタデータ） (2025-11-07T22:19:34Z)
LEAF: A Robust Expert-Based Framework for Few-Shot Continual Event Detection [7.094483187879095]
LEAFは、連続イベント検出のための新しくて堅牢なエキスパートベースのフレームワークである。各専門家はローランク適応(LoRA)行列でパラメータ化される。セマンティックアウェアの専門家選択機構は、インスタンスを最も関係のある専門家に動的にルーティングし、専門家の専門化と知識干渉の低減を可能にする。
論文参考訳（メタデータ） (2025-09-29T10:00:25Z)
MapDiffusion: Generative Diffusion for Vectorized Online HD Map Construction and Uncertainty Estimation in Autonomous Driving [24.962900390344235]
自律運転はセンサデータから静的環境を理解する必要がある。伝統的な地図構築モデルは決定論的点推定を提供する。本研究では,ベクトル化可能な地図の完全な分布を学習する新しい生成手法であるMapDiffusionを提案する。
論文参考訳（メタデータ） (2025-07-29T01:16:40Z)
AdaMHF: Adaptive Multimodal Hierarchical Fusion for Survival Prediction [29.11927806428086]
AdaMHFは、効率的で包括的で調整された特徴抽出と融合のために設計されたフレームワークである。これは医療データのユニークさに特化しており、最小限のリソース消費で正確な予測を可能にする。 TCGAデータセットに対する大規模な実験は、AdaMHFが現在の最先端の手法を超越していることを示している。
論文参考訳（メタデータ） (2025-03-27T03:27:55Z)
Volume-Sorted Prediction Set: Efficient Conformal Prediction for Multi-Target Regression [9.559062601251464]
マルチターゲット回帰における不確実性のための新しい手法であるVolume-Sorted Prediction Set (VSPS)を紹介する。複雑な高次元設定における情報予測モデルを維持しながら,VSPSがより小さく,より多くの領域を生成することを示す。
論文参考訳（メタデータ） (2025-03-04T02:34:59Z)
PFSD: A Multi-Modal Pedestrian-Focus Scene Dataset for Rich Tasks in Semi-Structured Environments [73.80718037070773]
本稿では, 半構造化シーンに, nuScenesの形式を付加したマルチモーダルなPedestrian-Focused Sceneデータセットを提案する。また,密集・隠蔽シナリオにおける歩行者検出のためのHMFN(Hybrid Multi-Scale Fusion Network)を提案する。
論文参考訳（メタデータ） (2025-02-21T09:57:53Z)
Generative Edge Detection with Stable Diffusion [52.870631376660924]
エッジ検出は一般的に、主に識別法によって対処されるピクセルレベルの分類問題と見なされる。本稿では、事前学習した安定拡散モデルのポテンシャルを十分に活用して、GED(Generative Edge Detector)という新しい手法を提案する。複数のデータセットに対して広範な実験を行い、競争性能を達成する。
論文参考訳（メタデータ） (2024-10-04T01:52:23Z)
FSD-BEV: Foreground Self-Distillation for Multi-view 3D Object Detection [33.225938984092274]
本稿では,分散の相違を効果的に回避するFSD方式を提案する。また2つのポイントクラウド拡張(PCI)戦略を設計し、ポイントクラウドの幅を補う。マルチスケール・フォアグラウンド・エンハンスメント(MSFE)モジュールを開発し,マルチスケール・フォアグラウンドの特徴を抽出・融合する。
論文参考訳（メタデータ） (2024-07-14T09:39:44Z)
SOFARI: High-Dimensional Manifold-Based Inference [8.110522214647489]
我々は、高次元多様体に基づくSOFAR推論(SOFARI)と呼ばれる新しいアプローチを提案する。推論を可能にするために不可欠である基礎となるスティーフェル多様体構造を利用することで、SOFARIは潜在左因子ベクトルと特異値の両方に対して、容易に使用可能なバイアス補正推定器を提供する。本稿では,SOFARIの有効性を概説し,シミュレーション例による理論結果の正当化と,経済予測における実データの適用について述べる。
論文参考訳（メタデータ） (2023-09-26T16:01:54Z)
Consistency Regularization for Deep Face Anti-Spoofing [69.70647782777051]
顔認証システムでは、顔認証(FAS)が重要な役割を担っている。このエキサイティングな観察によって、異なる視点の特徴整合性を促進することが、FASモデルを促進するための有望な方法かもしれないと推測する。 FASにおけるEPCR(Embeddding-level and Prediction-level Consistency Regularization)とEPCR(Embeddding-level Consistency Regularization)を併用した。
論文参考訳（メタデータ） (2021-11-24T08:03:48Z)
Probabilistic electric load forecasting through Bayesian Mixture Density Networks [70.50488907591463]
確率的負荷予測(PLF)は、スマートエネルギーグリッドの効率的な管理に必要な拡張ツールチェーンの重要なコンポーネントです。ベイジアン混合密度ネットワークを枠とした新しいPLFアプローチを提案する。後方分布の信頼性と計算にスケーラブルな推定を行うため,平均場変動推定と深層アンサンブルを統合した。
論文参考訳（メタデータ） (2020-12-23T16:21:34Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。