Fugu-MT 論文翻訳(概要): DiffMap: Enhancing Map Segmentation with Map Prior Using Diffusion Model

論文の概要: DiffMap: Enhancing Map Segmentation with Map Prior Using Diffusion Model

arxiv url: http://arxiv.org/abs/2405.02008v2
Date: Sun, 1 Sep 2024 05:02:01 GMT
ステータス: 翻訳完了
システム内更新日: 2024-09-04 18:30:43.174839
Title: DiffMap: Enhancing Map Segmentation with Map Prior Using Diffusion Model
Title（参考訳）: DiffMap: 拡散モデルを用いたマップによるマップセグメンテーションの強化
Authors: Peijin Jia, Tuopu Wen, Ziang Luo, Mengmeng Yang, Kun Jiang, Zhiquan Lei, Xuewei Tang, Ziyuan Liu, Le Cui, Bo Zhang, Long Huang, Diange Yang,
Abstract要約: DiffMapは,マップセグメンテーションマスクの構造をモデル化する新しい手法である。この手法を取り入れることで,既存のセマンティックセグメンテーション手法の性能を大幅に向上させることができる。本モデルは,実世界の地図レイアウトをより正確に反映した結果を生成する上で,優れた習熟度を示す。
参考スコア（独自算出の注目度）: 15.803614800117781
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Constructing high-definition (HD) maps is a crucial requirement for enabling autonomous driving. In recent years, several map segmentation algorithms have been developed to address this need, leveraging advancements in Bird's-Eye View (BEV) perception. However, existing models still encounter challenges in producing realistic and consistent semantic map layouts. One prominent issue is the limited utilization of structured priors inherent in map segmentation masks. In light of this, we propose DiffMap, a novel approach specifically designed to model the structured priors of map segmentation masks using latent diffusion model. By incorporating this technique, the performance of existing semantic segmentation methods can be significantly enhanced and certain structural errors present in the segmentation outputs can be effectively rectified. Notably, the proposed module can be seamlessly integrated into any map segmentation model, thereby augmenting its capability to accurately delineate semantic information. Furthermore, through extensive visualization analysis, our model demonstrates superior proficiency in generating results that more accurately reflect real-world map layouts, further validating its efficacy in improving the quality of the generated maps.
Abstract（参考訳）: 高精細(HD)マップの構築は、自動運転を実現する上で重要な要件である。近年,バードアイビュー(Bird's-Eye View,BEV)の認識の進歩を活用して,このニーズに対応するためにいくつかのマップセグメンテーションアルゴリズムが開発されている。しかし、既存のモデルは、現実的で一貫性のあるセマンティックマップレイアウトを作成する際の課題に直面している。 1つの顕著な問題は、マップセグメンテーションマスクに固有の構造化前駆体の限られた利用である。そこで本研究では,潜在拡散モデルを用いて,地図分割マスクの構造をモデル化する新しい手法DiffMapを提案する。この手法を取り入れることで、既存のセグメンテーション手法の性能を大幅に向上することができ、セグメンテーション出力に存在する特定の構造誤差を効果的に修正することができる。特に,提案モジュールは任意のマップセグメンテーションモデルにシームレスに統合することができ,セマンティック情報を正確に記述することができる。さらに, 広域可視化解析により, 実世界の地図レイアウトをより正確に反映し, 生成した地図の品質向上に有効であることを示す。

関連論文リスト

Generalizable Multiscale Segmentation of Heterogeneous Map Collections [0.0]
歴史的地図コレクションは、スタイル、スケール、地理的に非常に多様である。地図認識におけるほとんどの研究は、同種地図シリーズに合わせた専門モデルに焦点を当てている。さまざまな過去の地図文書を反映した1,439の注釈付きパッチからなる新しいオープンベンチマークデータセットであるSemapを紹介した。本稿では,手続き型データ合成とマルチスケール統合を組み合わせたセグメンテーションフレームワークを提案する。
論文参考訳（メタデータ） (2026-03-05T10:40:01Z)
CSMapping: Scalable Crowdsourced Semantic Mapping and Topology Inference for Autonomous Driving [23.921417146230738]
CSMappingは正確なセマンティックマップとトポロジカル道路中心線を生成する。 nuScenes、Argoverse 2、および大規模プロプライエタリデータセットに関する実験は、最先端のセマンティクスとトポロジマッピングのパフォーマンスを達成する。
論文参考訳（メタデータ） (2025-12-03T07:06:18Z)
SMOL-MapSeg: Show Me One Label [0.4499833362998489]
SMOL-MapSegはOND知識によって定義されたクラスを正確にセグメント化できることを示す。数ショットの微調整によって、目に見えないクラスにも適応できる。平均セグメンテーション性能では、UNetベースのベースラインを上回っている。
論文参考訳（メタデータ） (2025-08-07T15:36:17Z)
DiffuMatch: Category-Agnostic Spectral Diffusion Priors for Robust Non-rigid Shape Matching [53.39693288324375]
ネットワーク内正規化と関数型マップトレーニングの両方をデータ駆動方式に置き換えることができることを示す。まず、スコアベース生成モデルを用いてスペクトル領域における関数写像の生成モデルを訓練する。次に、得られたモデルを利用して、新しい形状コレクション上の基底真理汎関数写像の構造的特性を促進する。
論文参考訳（メタデータ） (2025-07-31T16:44:54Z)
Bridging Scales in Map Generation: A scale-aware cascaded generative mapping framework for seamless and consistent multi-scale cartographic representation [2.414525855161937]
マルチスケールタイルマップは地理情報サービスに不可欠であり、測量と地図の基本的な成果となる。現在のアプローチでは、動的マルチスケール生成と地図一般化原理の不十分な統合とタイルワイズ生成による空間的不連続の2つの根本的な課題に直面している。本研究では,条件付き誘導拡散とマルチスケールカスケードアーキテクチャを利用するスケール対応地図生成フレームワーク(SCGM)を提案する。
論文参考訳（メタデータ） (2025-02-07T15:11:31Z)
TopoSD: Topology-Enhanced Lane Segment Perception with SDMap Prior [70.84644266024571]
我々は、標準定義地図(SDMaps)を見るために知覚モデルを訓練することを提案する。我々はSDMap要素をニューラル空間マップ表現やインスタンストークンにエンコードし、先行情報のような補完的な特徴を組み込む。レーンセグメント表現フレームワークに基づいて、モデルはレーン、中心線、およびそれらのトポロジを同時に予測する。
論文参考訳（メタデータ） (2024-11-22T06:13:42Z)
MapSAM: Adapting Segment Anything Model for Automated Feature Detection in Historical Maps [6.414068793245697]
我々は,パラメータ効率のよい微調整戦略であるMapSAMを紹介した。具体的には、画像エンコーダにドメイン固有の知識を統合するために、Weight-Decomposed Low-Rank Adaptation (DoRA) を用いる。手動入力を必要としない自動プロンプト生成プロセスを開発した。
論文参考訳（メタデータ） (2024-11-11T13:18:45Z)
MaskInversion: Localized Embeddings via Optimization of Explainability Maps [49.50785637749757]
MaskInversionは、テスト時にマスクによって指定されたクエリ画像領域に対するコンテキスト認識の埋め込みを生成する。オープン語彙のクラス検索、表現理解の参照、局所的なキャプションや画像生成など、幅広いタスクに使用することができる。
論文参考訳（メタデータ） (2024-07-29T14:21:07Z)
ADMap: Anti-disturbance framework for reconstructing online vectorized HD map [9.218463154577616]
本稿では, 反ゆらぎマップ再構築フレームワーク (ADMap) を提案する。点次ジッタを緩和するため、このフレームワークは、マルチスケール知覚ネック、インスタンスインタラクティブアテンション(IIA)、ベクトル方向差損失(VDDL)の3つのモジュールで構成されている。
論文参考訳（メタデータ） (2024-01-24T01:37:27Z)
EmerDiff: Emerging Pixel-level Semantic Knowledge in Diffusion Models [52.3015009878545]
我々は、追加の訓練をすることなく、きめ細かなセグメンテーションマップを生成できる画像セグメンタを開発した。低次元特徴写像の空間的位置と画像画素間の意味的対応を同定する。大規模な実験では、生成したセグメンテーションマップがよく説明され、画像の細部を捉えることが示されている。
論文参考訳（メタデータ） (2024-01-22T07:34:06Z)
Stochastic Segmentation with Conditional Categorical Diffusion Models [3.8168879948759953]
Denoising Diffusion Probabilistic Models に基づくセマンティックセグメンテーションのための条件カテゴリー拡散モデル(CCDM)を提案する。以上の結果から,CCDMはLIDC上での最先端性能を実現し,従来のセグメンテーションデータセットであるCityscapesのベースラインよりも優れていた。
論文参考訳（メタデータ） (2023-03-15T19:16:47Z)
BEVBert: Multimodal Map Pre-training for Language-guided Navigation [75.23388288113817]
視覚・言語ナビゲーション(VLN)における空間認識型マップベース事前学習パラダイムを提案する。我々は,グローバルなトポロジカルマップにおけるナビゲーション依存性をモデル化しながら,不完全な観測を明示的に集約し,重複を取り除くための局所距離マップを構築した。ハイブリッドマップをベースとして,マルチモーダルマップ表現を学習するための事前学習フレームワークを考案し,空間認識型クロスモーダル推論を強化し,言語誘導ナビゲーションの目標を導出する。
論文参考訳（メタデータ） (2022-12-08T16:27:54Z)
SegDiff: Image Segmentation with Diffusion Probabilistic Models [81.16986859755038]
拡散確率法は最先端の画像生成に使用される。画像分割を行うためにそのようなモデルを拡張する方法を提案する。この方法は、トレーニング済みのバックボーンに頼ることなく、エンドツーエンドで学習する。
論文参考訳（メタデータ） (2021-12-01T10:17:25Z)
Transformer-based Map Matching Model with Limited Ground-Truth Data using Transfer-Learning Approach [6.510061176722248]
多くのトラジェクトリベースのアプリケーションでは、生のGPSトラジェクトリをデジタルマップの道路網にマッピングする必要がある。本稿では,データの観点から地図マッチングの課題を考察し,深層学習に基づく地図マッチングモデルを提案する。合成軌道データを生成し,トランスフォーマーモデルを事前学習し,有限個の接地トラスデータでモデルを微調整する。
論文参考訳（メタデータ） (2021-08-01T11:51:11Z)
CAMERAS: Enhanced Resolution And Sanity preserving Class Activation Mapping for image saliency [61.40511574314069]
バックプロパゲーション画像のサリエンシは、入力中の個々のピクセルのモデル中心の重要性を推定することにより、モデル予測を説明することを目的としている。 CAMERASは、外部の事前処理を必要とせずに、高忠実度バックプロパゲーション・サリエンシ・マップを計算できる手法である。
論文参考訳（メタデータ） (2021-06-20T08:20:56Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。