論文の概要: ME-CPT: Multi-Task Enhanced Cross-Temporal Point Transformer for Urban 3D Change Detection
- arxiv url: http://arxiv.org/abs/2501.14004v1
- Date: Thu, 23 Jan 2025 13:07:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-27 14:58:12.770437
- Title: ME-CPT: Multi-Task Enhanced Cross-Temporal Point Transformer for Urban 3D Change Detection
- Title(参考訳): ME-CPT:都市3次元変化検出のためのマルチタスク型クロステンポ変換器
- Authors: Luqi Zhang, Haiping Wang, Chong Liu, Zhen Dong, Bisheng Yang,
- Abstract要約: 多時間ALS点雲を利用することで、都市部の意味的変化を捉えることができる。
既存の3D変化検出手法では,マルチクラスの意味情報や変化特徴を効率的に抽出することが困難である。
本稿では,Multi-task Enhanced Cross-temporal Point Transformer (ME-CPT) ネットワークを提案する。
- 参考スコア(独自算出の注目度): 10.15947374827254
- License:
- Abstract: The point clouds collected by the Airborne Laser Scanning (ALS) system provide accurate 3D information of urban land covers. By utilizing multi-temporal ALS point clouds, semantic changes in urban area can be captured, demonstrating significant potential in urban planning, emergency management, and infrastructure maintenance. Existing 3D change detection methods struggle to efficiently extract multi-class semantic information and change features, still facing the following challenges: (1) the difficulty of accurately modeling cross-temporal point clouds spatial relationships for effective change feature extraction; (2) class imbalance of change samples which hinders distinguishability of semantic features; (3) the lack of real-world datasets for 3D semantic change detection. To resolve these challenges, we propose the Multi-task Enhanced Cross-temporal Point Transformer (ME-CPT) network. ME-CPT establishes spatiotemporal correspondences between point cloud across different epochs and employs attention mechanisms to jointly extract semantic change features, facilitating information exchange and change comparison. Additionally, we incorporate a semantic segmentation task and through the multi-task training strategy, further enhance the distinguishability of semantic features, reducing the impact of class imbalance in change types. Moreover, we release a 22.5 $km^2$ 3D semantic change detection dataset, offering diverse scenes for comprehensive evaluation. Experiments on multiple datasets show that the proposed MT-CPT achieves superior performance compared to existing state-of-the-art methods. The source code and dataset will be released upon acceptance at \url{https://github.com/zhangluqi0209/ME-CPT}.
- Abstract(参考訳): Airborne Laser Scanning (ALS)システムによって収集された点雲は、都市の土地被覆の正確な3D情報を提供する。
多時期ALS点雲を利用することで、都市部のセマンティックな変化を捉え、都市計画、緊急管理、インフラ整備に大きな可能性を示すことができる。
既存の3D変化検出手法では, マルチクラスの意味情報や変化特徴を効率的に抽出することが困難であり, 時空間の雲を正確にモデル化することの難しさ, 効果的な変化特徴抽出のための空間関係のモデル化, 意味的特徴の識別性を阻害する変化サンプルのクラス不均衡, 実世界の3D意味的変化検出用データセットの欠如など, 課題に直面している。
これらの課題を解決するために,マルチタスク拡張時空間変換器(ME-CPT)ネットワークを提案する。
ME-CPTは、異なるエポックにわたって点雲間の時空間対応を確立し、意味変化の特徴を共同で抽出し、情報交換と変化比較を容易にするために注意機構を用いる。
さらに、セマンティックセグメンテーションタスクとマルチタスクトレーニング戦略を取り入れ、セマンティック特徴の識別性をさらに向上させ、変更タイプにおけるクラス不均衡の影響を低減する。
さらに、22.5$km^2$ 3D意味変化検出データセットをリリースし、総合評価のための多様なシーンを提供する。
複数のデータセットに対する実験により,提案したMT-CPTは既存の最先端手法と比較して優れた性能を示した。
ソースコードとデータセットは \url{https://github.com/zhangluqi0209/ME-CPT} で公開される。
関連論文リスト
- Point Cloud Understanding via Attention-Driven Contrastive Learning [64.65145700121442]
トランスフォーマーベースのモデルは、自己認識機構を活用することにより、先進的なポイントクラウド理解を持つ。
PointACLは、これらの制限に対処するために設計された、注意駆動のコントラスト学習フレームワークである。
本手法では, 注意駆動型動的マスキング手法を用いて, モデルが非集中領域に集中するように誘導する。
論文 参考訳(メタデータ) (2024-11-22T05:41:00Z) - Boosting Cross-Domain Point Classification via Distilling Relational Priors from 2D Transformers [59.0181939916084]
従来の3Dネットワークは主に局所幾何学的詳細に焦点を当て、局所幾何学間の位相構造を無視する。
そこで本稿では,大規模画像上においてよく訓練されたトランスフォーマーから前駆体を抽出する,新しい先駆体蒸留法を提案する。
PointDA-10とSim-to-Realデータセットの実験は、提案手法が点クラウド分類におけるUDAの最先端性能を一貫して達成していることを検証する。
論文 参考訳(メタデータ) (2024-07-26T06:29:09Z) - Continuous Urban Change Detection from Satellite Image Time Series with Temporal Feature Refinement and Multi-Task Integration [5.095834019284525]
衛星画像時系列(SITS)の各連続画像対の変化を識別する連続都市変化検出法を提案する。
具体的には、自己アテンションを利用して、ConvNetベースのマルチテンポラルビルディング表現を改善する時間的特徴改善(TFR)モジュールを提案する。
提案手法は,PlanetScopeコンステレーションが取得した高分解能SITSに基づいて都市変化を効果的に同定する。
論文 参考訳(メタデータ) (2024-06-25T10:53:57Z) - A Late-Stage Bitemporal Feature Fusion Network for Semantic Change Detection [32.112311027857636]
そこで本研究では,意味変化検出の課題に対処するため,新しい2段階の時間的特徴融合ネットワークを提案する。
具体的には,特徴融合を強化するため,局所的グローバルアテンショナルアグリゲーションモジュールを提案し,重要なセマンティクスを強調するために,局所的グローバルなコンテキスト拡張モジュールを提案する。
提案モデルにより,両データセットの最先端性能が向上する。
論文 参考訳(メタデータ) (2024-06-15T16:02:10Z) - ChangeBind: A Hybrid Change Encoder for Remote Sensing Change Detection [16.62779899494721]
変化検出(CD)は、異なる時刻スタンプで同じ地理的領域間の意味的変化を検出することを目的とした、リモートセンシング(RS)の基本課題である。
本稿では,バイテンポラルRS画像における意味変化をエンコードする,効果的なSiameseベースのフレームワークを提案する。
論文 参考訳(メタデータ) (2024-04-26T17:47:14Z) - Transformer-based Multimodal Change Detection with Multitask Consistency Constraints [10.906283981247796]
現在の変化検出方法は、意味変化検出タスクと高さ変化検出タスクのマルチタスク競合に対処する。
そこで我々は,クロスアテンションにより,多次元入力間の共有表現を学習する効率的なトランスフォーマーネットワークを提案する。
提案手法は,5つの現状変化検出手法と比較して,意味的および高さ変化検出の観点から,一貫したマルチタスク優位性を示す。
論文 参考訳(メタデータ) (2023-10-13T17:38:45Z) - Irregular Change Detection in Sparse Bi-Temporal Point Clouds using
Learned Place Recognition Descriptors and Point-to-Voxel Comparison [0.0]
本稿では3次元点雲における変化検出のための革新的なアプローチを提案する。
深層学習位置認識記述子とボクセル対ポイント比較に基づく不規則物体抽出を用いる。
提案手法は実世界の実地実験で評価された。
論文 参考訳(メタデータ) (2023-06-27T12:22:25Z) - AGO-Net: Association-Guided 3D Point Cloud Object Detection Network [86.10213302724085]
ドメイン適応によるオブジェクトの無傷な特徴を関連付ける新しい3D検出フレームワークを提案する。
我々は,KITTIの3D検出ベンチマークにおいて,精度と速度の両面で最新の性能を実現する。
論文 参考訳(メタデータ) (2022-08-24T16:54:38Z) - Dual Adaptive Transformations for Weakly Supervised Point Cloud
Segmentation [78.6612285236938]
弱制御点雲分割のための新しいDATモデル(textbfDual textbfAdaptive textbfTransformations)を提案する。
我々は,大規模S3DISデータセットとScanNet-V2データセットの2つの人気バックボーンを用いたDATモデルの評価を行った。
論文 参考訳(メタデータ) (2022-07-19T05:43:14Z) - Geometry-Contrastive Transformer for Generalized 3D Pose Transfer [95.56457218144983]
この研究の直感は、与えられたメッシュ間の幾何学的不整合を強力な自己認識機構で知覚することである。
本研究では,グローバルな幾何学的不整合に対する3次元構造的知覚能力を有する新しい幾何学コントラスト変換器を提案する。
本稿では, クロスデータセット3次元ポーズ伝達タスクのための半合成データセットとともに, 潜時等尺正則化モジュールを提案する。
論文 参考訳(メタデータ) (2021-12-14T13:14:24Z) - Improving Point Cloud Semantic Segmentation by Learning 3D Object
Detection [102.62963605429508]
ポイントクラウドセマンティックセグメンテーションは、自動運転において重要な役割を果たす。
現在の3Dセマンティックセグメンテーションネットワークは、よく表現されたクラスに対して優れた性能を発揮する畳み込みアーキテクチャに焦点を当てている。
Aware 3D Semantic Detection (DASS) フレームワークを提案する。
論文 参考訳(メタデータ) (2020-09-22T14:17:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。