Fugu-MT 論文翻訳(概要): Tri-path DINO: Feature Complementary Learning for Remote Sensing Multi-Class Change Detection

論文の概要: Tri-path DINO: Feature Complementary Learning for Remote Sensing Multi-Class Change Detection

arxiv url: http://arxiv.org/abs/2603.01498v1
Date: Mon, 02 Mar 2026 06:10:24 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-03 19:50:56.711606
Title: Tri-path DINO: Feature Complementary Learning for Remote Sensing Multi-Class Change Detection
Title（参考訳）: Tri-path DINO: リモートセンシングマルチクラス変化検出のための特徴補完学習
Authors: Kai Zheng, Hang-Cheng Dong, Zhenkai Wu, Fupeng Wei, Wei Zhang,
Abstract要約: リモートセンシング画像では、マルチクラス変化検出(MCD)がきめ細かいモニタリングに不可欠である。本稿では,3経路補足型特徴学習戦略を採用したTripath DINOアーキテクチャを提案する。並列畳み込みがコンテキスト情報を適応的にキャプチャし、拡張するデコーダネットワークを強化するために、マルチスケールアテンション機構が導入された。
参考スコア（独自算出の注目度）: 5.393722656625907
License: http://creativecommons.org/licenses/by/4.0/
Abstract: In remote sensing imagery, multi class change detection (MCD) is crucial for fine grained monitoring, yet it has long been constrained by complex scene variations and the scarcity of detailed annotations. To address this, we propose the Tripath DINO architecture, which adopts a three path complementary feature learning strategy to facilitate the rapid adaptation of pre trained foundation models to complex vertical domains. Specifically, we employ the DINOv3 pre trained model as the backbone feature extraction network to learn coarse grained features. An auxiliary path also adopts a siamese structure, progressively aggregating intermediate features from the siamese encoder to enhance the learning of fine grained features. Finally, a multi scale attention mechanism is introduced to augment the decoder network, where parallel convolutions adaptively capture and enhance contextual information under different receptive fields. The proposed method achieves optimal performance on the MCD task on both the Gaza facility damage assessment dataset (Gaza change) and the classic SECOND dataset. GradCAM visualizations further confirm that the main and auxiliary paths naturally focus on coarse grained semantic changes and fine grained structural details, respectively. This synergistic complementarity provides a robust and interpretable solution for advanced change detection tasks, offering a basis for rapid and accurate damage assessment.
Abstract（参考訳）: リモートセンシング画像では、マルチクラス変化検出(MCD)はきめ細かな監視に不可欠であるが、複雑なシーンの変動や詳細なアノテーションの不足に長い間拘束されてきた。そこで本研究では,3経路補完的特徴学習戦略を取り入れたTripath DINOアーキテクチャを提案する。具体的には、バックボーン特徴抽出ネットワークとして、DINOv3事前訓練モデルを用いて、粗いきめ細かい特徴を学習する。補助経路はまた、シアム構造を採用し、シアムエンコーダから中間的特徴を段階的に集約し、きめ細かい特徴の学習を強化する。最後に,マルチスケールアテンション機構を導入してデコーダネットワークを強化し,並列畳み込みが異なる受容領域下でのコンテキスト情報を適応的にキャプチャし,拡張する。提案手法は,ガザ施設被害評価データセット(ガザ変更)と古典SECONDデータセットの両方において,MDDタスクの最適性能を実現する。 GradCAMの可視化により、主経路と補助経路は、それぞれ粗い粒度のセマンティックな変化と微細な粒度の微細な構造的詳細に自然に焦点が当てられていることが確認される。この相乗的相補性は、高度な変化検出タスクに対して堅牢で解釈可能なソリューションを提供し、迅速かつ正確な損傷評価の基礎を提供する。

関連論文リスト

TransBridge: Boost 3D Object Detection by Scene-Level Completion with Transformer Decoder [66.22997415145467]
本稿では,スパース領域における検出機能を改善する共同補完・検出フレームワークを提案する。具体的には,トランスブリッジ(TransBridge)を提案する。トランスブリッジ(TransBridge)はトランスフォーマーをベースとした新しいアップサンプリングブロックである。その結果,本フレームワークは,各手法の平均精度(mAP)が0.7から1.5の範囲で,エンドツーエンドの3Dオブジェクト検出を一貫して改善していることがわかった。
論文参考訳（メタデータ） (2025-12-12T00:08:03Z)
Boosting Cross-Domain Point Classification via Distilling Relational Priors from 2D Transformers [59.0181939916084]
従来の3Dネットワークは主に局所幾何学的詳細に焦点を当て、局所幾何学間の位相構造を無視する。そこで本稿では,大規模画像上においてよく訓練されたトランスフォーマーから前駆体を抽出する,新しい先駆体蒸留法を提案する。 PointDA-10とSim-to-Realデータセットの実験は、提案手法が点クラウド分類におけるUDAの最先端性能を一貫して達成していることを検証する。
論文参考訳（メタデータ） (2024-07-26T06:29:09Z)
Cross-Cluster Shifting for Efficient and Effective 3D Object Detection in Autonomous Driving [69.20604395205248]
本稿では,自律運転における3次元物体検出のための3次元点検出モデルであるShift-SSDを提案する。我々は、ポイントベース検出器の表現能力を解き放つために、興味深いクロスクラスタシフト操作を導入する。我々は、KITTI、ランタイム、nuScenesデータセットに関する広範な実験を行い、Shift-SSDの最先端性能を実証した。
論文参考訳（メタデータ） (2024-03-10T10:36:32Z)
T-UNet: Triplet UNet for Change Detection in High-Resolution Remote Sensing Images [5.849243433046327]
現在、ほとんどの変更検出方法は、シームズネットワーク構造または初期の核融合構造に基づいている。本稿では,3分岐エンコーダをベースとしたTriplet UNet(T-UNet)を提案する。デコーダの段階では、詳細なテクスチャ情報を完全にマイニングし統合するためのチャネルアテンション機構(CAM)と空間アテンション機構(SAM)を導入する。
論文参考訳（メタデータ） (2023-08-04T14:44:11Z)
DETR Doesn't Need Multi-Scale or Locality Design [69.56292005230185]
本稿では,"プレーン"特性を維持できる改良型DETR検出器を提案する。特定の局所性制約を伴わずに、単一スケールの機能マップとグローバルなクロスアテンション計算を使用する。マルチスケールな特徴マップと局所性制約の欠如を補うために,2つの単純な技術が平易な設計において驚くほど効果的であることを示す。
論文参考訳（メタデータ） (2023-08-03T17:59:04Z)
Hierarchical Disentanglement-Alignment Network for Robust SAR Vehicle Recognition [18.38295403066007]
HDANetは機能障害とアライメントを統合フレームワークに統合する。提案手法は,MSTARデータセットにおいて,9つの動作条件にまたがる顕著なロバスト性を示す。
論文参考訳（メタデータ） (2023-04-07T09:11:29Z)
Dsfer-Net: A Deep Supervision and Feature Retrieval Network for Bitemporal Change Detection Using Modern Hopfield Networks [35.415260892693745]
本稿では,バイテンポラル変化検出のためのDeep Supervision and feature Retrieval Network (Dsfer-Net)を提案する。具体的には、バイテンポラル画像の高度に代表的な深い特徴を、完全に畳み込みされたシームズネットワークを通じて、共同で抽出する。エンド・ツー・エンドのネットワークは,異なるレイヤから抽出した特徴と特徴のペアを集約することで,新たなフレームワークを確立する。
論文参考訳（メタデータ） (2023-04-03T16:01:03Z)
RCDT: Relational Remote Sensing Change Detection with Transformer [9.339061781212475]
Change Detection Transformer (RCDT) は、リモートセンシングによる変更検出タスクのための、新しくてシンプルなフレームワークである。提案するRCDTは,他の競合手法と比較して優れた変化検出性能を示す。
論文参考訳（メタデータ） (2022-12-09T14:21:42Z)
TC-Net: Triple Context Network for Automated Stroke Lesion Segmentation [0.5482532589225552]
本稿では,空間的コンテキスト情報を中心として,新たなネットワークである Triple Context Network (TC-Net) を提案する。我々のネットワークはオープンデータセットATLASで評価され、最高スコアは0.594、ハウスドルフ距離は27.005mm、平均対称性表面距離は7.137mmである。
論文参考訳（メタデータ） (2022-02-28T11:12:16Z)
GANav: Group-wise Attention Network for Classifying Navigable Regions in Unstructured Outdoor Environments [54.21959527308051]
本稿では,RGB画像から,オフロード地形および非構造環境における安全かつ航行可能な領域を識別する新しい学習手法を提案する。本手法は,粒度の粗いセマンティックセグメンテーションを用いて,そのナビビリティレベルに基づいて地形分類群を分類する。 RUGD と RELLIS-3D のデータセットを広範囲に評価することにより,我々の学習アルゴリズムがナビゲーションのためのオフロード地形における視覚知覚の精度を向上させることを示す。
論文参考訳（メタデータ） (2021-03-07T02:16:24Z)
Unsupervised Instance Segmentation in Microscopy Images via Panoptic Domain Adaptation and Task Re-weighting [86.33696045574692]
病理組織像における教師なし核分割のためのCycle Consistency Panoptic Domain Adaptive Mask R-CNN(CyC-PDAM)アーキテクチャを提案する。まず,合成画像中の補助的な生成物を除去するための核塗布機構を提案する。第二に、ドメイン識別器を持つセマンティックブランチは、パンプトレベルのドメイン適応を実現するように設計されている。
論文参考訳（メタデータ） (2020-05-05T11:08:26Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。