論文の概要: TransLandSeg: A Transfer Learning Approach for Landslide Semantic Segmentation Based on Vision Foundation Model
- arxiv url: http://arxiv.org/abs/2403.10127v1
- Date: Fri, 15 Mar 2024 09:18:53 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-18 17:50:08.400633
- Title: TransLandSeg: A Transfer Learning Approach for Landslide Semantic Segmentation Based on Vision Foundation Model
- Title(参考訳): TransLandSeg:ビジョン基礎モデルに基づく地すべりセマンティックセマンティックセグメンテーションのための伝達学習手法
- Authors: Changhong Hou, Junchuan Yu, Daqing Ge, Liu Yang, Laidian Xi, Yunxuan Pang, Yi Wen,
- Abstract要約: 視覚基盤モデル(VFM)に基づく地すべりセマンティックセグメンテーションのための伝達学習手法であるTransLandSegを提案する。
提案した適応転写学習(ATL)アーキテクチャは,SAMのパラメータの1.3%のトレーニングで,SAMの強力なセグメンテーション能力を地すべり検出に伝達することを可能にする。
- 参考スコア(独自算出の注目度): 4.8312235770932
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Landslides are one of the most destructive natural disasters in the world, posing a serious threat to human life and safety. The development of foundation models has provided a new research paradigm for large-scale landslide detection. The Segment Anything Model (SAM) has garnered widespread attention in the field of image segmentation. However, our experiment found that SAM performed poorly in the task of landslide segmentation. We propose TransLandSeg, which is a transfer learning approach for landslide semantic segmentation based on a vision foundation model (VFM). TransLandSeg outperforms traditional semantic segmentation models on both the Landslide4Sense dataset and the Bijie landslide dataset. Our proposed adaptive transfer learning (ATL) architecture enables the powerful segmentation capability of SAM to be transferred to landslide detection by training only 1.3% of the number of the parameters of SAM, which greatly improves the training efficiency of the model. Finally we also conducted ablation experiments on models with different ATL structures, concluded that the deployment location and residual connection of ATL play an important role in TransLandSeg accuracy improvement.
- Abstract(参考訳): 地すべりは世界でも最も破壊的な自然災害の1つであり、人間の生命と安全に深刻な脅威をもたらしている。
基礎モデルの開発は、大規模な地すべり検出のための新しい研究パラダイムを提供してきた。
Segment Anything Model (SAM) は画像セグメンテーションの分野で広く注目を集めている。
しかし,本実験では,地すべりのセグメンテーションにおいてSAMが不十分であった。
本稿では,視覚基盤モデル(VFM)に基づく地すべりセマンティックセグメンテーションのためのトランスラーニング手法であるTransLandSegを提案する。
TransLandSegは、Landslide4SenseデータセットとBijie地すべりデータセットの両方で、従来のセマンティックセグメンテーションモデルより優れている。
提案した適応転写学習(ATL)アーキテクチャにより,SAMの強力なセグメンテーション能力はSAMのパラメータの1.3%のトレーニングで地すべり検出に伝達され,モデルのトレーニング効率が大幅に向上する。
最後に,異なるATL構造を持つモデルに対するアブレーション実験を行い,ATLの配置位置と残差接続がTransLandSegの精度向上に重要な役割を果たしていると結論付けた。
関連論文リスト
- Seismic Fault SAM: Adapting SAM with Lightweight Modules and 2.5D Strategy for Fault Detection [11.868792440783054]
本稿では,一般的な事前学習基盤モデルであるSAM(Segment Anything Model)を地震断層解釈に適用した地震断層SAMを提案する。
私たちの革新的なポイントは、軽量なAdapterモジュールの設計、トレーニング済みの重量のほとんどを凍結し、少数のパラメータのみを更新することです。
その結果,OISとODSの双方で既存の3次元モデルを上回る結果が得られた。
論文 参考訳(メタデータ) (2024-07-19T08:38:48Z) - ACTRESS: Active Retraining for Semi-supervised Visual Grounding [52.08834188447851]
前回の研究であるRefTeacherは、疑似自信と注意に基づく監督を提供するために教師学生の枠組みを採用することで、この課題に取り組むための最初の試みである。
このアプローチは、Transformerベースのパイプラインに従う現在の最先端のビジュアルグラウンドモデルと互換性がない。
本稿では, ACTRESS を略したセミスーパービジョン視覚グラウンドのためのアクティブ・リトレーニング手法を提案する。
論文 参考訳(メタデータ) (2024-07-03T16:33:31Z) - SatSynth: Augmenting Image-Mask Pairs through Diffusion Models for Aerial Semantic Segmentation [69.42764583465508]
我々は,地球観測における注釈付きデータの不足に対処するために,生成的画像拡散の可能性を探る。
我々の知る限りでは、衛星セグメンテーションのための画像と対応するマスクの両方を最初に生成する。
論文 参考訳(メタデータ) (2024-03-25T10:30:22Z) - MTP: Advancing Remote Sensing Foundation Model via Multi-Task Pretraining [73.81862342673894]
ファンデーションモデルは、様々な画像解釈タスクを強化することで、リモートセンシング(RS)のランドスケープを再構築した。
事前訓練されたモデルを下流のタスクに転送することは、イメージ分類やオブジェクト識別タスクとして事前訓練の定式化によるタスクの相違に遭遇する可能性がある。
SAMRSデータセット上で、セマンティックセグメンテーション、インスタンスセグメンテーション、回転オブジェクト検出を含むマルチタスクによる事前トレーニングを行う。
我々のモデルは、シーン分類、水平・回転物体検出、セマンティックセグメンテーション、変化検出など、様々なRS下流タスクに基づいて微調整される。
論文 参考訳(メタデータ) (2024-03-20T09:17:22Z) - Self-guided Few-shot Semantic Segmentation for Remote Sensing Imagery
Based on Large Vision Models [14.292149307183967]
本研究は,少数ショットセマンティックセグメンテーションの自動化を目的とした構造化フレームワークを提案する。
SAMモデルを利用して、意味的に識別可能なセグメンテーションの結果をより効率的に生成する。
提案手法の中心は,従来のガイドマスクを利用してSAMの粗い画素単位のプロンプトを生成する,新しい自動プロンプト学習手法である。
論文 参考訳(メタデータ) (2023-11-22T07:07:55Z) - On the Transferability of Learning Models for Semantic Segmentation for
Remote Sensing Data [12.500746892824338]
近年の深層学習に基づく手法は、リモートセンシング(RS)セマンティックセグメンテーション/分類タスクにおいて従来の学習方法より優れている。
しかし、ソースドメインでトレーニングされたモデルがターゲットドメインに容易に適用できる程度に、その転送可能性に関する包括的な分析は存在しない。
本稿では,従来のディープラーニングモデル(DL)とドメイン適応手法(DA)の有効性について検討する。
論文 参考訳(メタデータ) (2023-10-16T15:13:36Z) - Fine-grained building roof instance segmentation based on domain adapted
pretraining and composite dual-backbone [13.09940764764909]
本稿では,高解像度光衛星画像を用いた個々の建物の意味解釈を実現するための枠組みを提案する。
具体的には、レバレッジされたドメイン適応事前学習戦略と複合二重バックボーンは、非ネイティブな特徴学習を大いに促進する。
その結果,本手法は2023年のIEEE GRSS Data Fusion Contestの第一位に位置づけられた。
論文 参考訳(メタデータ) (2023-08-10T05:54:57Z) - Generalized Semantic Segmentation by Self-Supervised Source Domain
Projection and Multi-Level Contrastive Learning [79.0660895390689]
ソースドメインでトレーニングされたディープネットワークは、未確認のターゲットドメインデータでテストした場合、パフォーマンスが低下している。
汎用セマンティックセグメンテーションのためのドメイン・プロジェクションとコントラシブ・ラーニング(DPCL)手法を提案する。
論文 参考訳(メタデータ) (2023-03-03T13:07:14Z) - Minimum Class Confusion based Transfer for Land Cover Segmentation in
Rural and Urban Regions [0.0]
本研究では,移動学習手法を用いて土地被覆地図の作成を可能にするセマンティックセグメンテーション手法を提案する。
低解像度画像で訓練されたモデルと、対象領域やズームレベルの不十分なデータを比較した。
都市部における移動学習のセグメンテーション性能は,農村部では3.4%,都市部では12.9%であった。
論文 参考訳(メタデータ) (2022-12-05T09:41:06Z) - Embedding Earth: Self-supervised contrastive pre-training for dense land
cover classification [61.44538721707377]
本研究では,衛星画像の高可用性を活用するための自己監督型コントラスト事前学習法として,エンベディングアースを提案する。
提案手法による事前学習では, 25%の絶対mIoUが得られた。
学習した特徴は、異なる領域間で一般化され、提案した事前学習スキームの可能性を開放する。
論文 参考訳(メタデータ) (2022-03-11T16:14:14Z) - PGL: Prior-Guided Local Self-supervised Learning for 3D Medical Image
Segmentation [87.50205728818601]
本稿では,潜在特徴空間における局所的一貫性を学習するPGL(PresideedGuided Local)自己教師モデルを提案する。
我々のPGLモデルは、局所領域の特異な表現を学習し、したがって構造情報を保持できる。
論文 参考訳(メタデータ) (2020-11-25T11:03:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。