論文の概要: Clay-CNN Hybrids: Leveraging Geospatial Foundation Models as Auxiliary Context for Landslide Detection
- arxiv url: http://arxiv.org/abs/2606.14081v2
- Date: Mon, 15 Jun 2026 01:35:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-16 13:45:31.299335
- Title: Clay-CNN Hybrids: Leveraging Geospatial Foundation Models as Auxiliary Context for Landslide Detection
- Title(参考訳): Clay-CNNハイブリッド:地すべり検出のための補助的コンテキストとして地理空間モデルを活用する
- Authors: Huong Binh Vu,
- Abstract要約: 本研究では,Geospatial Foundation Model (GFM) である Clay v1.5 が Landslide4Sense ベンチマークでピクセルレベルの地すべりセグメンテーションを改善することができるかどうかを評価する。
主要なエンコーダとしてのClay,ボトルネック時にClayの意味コンテキストを付加したU-Netバックボーン,標準のU-Netベースラインの3つの戦略を比較した。
2段階の低ランク適応(LoRA)を用いたハイブリッドU-Net + Clayモデルでは,3種に対して64.5+/-1.8%のF1が得られた。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Rapid post-event landslide mapping is essential for disaster response but remains difficult to automate due to extreme class imbalance. This study evaluates whether Clay v1.5, a Geospatial Foundation Model (GFM), can improve pixel-level landslide segmentation on the Landslide4Sense (L4S) benchmark, which contains 3,799 training chips with 14 Sentinel-2 and terrain bands and approximately 2% positive pixels. We compare three strategies: Clay as the primary encoder with multi-scale residual terrain fusion, a U-Net backbone augmented with Clay semantic context at the bottleneck, and a standard U-Net baseline. The hybrid U-Net + Clay model with two-stage Low-Rank Adaptation (LoRA) achieved the best test F1 of 64.5 +/- 1.8% over three seeds, surpassing the Clay-only backbone (55.2 +/- 3.6%) and the U-Net baseline (59.9%). Clay as a standalone encoder underperformed the U-Net due to the absence of multi-scale skip connections, but its pretrained representations consistently improved performance when injected as auxiliary context. These findings suggest that GFMs are most effective for landslide detection when they complement spatially detailed convolutional architectures rather than replace them.
- Abstract(参考訳): 急激な地すべりのマッピングは災害対応に不可欠であるが, 過度の不均衡のため, 自動化が困難である。
本研究では,Geospatial Foundation Model (GFM) であるClay v1.5がLandslide4Sense (L4S) ベンチマークでピクセルレベルの地すべりセグメンテーションを改善することができるかを評価する。
主要なエンコーダとしてのClay,ボトルネック時にClayの意味コンテキストを付加したU-Netバックボーン,標準のU-Netベースラインの3つの戦略を比較した。
2段階のローランド適応(LoRA)を持つハイブリッドU-Net + Clayモデルは、3つの種に対して64.5 +/- 1.8%のF1を達成し、クレイのみのバックボーン(55.2 +/-3.6%)とU-Netベースライン(59.9%)を上回った。
スタンドアロンのエンコーダとしてのClayは、マルチスケールのスキップ接続がないためにU-Netの性能が劣っていたが、事前訓練された表現は補助的なコンテキストとして注入された場合のパフォーマンスを一貫して改善した。
これらの結果から, GFMは地すべり検出に最も有効であることが示唆された。
関連論文リスト
- ArcGate: Adaptive Arctangent Gated Activation [62.5098969984518]
本稿では,アクティベーション形状の広いスペクトルを生成するフレキシブルな定式化であるAdaptive Arctangent Gated Activation関数を提案する。
我々は、PatternNet、UC Merced Land Use、13バンドのEuroSAT MSIマルチスペクトルデータセットの3つのリモートセンシングベンチマークでArcGateを評価した。
論文 参考訳(メタデータ) (2026-05-14T08:00:46Z) - PRUE: A Practical Recipe for Field Boundary Segmentation at Scale [50.194423500109025]
本研究では,大域境界線決定のためのセグメント化と地理空間基盤モデル(GFM)を初めて体系的に評価する。
U-Netセマンティックセマンティックセグメンテーションモデルは、パフォーマンスとデプロイメントのメトリクスのスイートにおいて、インスタンスベースとGFMの代替よりも優れています。
我々のアプローチは、モデル設計、トレーニング、推論にまたがる、信頼性があり、スケーラブルで再現可能なフィールド境界記述のための実践的なフレームワークを提供します。
論文 参考訳(メタデータ) (2026-03-28T02:47:46Z) - Assessing the value of Geo-Foundational Models for Flood Inundation Mapping: Benchmarking models for Sentinel-1, Sentinel-2, and Planetscope for end-users [1.3877194435621216]
Foundationsal Models (GFMs) は、衛星画像から高速かつ信頼性の高い情報抽出を可能にする。
これらの可能性にもかかわらず、GFMがU-Netのような従来のモデルより優れているかどうかは不明だ。
我々はTransNorm, U-Net, Attention U-Netに対して, Prithvi 2.0, Clay V1.5, DOFA, UViTの3つのGFMを評価した。
論文 参考訳(メタデータ) (2025-11-03T19:02:09Z) - Where on Earth? A Vision-Language Benchmark for Probing Model Geolocation Skills Across Scales [61.03549470159347]
視覚言語モデル (VLM) は急速に進歩しているが, オープンワールド環境における画像位置決め能力は, 網羅的に評価されていない。
我々は、視覚認識、ステップバイステップ推論、エビデンス利用を評価するVLM画像位置情報の総合ベンチマークであるEarthWhereを提示する。
論文 参考訳(メタデータ) (2025-10-13T01:12:21Z) - Practical GPU Choices for Earth Observation: ResNet-50 Training Throughput on Integrated, Laptop, and Cloud Accelerators [0.0]
このプロジェクトは、Sentinel-2画像の土地利用と土地被覆(LULC)分類のためのResNetベースのパイプラインを実装している。
このワークフローは、データ取得、地理空間前処理、タイリング、モデルトレーニング、可視化を自動化する。
性能評価では、Apple M3 Proのベースラインに比べて2倍のトレーニング速度が期待できる。
論文 参考訳(メタデータ) (2025-08-25T17:03:59Z) - Landslide Detection and Segmentation Using Remote Sensing Images and
Deep Neural Network [42.59806784981723]
2022 Landslide4Senseコンペティションの結果に基づいて,地すべり検出とセグメンテーションのためのディープニューラルネットワークシステムを提案する。
ベースラインモデルとしてクロスエントロピー損失をトレーニングしたU-Netを用いる。
次に、幅広いディープラーニング技術を活用して、U-Netベースラインモデルを改善する。
論文 参考訳(メタデータ) (2023-12-27T20:56:55Z) - Automating global landslide detection with heterogeneous ensemble
deep-learning classification [44.99833362998488]
地すべりは道路、鉄道、建物、人間の生活などのインフラを脅かす。
危険に基づく空間計画と早期警戒システムは、地すべりから社会へのリスクを減らすための費用対効果の戦略である。
近年,中~高解像度の衛星画像を入力として,深層学習モデルを陸地マッピングに適用している。
論文 参考訳(メタデータ) (2023-09-12T10:56:16Z) - SFNet: Faster and Accurate Semantic Segmentation via Semantic Flow [88.97790684009979]
性能を改善するための一般的な実践は、強力な意味表現を持つ高解像度の特徴写像を得ることである。
隣接レベルの特徴マップ間のテキストセマンティックフローを学習するためのフローアライメントモジュール(FAM)を提案する。
また,高分解能特徴写像と低分解能特徴写像を直接整列するGated Dual Flow Alignment Moduleを提案する。
論文 参考訳(メタデータ) (2022-07-10T08:25:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。