論文の概要: FSKD: Monocular Forest Structure Inference via LiDAR-to-RGBI Knowledge Distillation
- arxiv url: http://arxiv.org/abs/2604.01766v1
- Date: Thu, 02 Apr 2026 08:33:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-03 14:21:10.61811
- Title: FSKD: Monocular Forest Structure Inference via LiDAR-to-RGBI Knowledge Distillation
- Title(参考訳): FSKD:LiDAR-to-RGBI知識蒸留による単眼林構造推定
- Authors: Taimur Khan, Hannes Feilhauer, Muhammad Jazib Zafar,
- Abstract要約: Canopy Height Model (CHM) や Plant Area Index (PAI) 、Foliage Height Diversity (FHD) といった森林構造指標に言及されているにもかかわらず、空飛ぶLiDARは費用がかからないままである。
FSKD: LiDAR-to-RGB-Infrared(RGBI)知識蒸留フレームワークを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Very High Resolution (VHR) forest structure data at individual-tree scale is essential for carbon, biodiversity, and ecosystem monitoring. Still, airborne LiDAR remains costly and infrequent despite being the reference for forest structure metrics like Canopy Height Model (CHM), Plant Area Index (PAI), and Foliage Height Diversity (FHD). We propose FSKD: a LiDAR-to-RGB-Infrared (RGBI) knowledge distillation (KD) framework in which a multi-modal teacher fuses RGBI imagery with LiDAR-derived planar metrics and vertical profiles via cross-attention, and an RGBI-only SegFormer student learns to reproduce these outputs. Trained on 384 $km^2$ of forests in Saxony, Germany (20 cm ground sampling distance (GSD)) and evaluated on eight geographically distinct test tiles, the student achieves state-of-the-art (SOTA) zero-shot CHM performance (MedAE 4.17 m, $R^2$=0.51, IoU 0.87), outperforming HRCHM/DAC baselines by 29--46% in MAE (5.81 m vs. 8.14--10.84 m) with stronger correlation coefficients (0.713 vs. 0.166--0.652). Ablations show that multi-modal fusion improves performance by 10--26% over RGBI-only training, and that asymmetric distillation with appropriate model capacity is critical. The method jointly predicts CHM, PAI, and FHD, a multi-metric capability not provided by current monocular CHM estimators, although PAI/FHD transfer remains region-dependent and benefits from local calibration. The framework also remains effective under temporal mismatch (winter LiDAR, summer RGBI), removing strict co-acquisition constraints and enabling scalable 20 cm operational monitoring for workflows such as Digital Twin Germany and national Digital Orthophoto programs.
- Abstract(参考訳): 超高分解能(VHR)森林構造データは,炭素,生物多様性,生態系モニタリングに不可欠である。
それでも、Canopy Height Model (CHM)、PAI、Foliage Height Diversity (FHD)といった森林構造指標に言及されているにもかかわらず、空飛ぶLiDARは費用がかからず、頻繁に存在する。
FSKD: LiDAR-to-RGB-Infrared (RGBI) knowledge distillation (RGBI) framework that a multi-modal teacher fuses RGBI images with LiDAR- derived Planar metrics and vertical profiles via cross-attention, and a RGBI-only SegFormer students are learn to repeat these outputs。
ドイツのザクセン州の384$km^2$の森林(20cm地中サンプリング距離(GSD))で訓練され、8つの地理的に異なる試験タイルで評価され、学生は最先端(SOTA)ゼロショットCHM性能(MedAE 4.17 m, $R^2$=0.51, IoU 0.87)を達成し、強い相関係数(0.713 vs. 0.166-0.652)を持つHRCHM/DACベースライン(5.81 m vs. 8.14--10.84 m)を29-46%上回った。
アブレーションの結果, マルチモーダル核融合はRGBIのみのトレーニングよりも10~26%向上し, 適切なモデルキャパシティを有する非対称蒸留が重要であることがわかった。
この手法は、ChM、PAI、FHDを共同で予測するが、これは現在の単分子CHM推定器では提供されないマルチメトリック能力であり、PAI/FHD転送は領域依存であり、局所的な校正による利点がある。
また、このフレームワークは時間的ミスマッチ(LiDAR、夏期RGBI)の下でも有効であり、厳密な共獲得制約を取り除き、Digital Twin GermanyやNational Digital Orthophoto Programのようなワークフローのスケーラブルな20cmの運用監視を可能にする。
関連論文リスト
- AgriPath: A Systematic Exploration of Architectural Trade-offs for Crop Disease Classification [45.52399819498234]
本研究は、細粒度作物病分類のための3つのモデルパラダイムの体系的比較を示す。
我々は16の作物と41の病気にまたがる111kの画像を含むベンチマークであるAgriPath-LF16を紹介する。
CNNは画像の精度が最も高いが、ドメインシフトによって劣化する。
対照的なVLMは、競合するクロスドメイン性能を持つ堅牢でパラメータ効率の良い代替手段を提供する。
論文 参考訳(メタデータ) (2026-03-08T17:28:01Z) - Forest canopy height estimation from satellite RGB imagery using large-scale airborne LiDAR-derived training data and monocular depth estimation [2.3321503459324915]
大規模で高解像度の森林天蓋高マッピングは、地域的およびグローバルな炭素・水循環を理解する上で重要な役割を担っている。
地表近傍のLiDARプラットフォームは、森林の天蓋構造のより微細な測定を提供する。
最先端の単眼深度推定モデルであるDepth Anything V2は16,000km2の天蓋高さモデルを用いて訓練された。
論文 参考訳(メタデータ) (2026-02-06T08:53:32Z) - BOOD: Boundary-based Out-Of-Distribution Data Generation [47.47757472521503]
本稿では,境界に基づくOut-Of-Distribution Data Generation(BOOD)という新しいフレームワークを提案する。
BOODは高品質なOOD特徴を合成し、拡散モデルを用いて人間互換の外部画像を生成する。
論文 参考訳(メタデータ) (2025-08-01T06:34:27Z) - Unsupervised deep learning for semantic segmentation of multispectral LiDAR forest point clouds [1.6633665061166945]
本研究では,高密度レーザー走査点雲の葉木分離のための教師なし深層学習手法を提案する。
GrowSP-ForMS の平均精度は84.3%、mIoU平均交点は69.6%であった。
論文 参考訳(メタデータ) (2025-02-10T07:58:49Z) - Multimodal classification of forest biodiversity potential from 2D orthophotos and 3D airborne laser scanning point clouds [47.679877727066206]
森林生物多様性の評価は生態系管理と保全に不可欠である。
深層学習に基づく2次元直視と3次元空中レーザースキャン(ALS)点群からの近距離センシングデータの融合は、森林の生物多様性ポテンシャルを確実に評価することができる。
BioVistaのデータセットは、デンマークの温帯森林から採取された44の378対のオルソフォトスとALS点雲からなる。
論文 参考訳(メタデータ) (2025-01-03T09:42:25Z) - SMILE-UHURA Challenge -- Small Vessel Segmentation at Mesoscopic Scale from Ultra-High Resolution 7T Magnetic Resonance Angiograms [60.35639972035727]
公開されている注釈付きデータセットの欠如は、堅牢で機械学習駆動のセグメンテーションアルゴリズムの開発を妨げている。
SMILE-UHURAチャレンジは、7T MRIで取得したTime-of-Flightアンジオグラフィーの注釈付きデータセットを提供することで、公開されている注釈付きデータセットのギャップに対処する。
Diceスコアは、それぞれのデータセットで0.838 $pm$0.066と0.716 $pm$ 0.125まで到達し、平均パフォーマンスは0.804 $pm$ 0.15までになった。
論文 参考訳(メタデータ) (2024-11-14T17:06:00Z) - Unified Deep Learning Model for Global Prediction of Aboveground Biomass, Canopy Height and Cover from High-Resolution, Multi-Sensor Satellite Imagery [0.196629787330046]
地表面バイオマス密度 (AGBD) , キャノピー高さ (CH) , キャノピー被覆 (CC) の予測を統一する深層学習モデルと10mのマルチセンサ・マルチスペクトル画像を用いた新しい手法を提案する。
GEDI-L2/L4を世界数百万のサンプルで測定し、2023年と2016年から2023年までの期間に全世界に展開することで、モデルの有効性を検証した。
論文 参考訳(メタデータ) (2024-08-20T23:15:41Z) - Information fusion approach for biomass estimation in a plateau
mountainous forest using a synergistic system comprising UAS-based digital
camera and LiDAR [9.944631732226657]
本研究の目的は,高原山岳森林保護区の地上バイオマス(AGB)の定量化である。
我々はDAP(Digital Aero Photogrammetry)を用いて,速度,空間分解能,低コストの独特な利点を生かした。
マルチスペクトル画像から得られたCHMとスペクトル特性に基づいて,関心領域のAGBを相当のコスト効率で推定,マッピングした。
論文 参考訳(メタデータ) (2022-04-14T04:04:59Z) - Country-wide Retrieval of Forest Structure From Optical and SAR
Satellite Imagery With Bayesian Deep Learning [74.94436509364554]
本研究では,10mの解像度で森林構造変数を高密度に推定するベイズ深層学習手法を提案する。
本手法は,Sentinel-2光画像とSentinel-1合成開口レーダ画像を5種類の森林構造変数のマップに変換する。
ノルウェーを横断する41の空中レーザー走査ミッションの基準データに基づいて、我々のモデルを訓練し、テストする。
論文 参考訳(メタデータ) (2021-11-25T16:21:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。