論文の概要: Vision Transformers, a new approach for high-resolution and large-scale
mapping of canopy heights
- arxiv url: http://arxiv.org/abs/2304.11487v1
- Date: Sat, 22 Apr 2023 22:39:03 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-25 18:11:51.874491
- Title: Vision Transformers, a new approach for high-resolution and large-scale
mapping of canopy heights
- Title(参考訳): 視力変換器 -高分解能・大規模キャノピー高さマッピングのための新しいアプローチ
- Authors: Ibrahim Fayad, Philippe Ciais, Martin Schwartz, Jean-Pierre Wigneron,
Nicolas Baghdadi, Aur\'elien de Truchis, Alexandre d'Aspremont, Frederic
Frappart, Sassan Saatchi, Agnes Pellissier-Tanon and Hassan Bazzi
- Abstract要約: 分類(離散化)と連続損失関数を最適化した新しい視覚変換器(ViT)モデルを提案する。
このモデルは、従来使用されていた畳み込みベースのアプローチ(ConvNet)よりも、連続損失関数のみで最適化された精度が向上する。
- 参考スコア(独自算出の注目度): 50.52704854147297
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Accurate and timely monitoring of forest canopy heights is critical for
assessing forest dynamics, biodiversity, carbon sequestration as well as forest
degradation and deforestation. Recent advances in deep learning techniques,
coupled with the vast amount of spaceborne remote sensing data offer an
unprecedented opportunity to map canopy height at high spatial and temporal
resolutions. Current techniques for wall-to-wall canopy height mapping
correlate remotely sensed 2D information from optical and radar sensors to the
vertical structure of trees using LiDAR measurements. While studies using deep
learning algorithms have shown promising performances for the accurate mapping
of canopy heights, they have limitations due to the type of architectures and
loss functions employed. Moreover, mapping canopy heights over tropical forests
remains poorly studied, and the accurate height estimation of tall canopies is
a challenge due to signal saturation from optical and radar sensors, persistent
cloud covers and sometimes the limited penetration capabilities of LiDARs.
Here, we map heights at 10 m resolution across the diverse landscape of Ghana
with a new vision transformer (ViT) model optimized concurrently with a
classification (discrete) and a regression (continuous) loss function. This
model achieves better accuracy than previously used convolutional based
approaches (ConvNets) optimized with only a continuous loss function. The ViT
model results show that our proposed discrete/continuous loss significantly
increases the sensitivity for very tall trees (i.e., > 35m), for which other
approaches show saturation effects. The height maps generated by the ViT also
have better ground sampling distance and better sensitivity to sparse
vegetation in comparison to a convolutional model. Our ViT model has a RMSE of
3.12m in comparison to a reference dataset while the ConvNet model has a RMSE
of 4.3m.
- Abstract(参考訳): 森林林高の正確な時間的モニタリングは,森林動態,生物多様性,炭素沈降,森林の劣化,森林伐採を評価する上で重要である。
近年の深層学習技術の進歩と、膨大な宇宙搭載リモートセンシングデータを組み合わせることで、高空間および時間分解能で天蓋の高さをマッピングする前例のない機会が得られている。
壁対壁キャノピー高さマッピングの最近の技術は、光学・レーダーセンサからのリモートセンシングされた2d情報をlidar計測による樹木の垂直構造に関連付けている。
ディープラーニングアルゴリズムを用いた研究は、キャノピーの高さを正確にマッピングする上で有望な性能を示す一方で、アーキテクチャのタイプや損失関数による制限がある。
さらに, 熱帯林に分布するキャノピー高のマッピングは未だ研究が進んでおらず, 光・レーダセンサからの信号飽和, 雲被覆, 時にはLiDARの浸透能力の制限などにより, 高いキャノピーの正確な高度推定は困難である。
ここでは,ガーナの多様な景観にまたがる10mの高さを,分類(離散)と回帰(連続)損失関数を同時に最適化した新しいビジョントランスフォーマ(vit)モデルでマッピングする。
このモデルは、従来の畳み込み型アプローチ(convnets)よりも精度が良く、連続損失関数のみに最適化されている。
vitモデルの結果,提案する離散的/連続的損失により,高木(35m以上)の感度が著しく向上し,他の手法では飽和効果が示された。
ViTによって生成された高さマップは、畳み込みモデルと比較して、より優れた地中サンプリング距離とスパース植生に対する感度を持つ。
我々のViTモデルは参照データセットと比較してRMSEが3.12m、ConvNetモデルはRMSEが4.3mである。
関連論文リスト
- NeRF-Det++: Incorporating Semantic Cues and Perspective-aware Depth
Supervision for Indoor Multi-View 3D Detection [72.0098999512727]
NeRF-Detは、NeRFを用いた屋内マルチビュー3次元検出において、表現学習の強化による優れた性能を実現している。
セマンティックエンハンスメント(セマンティックエンハンスメント)、パースペクティブ・アウェア・サンプリング(パースペクティブ・アウェア・サンプリング)、および順序深度監視を含む3つのソリューションを提案する。
結果として得られたアルゴリズムであるNeRF-Det++は、ScanNetV2とAR KITScenesデータセットで魅力的なパフォーマンスを示している。
論文 参考訳(メタデータ) (2024-02-22T11:48:06Z) - Accuracy and Consistency of Space-based Vegetation Height Maps for
Forest Dynamics in Alpine Terrain [18.23260742076316]
スイス国立森林調査所(NFI)は、0.5mの空間解像度で全国の植生高度マップを提供している。
これは、宇宙からのリモートセンシングと深層学習を用いて、大規模な植生高度マップを生成することで改善できる。
センチネル2衛星画像に基づいて,2017年から2020年までの10m地点で年間,全国の植生高度マップを作成した。
論文 参考訳(メタデータ) (2023-09-04T20:23:57Z) - OCTraN: 3D Occupancy Convolutional Transformer Network in Unstructured
Traffic Scenarios [0.0]
我々は2次元画像特徴を3次元占有特徴に変換するために反復アテンションを用いたトランスフォーマーアーキテクチャOCTraNを提案する。
また、LiDARの地上真実の必要性を排除し、任意のシーンにモデルを一般化するための自己教師型トレーニングパイプラインも開発している。
論文 参考訳(メタデータ) (2023-07-20T15:06:44Z) - MonoTDP: Twin Depth Perception for Monocular 3D Object Detection in
Adverse Scenes [49.21187418886508]
本論文は,モノTDP(MonoTDP)と呼ばれる悪シーンにおける2つの深度を知覚するモノクル3次元検出モデルを提案する。
まず、制御不能な気象条件を扱うモデルを支援するための適応学習戦略を導入し、様々な劣化要因による劣化を著しく抑制する。
そこで本研究では, シーン深度と物体深度を同時に推定する新たな2つの深度認識モジュールを提案する。
論文 参考訳(メタデータ) (2023-05-18T13:42:02Z) - Very high resolution canopy height maps from RGB imagery using
self-supervised vision transformer and convolutional decoder trained on
Aerial Lidar [14.07306593230776]
本稿では,複数の非国家の管轄区域で同時に作成される最初の高分解能天蓋の高さマップについて述べる。
地図は、2017年から2020年にかけて、マクサー画像に基づいて訓練された自己教師モデルから特徴を抽出することによって生成される。
また、GEDI観測に基づいて訓練された畳み込みネットワークを用いた後処理のステップも導入する。
論文 参考訳(メタデータ) (2023-04-14T15:52:57Z) - High-resolution canopy height map in the Landes forest (France) based on
GEDI, Sentinel-1, and Sentinel-2 data with a deep learning approach [0.044381279572631216]
マルチストリームリモートセンシングに基づく深層学習モデルを構築し,高分解能キャノピー高さマップを作成する。
モデル出力により、2020年時点での"Landes de Gascogne"森林全体の10m解像度の天蓋の高さマップを作成できる。
針葉樹林におけるすべての検証データセットについて,本モデルでは,同領域で利用可能な従来の天蓋高さモデルよりも優れた指標を示した。
論文 参考訳(メタデータ) (2022-12-20T14:14:37Z) - On Robust Cross-View Consistency in Self-Supervised Monocular Depth
Estimation [77.98526337404412]
本論文では,2種類の堅牢なクロスビュー整合性について検討する。
深度特徴空間と3次元ボクセル空間の時間的コヒーレンスを自己教師付き単眼深度推定に利用した。
いくつかのアウトドアベンチマークの実験結果から,本手法は最先端技術より優れていることが示された。
論文 参考訳(メタデータ) (2022-09-19T03:46:13Z) - Information fusion approach for biomass estimation in a plateau
mountainous forest using a synergistic system comprising UAS-based digital
camera and LiDAR [9.944631732226657]
本研究の目的は,高原山岳森林保護区の地上バイオマス(AGB)の定量化である。
我々はDAP(Digital Aero Photogrammetry)を用いて,速度,空間分解能,低コストの独特な利点を生かした。
マルチスペクトル画像から得られたCHMとスペクトル特性に基づいて,関心領域のAGBを相当のコスト効率で推定,マッピングした。
論文 参考訳(メタデータ) (2022-04-14T04:04:59Z) - A Multi-Stage model based on YOLOv3 for defect detection in PV panels
based on IR and Visible Imaging by Unmanned Aerial Vehicle [65.99880594435643]
本研究では,無人航空機が捉えた空中画像のパネル欠陥を検出するための新しいモデルを提案する。
このモデルは、パネルと欠陥の検出を組み合わせることで、精度を向上する。
提案モデルはイタリア南部の2つの大きなPVプラントで検証されている。
論文 参考訳(メタデータ) (2021-11-23T08:04:32Z) - Progressive Coordinate Transforms for Monocular 3D Object Detection [52.00071336733109]
本稿では,学習座標表現を容易にするために,PCT(Em Progressive Coordinate Transforms)と呼ばれる,新しい軽量なアプローチを提案する。
本稿では,学習座標表現を容易にするために,PCT(Em Progressive Coordinate Transforms)と呼ばれる,新しい軽量なアプローチを提案する。
論文 参考訳(メタデータ) (2021-08-12T15:22:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。