Fugu-MT 論文翻訳(概要): Vision Transformers, a new approach for high-resolution and large-scale mapping of canopy heights

論文の概要: Vision Transformers, a new approach for high-resolution and large-scale mapping of canopy heights

arxiv url: http://arxiv.org/abs/2304.11487v1
Date: Sat, 22 Apr 2023 22:39:03 GMT
ステータス: 翻訳完了
システム内更新日: 2023-04-25 18:11:51.874491
Title: Vision Transformers, a new approach for high-resolution and large-scale mapping of canopy heights
Title（参考訳）: 視力変換器 -高分解能・大規模キャノピー高さマッピングのための新しいアプローチ
Authors: Ibrahim Fayad, Philippe Ciais, Martin Schwartz, Jean-Pierre Wigneron, Nicolas Baghdadi, Aur\'elien de Truchis, Alexandre d'Aspremont, Frederic Frappart, Sassan Saatchi, Agnes Pellissier-Tanon and Hassan Bazzi
Abstract要約: 分類(離散化)と連続損失関数を最適化した新しい視覚変換器(ViT)モデルを提案する。このモデルは、従来使用されていた畳み込みベースのアプローチ(ConvNet)よりも、連続損失関数のみで最適化された精度が向上する。
参考スコア（独自算出の注目度）: 50.52704854147297
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Accurate and timely monitoring of forest canopy heights is critical for assessing forest dynamics, biodiversity, carbon sequestration as well as forest degradation and deforestation. Recent advances in deep learning techniques, coupled with the vast amount of spaceborne remote sensing data offer an unprecedented opportunity to map canopy height at high spatial and temporal resolutions. Current techniques for wall-to-wall canopy height mapping correlate remotely sensed 2D information from optical and radar sensors to the vertical structure of trees using LiDAR measurements. While studies using deep learning algorithms have shown promising performances for the accurate mapping of canopy heights, they have limitations due to the type of architectures and loss functions employed. Moreover, mapping canopy heights over tropical forests remains poorly studied, and the accurate height estimation of tall canopies is a challenge due to signal saturation from optical and radar sensors, persistent cloud covers and sometimes the limited penetration capabilities of LiDARs. Here, we map heights at 10 m resolution across the diverse landscape of Ghana with a new vision transformer (ViT) model optimized concurrently with a classification (discrete) and a regression (continuous) loss function. This model achieves better accuracy than previously used convolutional based approaches (ConvNets) optimized with only a continuous loss function. The ViT model results show that our proposed discrete/continuous loss significantly increases the sensitivity for very tall trees (i.e., > 35m), for which other approaches show saturation effects. The height maps generated by the ViT also have better ground sampling distance and better sensitivity to sparse vegetation in comparison to a convolutional model. Our ViT model has a RMSE of 3.12m in comparison to a reference dataset while the ConvNet model has a RMSE of 4.3m.
Abstract（参考訳）: 森林林高の正確な時間的モニタリングは,森林動態,生物多様性,炭素沈降,森林の劣化,森林伐採を評価する上で重要である。近年の深層学習技術の進歩と、膨大な宇宙搭載リモートセンシングデータを組み合わせることで、高空間および時間分解能で天蓋の高さをマッピングする前例のない機会が得られている。壁対壁キャノピー高さマッピングの最近の技術は、光学・レーダーセンサからのリモートセンシングされた2d情報をlidar計測による樹木の垂直構造に関連付けている。ディープラーニングアルゴリズムを用いた研究は、キャノピーの高さを正確にマッピングする上で有望な性能を示す一方で、アーキテクチャのタイプや損失関数による制限がある。さらに, 熱帯林に分布するキャノピー高のマッピングは未だ研究が進んでおらず, 光・レーダセンサからの信号飽和, 雲被覆, 時にはLiDARの浸透能力の制限などにより, 高いキャノピーの正確な高度推定は困難である。ここでは,ガーナの多様な景観にまたがる10mの高さを,分類(離散)と回帰(連続)損失関数を同時に最適化した新しいビジョントランスフォーマ(vit)モデルでマッピングする。このモデルは、従来の畳み込み型アプローチ(convnets)よりも精度が良く、連続損失関数のみに最適化されている。 vitモデルの結果,提案する離散的/連続的損失により,高木(35m以上)の感度が著しく向上し,他の手法では飽和効果が示された。 ViTによって生成された高さマップは、畳み込みモデルと比較して、より優れた地中サンプリング距離とスパース植生に対する感度を持つ。我々のViTモデルは参照データセットと比較してRMSEが3.12m、ConvNetモデルはRMSEが4.3mである。

関連論文リスト

TacoDepth: Towards Efficient Radar-Camera Depth Estimation with One-stage Fusion [54.46664104437454]
一段核融合を用いた効率的かつ正確なレーダ・カメラ深度推定モデルであるTacoDepthを提案する。具体的には、グラフベースのRadar構造抽出器とピラミッドベースのRadar融合モジュールを設計する。従来の最先端のアプローチと比較して、TacoDepthは深さ精度と処理速度を12.8%、91.8%改善している。
論文参考訳（メタデータ） (2025-04-16T05:25:04Z)
A Deep Learning Approach to Estimate Canopy Height and Uncertainty by Integrating Seasonal Optical, SAR and Limited GEDI LiDAR Data over Northern Forests [0.0]
本研究では,空間連続高分解能キャノピー高さと不確実性推定を生成する手法を提案する。我々は、Sentinel-1、Landsat、ALOS-PALSAR-2のマルチソース・マルチシーズン衛星データと、GEDI LiDARを基準データとして統合する。夏のみのデータの代わりに季節データを使用することで、変動率が10%向上し、エラーが0.45m減少し、バイアスが1m低下した。
論文参考訳（メタデータ） (2024-10-08T20:27:11Z)
HeightLane: BEV Heightmap guided 3D Lane Detection [6.940660861207046]
単分子画像からの正確な3次元車線検出は、深さのあいまいさと不完全な地盤モデリングによる重要な課題を示す。本研究は,マルチスロープ仮定に基づいてアンカーを作成することにより,単眼画像から高さマップを予測する革新的な手法であるHeightLaneを紹介する。 HeightLaneは、Fスコアの観点から最先端のパフォーマンスを実現し、現実世界のアプリケーションにおけるその可能性を強調している。
論文参考訳（メタデータ） (2024-08-15T17:14:57Z)
Depth Any Canopy: Leveraging Depth Foundation Models for Canopy Height Estimation [4.69726714177332]
世界樹高の推定は森林保全と気候変動の応用に不可欠である。効率的な代替手段として、キャノピーの高さ推定器を訓練して、単一ビューのリモートセンシング画像を操作する方法がある。近年の単眼深度推定基礎モデルでは,複雑なシーンにおいても強いゼロショット性能を示した。
論文参考訳（メタデータ） (2024-08-08T15:24:07Z)
NeRF-Det++: Incorporating Semantic Cues and Perspective-aware Depth Supervision for Indoor Multi-View 3D Detection [72.0098999512727]
NeRF-Detは、NeRFを用いた屋内マルチビュー3次元検出において、表現学習の強化による優れた性能を実現している。セマンティックエンハンスメント(セマンティックエンハンスメント)、パースペクティブ・アウェア・サンプリング(パースペクティブ・アウェア・サンプリング)、および順序深度監視を含む3つのソリューションを提案する。結果として得られたアルゴリズムであるNeRF-Det++は、ScanNetV2とAR KITScenesデータセットで魅力的なパフォーマンスを示している。
論文参考訳（メタデータ） (2024-02-22T11:48:06Z)
Accuracy and Consistency of Space-based Vegetation Height Maps for Forest Dynamics in Alpine Terrain [18.23260742076316]
スイス国立森林調査所(NFI)は、0.5mの空間解像度で全国の植生高度マップを提供している。これは、宇宙からのリモートセンシングと深層学習を用いて、大規模な植生高度マップを生成することで改善できる。センチネル2衛星画像に基づいて,2017年から2020年までの10m地点で年間,全国の植生高度マップを作成した。
論文参考訳（メタデータ） (2023-09-04T20:23:57Z)
MonoTDP: Twin Depth Perception for Monocular 3D Object Detection in Adverse Scenes [49.21187418886508]
本論文は,モノTDP(MonoTDP)と呼ばれる悪シーンにおける2つの深度を知覚するモノクル3次元検出モデルを提案する。まず、制御不能な気象条件を扱うモデルを支援するための適応学習戦略を導入し、様々な劣化要因による劣化を著しく抑制する。そこで本研究では, シーン深度と物体深度を同時に推定する新たな2つの深度認識モジュールを提案する。
論文参考訳（メタデータ） (2023-05-18T13:42:02Z)
Very high resolution canopy height maps from RGB imagery using self-supervised vision transformer and convolutional decoder trained on Aerial Lidar [14.07306593230776]
本稿では,複数の非国家の管轄区域で同時に作成される最初の高分解能天蓋の高さマップについて述べる。地図は、2017年から2020年にかけて、マクサー画像に基づいて訓練された自己教師モデルから特徴を抽出することによって生成される。また、GEDI観測に基づいて訓練された畳み込みネットワークを用いた後処理のステップも導入する。
論文参考訳（メタデータ） (2023-04-14T15:52:57Z)
On Robust Cross-View Consistency in Self-Supervised Monocular Depth Estimation [56.97699793236174]
本論文では,2種類の堅牢なクロスビュー整合性について検討する。深度特徴空間と3次元ボクセル空間の時間的コヒーレンスを自己教師付き単眼深度推定に利用した。いくつかのアウトドアベンチマークの実験結果から,本手法は最先端技術より優れていることが示された。
論文参考訳（メタデータ） (2022-09-19T03:46:13Z)
A Multi-Stage model based on YOLOv3 for defect detection in PV panels based on IR and Visible Imaging by Unmanned Aerial Vehicle [65.99880594435643]
本研究では,無人航空機が捉えた空中画像のパネル欠陥を検出するための新しいモデルを提案する。このモデルは、パネルと欠陥の検出を組み合わせることで、精度を向上する。提案モデルはイタリア南部の2つの大きなPVプラントで検証されている。
論文参考訳（メタデータ） (2021-11-23T08:04:32Z)
Progressive Coordinate Transforms for Monocular 3D Object Detection [52.00071336733109]
本稿では,学習座標表現を容易にするために,PCT(Em Progressive Coordinate Transforms)と呼ばれる,新しい軽量なアプローチを提案する。本稿では,学習座標表現を容易にするために,PCT(Em Progressive Coordinate Transforms)と呼ばれる,新しい軽量なアプローチを提案する。
論文参考訳（メタデータ） (2021-08-12T15:22:33Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。