論文の概要: GreenHyperSpectra: A multi-source hyperspectral dataset for global vegetation trait prediction
- arxiv url: http://arxiv.org/abs/2507.06806v1
- Date: Wed, 09 Jul 2025 12:51:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-10 17:37:43.58603
- Title: GreenHyperSpectra: A multi-source hyperspectral dataset for global vegetation trait prediction
- Title(参考訳): GreenHyperSpectra:グローバル植生特性予測のためのマルチソースハイパースペクトルデータセット
- Authors: Eya Cherif, Arthur Ouaknine, Luke A. Brown, Phuong D. Dao, Kyle R. Kovach, Bing Lu, Daniel Mederer, Hannes Feilhauer, Teja Kattenborn, David Rolnick,
- Abstract要約: 実世界のクロスセンサーとクロスエコシステムのサンプルを含む事前学習データセットであるGreenHyperSpectraを提示する。
ラベル効率のよい多出力回帰モデルにグリーンHyperSpectraをうまく活用する。
我々の経験的分析は、特性予測のためのスペクトル表現の学習において大幅に改善されたことを示す。
- 参考スコア(独自算出の注目度): 15.87410077173391
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Plant traits such as leaf carbon content and leaf mass are essential variables in the study of biodiversity and climate change. However, conventional field sampling cannot feasibly cover trait variation at ecologically meaningful spatial scales. Machine learning represents a valuable solution for plant trait prediction across ecosystems, leveraging hyperspectral data from remote sensing. Nevertheless, trait prediction from hyperspectral data is challenged by label scarcity and substantial domain shifts (\eg across sensors, ecological distributions), requiring robust cross-domain methods. Here, we present GreenHyperSpectra, a pretraining dataset encompassing real-world cross-sensor and cross-ecosystem samples designed to benchmark trait prediction with semi- and self-supervised methods. We adopt an evaluation framework encompassing in-distribution and out-of-distribution scenarios. We successfully leverage GreenHyperSpectra to pretrain label-efficient multi-output regression models that outperform the state-of-the-art supervised baseline. Our empirical analyses demonstrate substantial improvements in learning spectral representations for trait prediction, establishing a comprehensive methodological framework to catalyze research at the intersection of representation learning and plant functional traits assessment. All code and data are available at: https://github.com/echerif18/HyspectraSSL.
- Abstract(参考訳): 葉の炭素含量や葉の質量などの植物形質は、生物多様性と気候変動の研究において必須の変数である。
しかし、従来のフィールドサンプリングでは、生態学的に意味のある空間スケールにおける特性変動をカバーできない。
機械学習は、リモートセンシングからのハイパースペクトルデータを活用することで、エコシステム全体にわたる植物特性予測に有用なソリューションである。
それでも、ハイパースペクトルデータからの特性予測は、ラベルの不足と相当なドメインシフト(センサー間の偏移、生態分布)によって困難であり、堅牢なクロスドメイン手法を必要とする。
本稿では,実世界のクロスセンサとクロスエコシステムのサンプルを含む事前学習データセットであるGreenHyperSpectraについて述べる。
我々は,流通シナリオとアウト・オブ・ディストリビューションシナリオを含む評価フレームワークを採用する。
我々はGreenHyperSpectraをラベル効率の高いマルチアウトプット回帰モデルに活用し、最先端の教師付きベースラインを上回る性能を実現した。
筆者らの実証分析は,特徴予測のためのスペクトル表現の学習において,表現学習と植物機能特性評価の交点における研究を触媒する包括的な方法論の枠組みを確立した。
すべてのコードとデータは、https://github.com/echerif18/HyspectraSSLで入手できる。
関連論文リスト
- Temporal-Spectral-Spatial Unified Remote Sensing Dense Prediction [62.376936772702905]
リモートセンシングのための現在のディープラーニングアーキテクチャは、基本的に堅固である。
本稿では,統合モデリングのための空間時間スペクトル統一ネットワーク(STSUN)について紹介する。
STSUNは任意の空間サイズ、時間長、スペクトル帯域で入力および出力データに適応することができる。
トレーニング可能なタスクの埋め込みにモデルを条件付けすることで、単一のアーキテクチャ内で異なる密集した予測タスクを統一する。
論文 参考訳(メタデータ) (2025-05-18T07:39:17Z) - SSL4Eco: A Global Seasonal Dataset for Geospatial Foundation Models in Ecology [3.743127390843568]
自己教師付き学習は、ラベルのないデータからの学習表現を可能にした。
これらのモデルは、高い人間の活動領域に偏ったデータセットに基づいて訓練されることが多い。
植生の季節性を世界規模でより正確に把握するために, 簡易な表現インフォームドサンプリング戦略を提案する。
論文 参考訳(メタデータ) (2025-04-25T10:58:44Z) - SatelliteCalculator: A Multi-Task Vision Foundation Model for Quantitative Remote Sensing Inversion [4.824120664293887]
定量的リモートセンシングインバージョンのための第1ビジョン基盤モデルであるサテライト計算機を紹介する。
物理的に定義されたインデックスアダプタを利用することで、100万以上のペアのサンプルからなる大規模なデータセットを自動的に構築する。
実験により、サテライト計算機は全てのタスクの競争精度を向上し、推論コストを大幅に削減することを示した。
論文 参考訳(メタデータ) (2025-04-18T03:48:04Z) - Exploring Beyond Logits: Hierarchical Dynamic Labeling Based on Embeddings for Semi-Supervised Classification [49.09505771145326]
モデル予測に依存しない階層型動的ラベル付け(HDL)アルゴリズムを提案し,画像埋め込みを用いてサンプルラベルを生成する。
本手法は,半教師付き学習における擬似ラベル生成のパラダイムを変える可能性がある。
論文 参考訳(メタデータ) (2024-04-26T06:00:27Z) - LITE: Modeling Environmental Ecosystems with Multimodal Large Language Models [25.047123247476016]
LITEは環境生態系モデリングのための大きな言語モデルである。
異なる環境変数を自然言語記述や線グラフ画像に変換することで統一する。
このステップでは、不完全な機能は、sparse Mixture-of-Expertsフレームワークによって説明される。
論文 参考訳(メタデータ) (2024-04-01T15:14:07Z) - SSL-SoilNet: A Hybrid Transformer-based Framework with Self-Supervised Learning for Large-scale Soil Organic Carbon Prediction [2.554658234030785]
本研究は,自己指導型コントラスト学習を通じて,マルチモーダル特徴間の地理的関連を学習することを目的とした,新しいアプローチを提案する。
提案手法は、2つの異なる大規模データセットに対して厳密なテストを行っている。
論文 参考訳(メタデータ) (2023-08-07T13:44:44Z) - Variational Classification [51.2541371924591]
我々は,変分オートエンコーダの訓練に用いるエビデンスローバウンド(ELBO)に類似した,モデルの訓練を目的とした変分目的を導出する。
軟質マックス層への入力を潜伏変数のサンプルとして扱うことで, 抽象化された視点から, 潜在的な矛盾が明らかとなった。
我々は、標準ソフトマックス層に見られる暗黙の仮定の代わりに、選択された潜在分布を誘導する。
論文 参考訳(メタデータ) (2023-05-17T17:47:19Z) - Generative models-based data labeling for deep networks regression:
application to seed maturity estimation from UAV multispectral images [3.6868861317674524]
種子の成熟度モニタリングは、気候変動とより制限的な慣行による農業における課題の増加である。
従来の手法は、フィールドでの限られたサンプリングと実験室での分析に基づいている。
マルチスペクトルUAV画像を用いたパセリ種子の成熟度推定手法の提案と,自動ラベリングのための新しいアプローチを提案する。
論文 参考訳(メタデータ) (2022-08-09T09:06:51Z) - Uncertainty Inspired RGB-D Saliency Detection [70.50583438784571]
本稿では,データラベリングプロセスから学習することで,RGB-D値検出の不確実性を利用した最初のフレームワークを提案する。
そこで本研究では,確率的RGB-Dサリエンシ検出を実現するために,サリエンシデータラベリングプロセスにインスパイアされた生成アーキテクチャを提案する。
6つの挑戦的RGB-Dベンチマークデータセットの結果から,サリエンシマップの分布を学習する際のアプローチの優れた性能が示された。
論文 参考訳(メタデータ) (2020-09-07T13:01:45Z) - Semi-Automatic Data Annotation guided by Feature Space Projection [117.9296191012968]
本稿では,適切な特徴空間投影と半教師付きラベル推定に基づく半自動データアノテーション手法を提案する。
MNISTデータセットとヒト腸内寄生虫の胎児不純物の有無による画像を用いて本手法の有効性を検証した。
この結果から,人間と機械の相補的能力を組み合わせた視覚分析ツールの付加価値が,より効果的な機械学習に有効であることが示唆された。
論文 参考訳(メタデータ) (2020-07-27T17:03:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。