論文の概要: SSL4Eco: A Global Seasonal Dataset for Geospatial Foundation Models in Ecology
- arxiv url: http://arxiv.org/abs/2504.18256v1
- Date: Fri, 25 Apr 2025 10:58:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-02 19:15:53.748128
- Title: SSL4Eco: A Global Seasonal Dataset for Geospatial Foundation Models in Ecology
- Title(参考訳): SSL4Eco:エコロジーにおける地理空間モデルのためのグローバルな季節データセット
- Authors: Elena Plekhanova, Damien Robert, Johannes Dollinger, Emilia Arens, Philipp Brun, Jan Dirk Wegner, Niklaus Zimmermann,
- Abstract要約: 自己教師付き学習は、ラベルのないデータからの学習表現を可能にした。
これらのモデルは、高い人間の活動領域に偏ったデータセットに基づいて訓練されることが多い。
植生の季節性を世界規模でより正確に把握するために, 簡易な表現インフォームドサンプリング戦略を提案する。
- 参考スコア(独自算出の注目度): 3.743127390843568
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: With the exacerbation of the biodiversity and climate crises, macroecological pursuits such as global biodiversity mapping become more urgent. Remote sensing offers a wealth of Earth observation data for ecological studies, but the scarcity of labeled datasets remains a major challenge. Recently, self-supervised learning has enabled learning representations from unlabeled data, triggering the development of pretrained geospatial models with generalizable features. However, these models are often trained on datasets biased toward areas of high human activity, leaving entire ecological regions underrepresented. Additionally, while some datasets attempt to address seasonality through multi-date imagery, they typically follow calendar seasons rather than local phenological cycles. To better capture vegetation seasonality at a global scale, we propose a simple phenology-informed sampling strategy and introduce corresponding SSL4Eco, a multi-date Sentinel-2 dataset, on which we train an existing model with a season-contrastive objective. We compare representations learned from SSL4Eco against other datasets on diverse ecological downstream tasks and demonstrate that our straightforward sampling method consistently improves representation quality, highlighting the importance of dataset construction. The model pretrained on SSL4Eco reaches state of the art performance on 7 out of 8 downstream tasks spanning (multi-label) classification and regression. We release our code, data, and model weights to support macroecological and computer vision research at https://github.com/PlekhanovaElena/ssl4eco.
- Abstract(参考訳): 生物多様性と気候危機の悪化により、グローバルな生物多様性マッピングのようなマクロ生態学的な追求がより緊急となる。
リモートセンシングは、生態学研究のための豊富な地球観測データを提供するが、ラベル付きデータセットの不足は依然として大きな課題である。
近年,自己教師付き学習によってラベルのないデータからの学習表現が可能となり,一般化可能な特徴を持つ事前訓練された地理空間モデルの開発が引き起こされた。
しかしながら、これらのモデルはしばしば、高い人間の活動領域に偏ったデータセットに基づいて訓練され、すべての生態領域が不足している。
さらに、いくつかのデータセットは、複数の日付の画像を通して季節に対処しようとするが、一般的には、局所的な現象のサイクルではなく、カレンダーの季節に従う。
植生の季節性を世界規模でより正確に把握するために, 簡易な表現インフォームドサンプリング戦略を提案し, 多日付Sentinel-2データセットであるSSL4Ecoを導入し, 季節差で既存のモデルを訓練する。
SSL4Ecoから学んだ表現を、多様な生態的な下流タスク上の他のデータセットと比較し、簡単なサンプリング手法が表現の質を一貫して改善し、データセット構築の重要性を強調していることを示す。
SSL4Ecoで事前トレーニングされたモデルは、(複数ラベル)分類と回帰にまたがる8つの下流タスクのうち7つで最先端のパフォーマンスに達する。
私たちは、https://github.com/PlekhanovaElena/ssl4eco.comでマクロ生態学およびコンピュータビジョン研究をサポートするために、コード、データ、モデルウェイトをリリースします。
関連論文リスト
- Efficient Self-Supervised Learning for Earth Observation via Dynamic Dataset Curation [67.23953699167274]
自己教師付き学習(SSL)により、地球観測のための視覚基盤モデルの開発が可能になった。
EOでは、この課題は衛星画像に共通する冗長性と重尾分布によって増幅される。
本稿では,データセットの多様性とバランスを最大化し,SSL事前トレーニングを改善するために設計された動的データセットプルーニング戦略を提案する。
論文 参考訳(メタデータ) (2025-04-09T15:13:26Z) - Image-Based Relocalization and Alignment for Long-Term Monitoring of Dynamic Underwater Environments [57.59857784298534]
本稿では,視覚的位置認識(VPR),特徴マッチング,画像分割を組み合わせた統合パイプラインを提案する。
本手法は, 再検討領域のロバスト同定, 剛性変換の推定, 生態系変化の下流解析を可能にする。
論文 参考訳(メタデータ) (2025-03-06T05:13:19Z) - Trajectory World Models for Heterogeneous Environments [67.27233466954814]
環境を横断するセンサーやアクチュエータの不均一性は、大規模な事前訓練された世界モデルを構築する上で大きな課題となる。
我々は80の環境から100万以上のトラジェクトリからなる統一データセットUniTrajを紹介した。
本稿では,様々なセンサやアクチュエータ情報を柔軟に処理し,環境ダイナミクスをコンテキスト内で捉えることのできる,新しいアーキテクチャであるTrajWorldを提案する。
論文 参考訳(メタデータ) (2025-02-03T13:59:08Z) - EarthView: A Large Scale Remote Sensing Dataset for Self-Supervision [72.84868704100595]
本稿では,地球モニタリングタスクにおける深層学習アプリケーションを強化することを目的とした,リモートセンシングデータの自己監督を目的としたデータセットを提案する。
このデータセットは15テラピクセルのグローバルリモートセンシングデータにまたがっており、NEON、Sentinel、Satellogicによる1mの空間解像度データの新たなリリースなど、さまざまなソースの画像を組み合わせている。
このデータセットは、リモートセンシングデータの異なる課題に取り組むために開発されたMasked Autoencoderである。
論文 参考訳(メタデータ) (2025-01-14T13:42:22Z) - MiTREE: Multi-input Transformer Ecoregion Encoder for Species Distribution Modelling [2.3776390335270694]
我々は、エコリージョンエンコーダを備えたマルチインプット・ビジョン・トランスフォーマー・モデルであるMiTREEを紹介する。
夏期と冬期のサットバードデータセットを用いて,鳥種の出現率を予測することを目的として,本モデルの評価を行った。
論文 参考訳(メタデータ) (2024-12-25T22:20:47Z) - DivShift: Exploring Domain-Specific Distribution Shifts in Large-Scale, Volunteer-Collected Biodiversity Datasets [0.0]
iNaturalistのような、コミュニティが特定した自然界の画像の大規模でボランティアが収集したデータセットは、機械学習手法を用いて種をきめ細かな視覚的分類するために、顕著なパフォーマンス向上を実現している。
ここでは、ドメイン固有の分散シフトが機械学習モデルの性能に与える影響を定量化するフレームワークであるDiversity Shiftを紹介する。
また、ボランティアが収集した生物多様性データに特有のバイアスの効果を診断するために、北米西海岸の約750万枚のiNaturalist画像のキュレートされたデータセットであるDivShift-North American West Coast (DivShift-NAWC)を紹介した。
論文 参考訳(メタデータ) (2024-10-17T23:56:30Z) - Combining Observational Data and Language for Species Range Estimation [63.65684199946094]
我々は,数百万の市民科学種の観察とウィキペディアのテキスト記述を組み合わせた新しいアプローチを提案する。
我々のフレームワークは、場所、種、テキスト記述を共通空間にマッピングし、テキスト記述からゼロショット範囲の推定を可能にする。
また,本手法は観測データと組み合わせることで,少ないデータでより正確な距離推定を行うことができる。
論文 参考訳(メタデータ) (2024-10-14T17:22:55Z) - Enhancing Ecological Monitoring with Multi-Objective Optimization: A Novel Dataset and Methodology for Segmentation Algorithms [17.802456388479616]
オーストラリア, ニューサウスウェールズ州ベガバレーで, 外来種および外来種を捉えた6,096個の高分解能空中画像のユニークなセマンティックセマンティックセマンティクスデータセットを導入した。
このデータセットは、草種の重複と分布のため、困難な課題を示す。
データセットとコードは公開され、コンピュータビジョン、機械学習、生態学の研究を促進することを目的としている。
論文 参考訳(メタデータ) (2024-07-25T18:27:27Z) - EcoVerse: An Annotated Twitter Dataset for Eco-Relevance Classification, Environmental Impact Analysis, and Stance Detection [0.0]
EcoVerseは、さまざまな環境トピックにまたがる3,023のツイートからなる、英語の注釈付きTwitterデータセットである。
本研究では,環境関連分類,スタンス検出,環境影響分析のための独自のアプローチの導入を目的とした3段階のアノテーションスキームを提案する。
論文 参考訳(メタデータ) (2024-04-08T01:21:11Z) - SatBird: Bird Species Distribution Modeling with Remote Sensing and
Citizen Science Data [68.2366021016172]
本稿では,市民科学データベース eBird の観測データから得られたラベルを用いた,米国内の位置情報のサテライトデータセットである SatBird について述べる。
ケニアでは低データのレシエーションを表すデータセットも提供しています。
リモートセンシングタスクのためのSOTAモデルを含む、データセットのベースラインセットをベンチマークします。
論文 参考訳(メタデータ) (2023-11-02T02:00:27Z) - Spatial Implicit Neural Representations for Global-Scale Species Mapping [72.92028508757281]
ある種が観察された場所の集合を考えると、その種がどこにいても存在しないかを予測するためのモデルを構築することが目的である。
従来の手法は、新たな大規模クラウドソースデータセットを活用するのに苦労している。
本研究では,47k種の地理的範囲を同時に推定するために,空間入射ニューラル表現(SINR)を用いる。
論文 参考訳(メタデータ) (2023-06-05T03:36:01Z) - Ensembles of Vision Transformers as a New Paradigm for Automated
Classification in Ecology [0.0]
データ効率のよい画像変換器(DeiTs)のアンサンブルが従来のSOTA(SOTA)よりも大幅に優れていたことを示す。
テストしたすべてのデータセットに対して、新しいSOTAを実現し、以前のSOTAの18.48%から87.50%の誤差を削減した。
論文 参考訳(メタデータ) (2022-03-03T14:16:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。