論文の概要: GlobalGeoTree: A Multi-Granular Vision-Language Dataset for Global Tree Species Classification
- arxiv url: http://arxiv.org/abs/2505.12513v2
- Date: Sun, 25 May 2025 14:29:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-27 14:32:55.140861
- Title: GlobalGeoTree: A Multi-Granular Vision-Language Dataset for Global Tree Species Classification
- Title(参考訳): GlobalGeoTree: グローバルツリー分類のためのマルチグラニュラービジョンランゲージデータセット
- Authors: Yang Mu, Zhitong Xiong, Yi Wang, Muhammad Shahzad, Franz Essl, Mark van Kleunen, Xiao Xiang Zhu,
- Abstract要約: 木種分類のための包括的グローバルデータセットであるGlobalGeoTreeを紹介する。
GlobalGeoTreeは630万本の樹木が生えており、275科、2,734属21001種にまたがっている。
我々は,生物多様性研究と生態学応用における樹木種分類の進歩とイノベーションの育成のためのベンチマークを確立することを目的としている。
- 参考スコア(独自算出の注目度): 21.705561682467152
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Global tree species mapping using remote sensing data is vital for biodiversity monitoring, forest management, and ecological research. However, progress in this field has been constrained by the scarcity of large-scale, labeled datasets. To address this, we introduce GlobalGeoTree, a comprehensive global dataset for tree species classification. GlobalGeoTree comprises 6.3 million geolocated tree occurrences, spanning 275 families, 2,734 genera, and 21,001 species across the hierarchical taxonomic levels. Each sample is paired with Sentinel-2 image time series and 27 auxiliary environmental variables, encompassing bioclimatic, geographic, and soil data. The dataset is partitioned into GlobalGeoTree-6M for model pretraining and curated evaluation subsets, primarily GlobalGeoTree-10kEval for zero-shot and few-shot benchmarking. To demonstrate the utility of the dataset, we introduce a baseline model, GeoTreeCLIP, which leverages paired remote sensing data and taxonomic text labels within a vision-language framework pretrained on GlobalGeoTree-6M. Experimental results show that GeoTreeCLIP achieves substantial improvements in zero- and few-shot classification on GlobalGeoTree-10kEval over existing advanced models. By making the dataset, models, and code publicly available, we aim to establish a benchmark to advance tree species classification and foster innovation in biodiversity research and ecological applications.
- Abstract(参考訳): リモートセンシングデータを用いた世界樹種のマッピングは,生物多様性モニタリング,森林管理,生態学研究に不可欠である。
しかし、この分野での進歩は、大規模ラベル付きデータセットの不足によって制約されている。
そこで我々はGlobalGeoTreeを紹介した。GlobalGeoTreeは木種分類のための総合的グローバルデータセットである。
GlobalGeoTreeは630万本の樹木が生えており、275科、2,734属21,001種が階層的な分類レベルにある。
各サンプルは, バイオ気候, 地理的, 土壌データを含む, センチネル2画像時系列と27の補助環境変数とをペアリングする。
データセットはモデル事前トレーニングとキュレートされた評価サブセットのためにGlobalGeoTree-6Mに分割される。
このデータセットの有用性を示すために,GlobalGeoTree-6Mで事前訓練された視覚言語フレームワーク内で,ペア化されたリモートセンシングデータと分類学的テキストラベルを活用するベースラインモデルGeoTreeCLIPを導入する。
実験の結果,GeoTreeCLIPは既存モデルに比べてGlobalGeoTree-10kEvalのゼロショットと少数ショットの分類が大幅に改善されていることがわかった。
データセット,モデル,およびコードを公開することにより,木種の分類を向上し,生物多様性研究および生態学応用の革新を促進するためのベンチマークを確立することを目指す。
関連論文リスト
- BioCube: A Multimodal Dataset for Biodiversity Research [0.6749750044497732]
生態学および生物多様性研究のための微細なグローバルデータセットであるBioCubeを紹介する。
BioCubeは、画像、オーディオ記録、説明、環境DNA、植生指標、農業、森林、土地の指標、高解像度気候変数を通じて種を観察する。
すべての観測は、2000年から2020年の間、WGS84の測地システムの下で測地的に一致している。
論文 参考訳(メタデータ) (2025-05-16T09:46:08Z) - Geolocation with Real Human Gameplay Data: A Large-Scale Dataset and Human-Like Reasoning Framework [59.42946541163632]
3つの重要なコンポーネントを持つ包括的位置決めフレームワークを導入する。
大規模データセットGeoComp、新しい推論手法GeoCoT、評価指標GeoEval。
また,GeoCoTは解釈可能性を高めつつ,位置情報の精度を最大25%向上させることを示した。
論文 参考訳(メタデータ) (2025-02-19T14:21:25Z) - AGBD: A Global-scale Biomass Dataset [18.976975819550173]
衛星画像から地上バイオマスを推定するための既存のデータセットは限られている。
このデータセットは、GEDIミッションからのAGB参照データとSentinel-2とPALSAR-2の画像のデータを組み合わせる。
これには、密集した天蓋の高さマップ、標高マップ、土地被覆分類マップなど、事前処理された高水準の特徴が含まれている。
単一の行のコードで簡単にアクセスでき、グローバルなAGB推定への取り組みの確固たる基盤を提供する。
論文 参考訳(メタデータ) (2024-06-07T13:34:17Z) - Planted: a dataset for planted forest identification from multi-satellite time series [23.822292894884427]
森林プランテーションの認識のための5つの公共衛星のデータと,世界中の植林木種のデータからなるデータセットについて述べる。
PlantDという名前のデータセットには、41か国に分布する64種の木ラベルクラス(46属40種)の2M以上のサンプルが含まれている。
論文 参考訳(メタデータ) (2024-05-24T15:49:00Z) - SatBird: Bird Species Distribution Modeling with Remote Sensing and
Citizen Science Data [68.2366021016172]
本稿では,市民科学データベース eBird の観測データから得られたラベルを用いた,米国内の位置情報のサテライトデータセットである SatBird について述べる。
ケニアでは低データのレシエーションを表すデータセットも提供しています。
リモートセンシングタスクのためのSOTAモデルを含む、データセットのベースラインセットをベンチマークします。
論文 参考訳(メタデータ) (2023-11-02T02:00:27Z) - Spatial Implicit Neural Representations for Global-Scale Species Mapping [72.92028508757281]
ある種が観察された場所の集合を考えると、その種がどこにいても存在しないかを予測するためのモデルを構築することが目的である。
従来の手法は、新たな大規模クラウドソースデータセットを活用するのに苦労している。
本研究では,47k種の地理的範囲を同時に推定するために,空間入射ニューラル表現(SINR)を用いる。
論文 参考訳(メタデータ) (2023-06-05T03:36:01Z) - Hierarchical clustering with dot products recovers hidden tree structure [53.68551192799585]
本稿では,階層構造の回復に着目した凝集クラスタリングアルゴリズムの新しい視点を提案する。
クラスタを最大平均点積でマージし、例えば最小距離やクラスタ内分散でマージしないような、標準的なアルゴリズムの単純な変種を推奨する。
このアルゴリズムにより得られた木は、汎用確率的グラフィカルモデルの下で、データ中の生成的階層構造をボナフェイド推定することを示した。
論文 参考訳(メタデータ) (2023-05-24T11:05:12Z) - JSRT: James-Stein Regression Tree [55.2059664267247]
回帰木(RT)は機械学習やデータマイニングのコミュニティで広く使われている。
実際、RTの性能は、木構築/予測段階における個々のノードからのサンプルの局所的な平均に大きく依存している。
我々は,異なるノードからのグローバル情報を考慮した新しい回帰木であるJames-Stein Regression Tree (JSRT)を提案する。
論文 参考訳(メタデータ) (2020-10-18T16:28:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。