論文の概要: Cryo-Bench: Benchmarking Foundation Models for Cryosphere Applications
- arxiv url: http://arxiv.org/abs/2603.01576v1
- Date: Mon, 02 Mar 2026 08:05:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-03 19:50:56.751045
- Title: Cryo-Bench: Benchmarking Foundation Models for Cryosphere Applications
- Title(参考訳): Cryo-Bench: Cryosphereアプリケーションのためのベンチマーク基盤モデル
- Authors: Saurabh Kaushik, Lalit Maurya, Beth Tellman,
- Abstract要約: Cryo-Benchは、主要なCryosphericコンポーネント間でGFMのパフォーマンスを評価するためにコンパイルされたベンチマークである。
UNet と ViT のベースラインとともに 14 の GFM を評価し,その利点,限界,最適利用戦略を評価する。
DOFA や TerraMind などの GFM は UNet より優れており、mIoU スコアは textbf59.53 、 textbf56.62 、 textbf56.60 である。
- 参考スコア(独自算出の注目度): 0.6281229317487581
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Geo-Foundation Models (GFMs) have been evaluated across diverse Earth observation task including multiple domains and have demonstrated strong potential of producing reliable maps even with sparse labels. However, benchmarking GFMs for Cryosphere applications has remained limited, primarily due to the lack of suitable evaluation datasets. To address this gap, we introduce \textbf{Cryo-Bench}, a benchmark compiled to evaluate GFM performance across key Cryospheric components. Cryo-Bench includes debris-covered glaciers, glacial lakes, sea ice, and calving fronts, spanning multiple sensors and broad geographic regions. We evaluate 14 GFMs alongside UNet and ViT baselines to assess their advantages, limitations, and optimal usage strategies. With a frozen encoder, UNet achieves the highest average mIoU of \textbf{66.38}, followed by TerraMind at \textbf{64.02} across five evluation dataset included in Cryo-Bench. In the few-shot setting (10\% input data), GFMs such as DOFA and TerraMind outperform UNet, achieving mIoU scores of \textbf{59.53}, \textbf{56.62}, and \textbf{56.60}, respectively, comapred to U-Net's 56.60. When fully finetuning GFMs, we observe inconsistent performance across datasets and models. However, tuning learning rate along with finetuning substantially improves GFM performance. For example, evaluation on two representative datasets (GLID and CaFFe) shows an average relative improvement of \textbf{12.77\%}. Despite having minimal Cryosphere representation in their pretraining data, GFMs exhibit notable domain adaptation capabilities and produce meaningful results across tasks. Based on our findings, We recommend encoder fine-tuning with hyperparameter optimization optimization to achieve the best possible performance, while using frozen encoders when users need quick results without extensive experimentation.(\href{https://github.com/Sk-2103/Cryo-Bench}{GitHub}).
- Abstract(参考訳): GFM(Geo-Foundation Models)は、複数の領域を含む多様な地球観測タスクにおいて評価され、スパースラベルでさえ信頼性の高い地図を作成する可能性を示している。
しかしながら、Cryosphere アプリケーション用のベンチマーク GFM は、主に適切な評価データセットが欠如しているため、制限され続けている。
このギャップに対処するために,主要なCryospheric コンポーネント間で GFM 性能を評価するためにコンパイルされたベンチマークである \textbf{Cryo-Bench} を導入する。
クライベンチには、破片で覆われた氷河、氷河湖、海氷、石灰化前線があり、複数のセンサーと広い地理的領域にまたがっている。
UNet と ViT のベースラインとともに 14 の GFM を評価し,その利点,限界,最適利用戦略を評価する。
凍結エンコーダにより、UNet は \textbf{66.38} の最高平均 mIoU を達成する。
少数の設定(10 % の入力データ)では、DOFA や TerraMind などの GFM が UNet を上回り、mIoU スコアは \textbf{59.53} と \textbf{56.62} と \textbf{56.60} となり、それぞれ U-Net の 56.60 にコンパイルされる。
GFMを完全に微調整すると、データセットやモデル間での一貫性のない性能が観察される。
しかし、微調整に伴う学習率の調整は、GCMの性能を大幅に向上させる。
例えば、2つの代表的なデータセット(GLIDとCaFFe)の評価では、textbf{12.77\%}の平均相対的な改善が示されている。
事前トレーニングデータにCryosphereの最小限の表現があるにもかかわらず、GFMは顕著なドメイン適応能力を示し、タスク間で有意義な結果をもたらす。
本研究は, 高速な実験を行う必要のある場合, 凍結エンコーダを用いながら, 最適性能を達成するために, ハイパーパラメータ最適化による微調整を推奨する。
(\href{https://github.com/Sk-2103/Cryo-Bench}{GitHub})。
関連論文リスト
- EncouRAGe: Evaluating RAG Local, Fast, and Reliable [18.46710400838861]
EncouRAGeは、Retrieval-Augmented Generation (RAG)システムの開発と評価を効率化するために設計されたPythonフレームワークである。
このフレームワークは科学的、多様な評価指標とローカルデプロイメントを強調しており、研究者はRAG内のデータセットを効率的に評価することができる。
論文 参考訳(メタデータ) (2025-10-31T15:19:29Z) - HyBiomass: Global Hyperspectral Imagery Benchmark Dataset for Evaluating Geospatial Foundation Models in Forest Aboveground Biomass Estimation [1.0408909053766147]
本研究では,森林表層バイオマス(AGB)推定のためのグローバル分散ベンチマークデータセットを提案する。
このベンチマークデータセットは、環境マッピング・分析プログラム(EnMAP)衛星からのHSIと、AGB密度推定の予測を組み合わせたものである。
このデータセットを用いた実験結果から,評価されたGeo-FMがベースラインU-Netの性能を上回り得るか,場合によっては超えることを示した。
論文 参考訳(メタデータ) (2025-06-12T21:29:20Z) - Parameter-Efficient Adaptation of Geospatial Foundation Models through Embedding Deflection [3.805591882842849]
DEFLECTは、非常に少数のパラメータを持つマルチスペクトル衛星画像にGFMを適用するための新しい戦略である。
5-10$times$より少ないパラメータで、オンパーまたはより高い精度で分類とセグメンテーションタスクを実現する。
論文 参考訳(メタデータ) (2025-03-12T15:53:58Z) - GFM-RAG: Graph Foundation Model for Retrieval Augmented Generation [83.72561905487447]
本稿では,新しいグラフ基盤モデル (GFM) である GFM-RAG について紹介する。
GFM-RAGは、複雑なクエリ-知識関係をキャプチャするグラフ構造を理由とする、革新的なグラフニューラルネットワークによって実現されている。
効率とニューラルスケーリング法則との整合性を維持しつつ、最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-02-03T07:04:29Z) - PANGAEA: A Global and Inclusive Benchmark for Geospatial Foundation Models [3.9031647202359667]
PANGAEAは標準化された評価プロトコルであり、さまざまなデータセット、タスク、解像度、センサーのモダリティ、時間性をカバーする。
我々は、このベンチマークで利用可能な最も人気のあるGFMを評価し、その性能を複数のドメインで分析する。
本研究は, GFMの限界を, 異なるシナリオ下で強調し, 教師付きモデルよりも常に優れていないことを示した。
論文 参考訳(メタデータ) (2024-12-05T14:40:41Z) - Degree-Conscious Spiking Graph for Cross-Domain Adaptation [51.58506501415558]
Spiking Graph Networks (SGNs) はグラフ分類において大きな可能性を証明している。
DeSGraDA(Degree-Consicious Spiking Graph for Cross-Domain Adaptation)という新しいフレームワークを紹介する。
DeSGraDAは3つのキーコンポーネントを持つドメイン間の一般化を強化する。
論文 参考訳(メタデータ) (2024-10-09T13:45:54Z) - Chasing Fairness in Graphs: A GNN Architecture Perspective [73.43111851492593]
グラフニューラルネットワーク(GNN)の統一最適化フレームワーク内で設計されたtextsfFair textsfMessage textsfPassing(FMP)を提案する。
FMPでは、アグリゲーションがまず隣人の情報を活用するために採用され、バイアス軽減ステップにより、人口集団ノードのプレゼンテーションセンタが明示的に統合される。
ノード分類タスクの実験により、提案されたFMPは、実世界の3つのデータセットの公平性と正確性の観点から、いくつかのベースラインを上回っていることが示された。
論文 参考訳(メタデータ) (2023-12-19T18:00:15Z) - SMaRt: Improving GANs with Score Matching Regularity [114.43433222721025]
生成的敵ネットワーク(GAN)は通常、基礎となる多様体が複雑である非常に多様なデータから学ぶのに苦労する。
スコアマッチングは、生成したデータポイントを実データ多様体へ持続的にプッシュする能力のおかげで、この問題に対する有望な解決策であることがわかった。
提案手法は, 実世界のデータセットにおいて, 近似スコア関数として機能する事前学習拡散モデルを用いて, 最先端のGANの性能を継続的に向上させることができることを示す。
論文 参考訳(メタデータ) (2023-11-30T03:05:14Z) - AdaSfM: From Coarse Global to Fine Incremental Adaptive Structure from
Motion [48.835456049755166]
AdaSfMは粗粒度適応型SfMアプローチであり、大規模かつ挑戦的なデータセットにスケーラブルである。
当社のアプローチはまず,低コストセンサによる計測を利用して,ビューグラフの信頼性を向上させる,粗大なグローバルSfMを実現する。
本手法では,全局所再構成をグローバルSfMの座標フレームに整合させるため,しきい値適応戦略を用いる。
論文 参考訳(メタデータ) (2023-01-28T09:06:50Z) - Exploiting Neighbor Effect: Conv-Agnostic GNNs Framework for Graphs with
Heterophily [58.76759997223951]
我々はフォン・ノイマンエントロピーに基づく新しい計量を提案し、GNNのヘテロフィリー問題を再検討する。
また、異種データセット上でのほとんどのGNNの性能を高めるために、Conv-Agnostic GNNフレームワーク(CAGNN)を提案する。
論文 参考訳(メタデータ) (2022-03-19T14:26:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。