論文の概要: EarthSynth: Generating Informative Earth Observation with Diffusion Models
- arxiv url: http://arxiv.org/abs/2505.12108v1
- Date: Sat, 17 May 2025 18:27:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-20 14:57:11.043621
- Title: EarthSynth: Generating Informative Earth Observation with Diffusion Models
- Title(参考訳): 地球合成:拡散モデルによるインフォーマティブな地球観測の生成
- Authors: Jiancheng Pan, Shiye Lei, Yuqian Fu, Jiahao Li, Yanxing Liu, Yuze Sun, Xiao He, Long Peng, Xiaomeng Huang, Bo Zhao,
- Abstract要約: 本研究では,多カテゴリ・クロスサテライトによる地球観測が可能な拡散ベース生成基盤モデルを提案する。
オープンワールドシナリオにおけるシーン分類,オブジェクト検出,セマンティックセグメンテーションにおける地球合成の評価を行った。
- 参考スコア(独自算出の注目度): 20.42065634384315
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Remote sensing image (RSI) interpretation typically faces challenges due to the scarcity of labeled data, which limits the performance of RSI interpretation tasks. To tackle this challenge, we propose EarthSynth, a diffusion-based generative foundation model that enables synthesizing multi-category, cross-satellite labeled Earth observation for downstream RSI interpretation tasks. To the best of our knowledge, EarthSynth is the first to explore multi-task generation for remote sensing. EarthSynth, trained on the EarthSynth-180K dataset, employs the Counterfactual Composition training strategy to improve training data diversity and enhance category control. Furthermore, a rule-based method of R-Filter is proposed to filter more informative synthetic data for downstream tasks. We evaluate our EarthSynth on scene classification, object detection, and semantic segmentation in open-world scenarios, offering a practical solution for advancing RSI interpretation.
- Abstract(参考訳): リモートセンシング画像(RSI)の解釈は通常、ラベル付きデータの不足による課題に直面し、RSIの解釈タスクのパフォーマンスが制限される。
この課題に対処するために、下流RSI解釈タスクのためのマルチカテゴリ、クロスサテライトのラベル付き地球観測を合成できる拡散ベース生成基盤モデルであるEarthSynthを提案する。
私たちの知る限りでは、EarthSynthはリモートセンシングのためのマルチタスク生成を初めて探求している。
EarthSynth-180KデータセットでトレーニングされたEarthSynthは、トレーニングデータの多様性を改善し、カテゴリコントロールを強化するために、Counterfactual Compositionトレーニング戦略を採用している。
さらに,R-Filterのルールに基づく手法を提案し,より情報性の高い合成データを下流タスクにフィルタリングする。
オープンワールドシナリオにおけるシーン分類、オブジェクト検出、セマンティックセマンティックセグメンテーションに関するEarthSynthの評価を行い、RSI解釈の実践的なソリューションを提供する。
関連論文リスト
- EarthMapper: Visual Autoregressive Models for Controllable Bidirectional Satellite-Map Translation [50.433911327489554]
制御可能な衛星マップ翻訳のための新しいフレームワークであるEarthMapperを紹介する。
また,中国38都市を対象とした302,132組の衛星マップからなる大規模データセットであるCNSatMapをコントリビュートした。
CNSatMapとNew Yorkデータセットの実験は、EarthMapperの優れたパフォーマンスを実証している。
論文 参考訳(メタデータ) (2025-04-28T02:41:12Z) - Efficient Self-Supervised Learning for Earth Observation via Dynamic Dataset Curation [67.23953699167274]
自己教師付き学習(SSL)により、地球観測のための視覚基盤モデルの開発が可能になった。
EOでは、この課題は衛星画像に共通する冗長性と重尾分布によって増幅される。
本稿では,データセットの多様性とバランスを最大化し,SSL事前トレーニングを改善するために設計された動的データセットプルーニング戦略を提案する。
論文 参考訳(メタデータ) (2025-04-09T15:13:26Z) - ViSIR: Vision Transformer Single Image Reconstruction Method for Earth System Models [0.0]
地球系モデル (ESM) は、大気、海、陸、氷、生物圏の相互作用を統合し、地域気候と地球気候の状態を推定する。
本研究では,視覚変換器の正弦波表現ネットワーク(ViSIR)を提案する。
論文 参考訳(メタデータ) (2025-02-10T18:09:45Z) - No Location Left Behind: Measuring and Improving the Fairness of Implicit Representations for Earth Data [13.412573082645096]
暗黙の神経表現(INR)は、地球表象の課題に対処する上での公約が増大している。
既存の手法はグローバルな平均性能を不均等に優先する。
FAIR-Earthは、地球表象の不等式を調べ、挑戦するための第一種データセットである。
論文 参考訳(メタデータ) (2025-02-05T16:51:13Z) - EarthView: A Large Scale Remote Sensing Dataset for Self-Supervision [72.84868704100595]
本稿では,地球モニタリングタスクにおける深層学習アプリケーションを強化することを目的とした,リモートセンシングデータの自己監督を目的としたデータセットを提案する。
このデータセットは15テラピクセルのグローバルリモートセンシングデータにまたがっており、NEON、Sentinel、Satellogicによる1mの空間解像度データの新たなリリースなど、さまざまなソースの画像を組み合わせている。
このデータセットは、リモートセンシングデータの異なる課題に取り組むために開発されたMasked Autoencoderである。
論文 参考訳(メタデータ) (2025-01-14T13:42:22Z) - EarthDial: Turning Multi-sensory Earth Observations to Interactive Dialogues [46.601134018876955]
本研究では,地球観測(EO)データに特化して設計された対話型アシスタントであるEarthDialを紹介する。
EarthDialはマルチスペクトル、マルチテンポラル、マルチ解像度の画像をサポートし、幅広いリモートセンシングタスクを可能にする。
44の下流データセットに対する実験結果から、EarthDialは既存のジェネリックモデルやドメイン固有モデルよりも優れていることが示された。
論文 参考訳(メタデータ) (2024-12-19T18:57:13Z) - SARATR-X: Toward Building A Foundation Model for SAR Target Recognition [22.770010893572973]
SAR ATRの基盤モデル構築に向けた最初の試みをSARATR-Xと呼ぶ。
SARATR-Xは、自己教師付き学習(SSL)を通じて一般化可能な表現を学び、汎用的なSARターゲット検出と分類タスクへのラベル効率のモデル適応のための基盤を提供する。
SARATR-Xは0.18Mの未ラベルのSARターゲットサンプルで訓練されており、これは同時代のベンチマークを組み合わせてキュレーションされ、これまでで最大の公開データセットとなっている。
論文 参考訳(メタデータ) (2024-05-15T14:17:44Z) - Multimodal Dataset from Harsh Sub-Terranean Environment with Aerosol
Particles for Frontier Exploration [55.41644538483948]
本稿では, エアロゾル粒子を用いた過酷で非構造的な地下環境からのマルチモーダルデータセットを提案する。
ロボットオペレーティング・システム(ROS)フォーマットのすべてのオンボードセンサーから、同期された生データ計測を含んでいる。
本研究の焦点は、時間的・空間的なデータの多様性を捉えることだけでなく、取得したデータに厳しい条件が及ぼす影響を示すことである。
論文 参考訳(メタデータ) (2023-04-27T20:21:18Z) - Synthetic Wave-Geometric Impulse Responses for Improved Speech
Dereverberation [69.1351513309953]
室内インパルス応答 (RIR) の低周波成分を正確にシミュレートすることが, 良好な脱ヴァーベレーションを実現する上で重要であることを示す。
本研究では, ハイブリッド合成RIRで訓練された音声残響モデルが, 従来の幾何線トレーシング法により学習されたRIRで訓練されたモデルよりも優れていたことを示す。
論文 参考訳(メタデータ) (2022-12-10T20:15:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。