Fugu-MT 論文翻訳(概要): SARLO-80: Worldwide Slant SAR Language Optic Dataset 80cm

論文の概要: SARLO-80: Worldwide Slant SAR Language Optic Dataset 80cm

arxiv url: http://arxiv.org/abs/2606.20523v1
Date: Thu, 18 Jun 2026 17:38:01 GMT
ステータス: 翻訳完了
システム内更新日: 2026-06-19 18:23:40.030733
Title: SARLO-80: Worldwide Slant SAR Language Optic Dataset 80cm
Title（参考訳）: SARLO-80: 世界規模のSAR言語光学データセット80cm
Authors: Solène Debuysère, Nicolas Trouvé, Nathan Letheule, Elise Colin, Georgia Channing,
Abstract要約: センサ独立複素データ(SICD)として分散されたオープンアクセスUmbraスポットライトによるVHR SAR-光テキストデータセットを提案する。約2500の世界のシーンから、SARデータを80cmのスランググリッドに標準化し、バンド限定のFFTリサンプリングを行い、1024×1024のパッチで画像をタイル化する。各SARパッチに対して、高分解能の光学タイルを取得し、局所座標対応を用いてSARグリッドにワープし、局所画素レベルのアライメントを行う。本データセットは,72ヶ国257カ所をカバーし,広い範囲の土地タイプとインフラを含む119,566個のトレーレットを含む。
参考スコア（独自算出の注目度）: 2.8218290601001854
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Multimodal foundation models have advanced rapidly thanks to large optical benchmarks, but comparable resources for synthetic aperture radar (SAR) remain limited. Existing SAR--optical datasets largely rely on low-resolution, intensity-only Ground Range Detected~(GRD) products and do not preserve complex-valued SAR measurements or native acquisition geometry, which restricts physically grounded multimodal learning. In particular, large-scale public datasets combining very-high-resolution (VHR) SAR SLC, aligned optical imagery, and natural-language descriptions are still lacking. We present a VHR SAR--optical--text dataset built from open-access Umbra spotlight acquisitions distributed as Sensor Independent Complex Data (SICD). From around 2,500 worldwide scenes (VV/HH, 20cm--2m native resolution), we standardize all SAR data to an 80cm slant-range grid via band-limited FFT resampling and tile the imagery into 1024 by 1024 patches. For each SAR patch, we retrieve a high-resolution optical tile and warp it into the SAR grid using local coordinate correspondences for local pixel-level alignment. We further generate three caption variants (SHORT/MID/LONG) per sample to support vision--language training and evaluation. Our dataset contains 119,566 triplets (complex and amplitude slant-range SAR patch, aligned optical patch, natural-language description) covering 257 locations across 72 countries and a broad range of land types and infrastructures. We release fixed train/validation/test splits and the full preprocessing and baseline code to enable reproducible benchmarks for multimodal alignment on cross-modal retrieval and conditional generation in native SAR geometry. The dataset is publicly available on the Hugging Face Hub at https://huggingface.co/datasets/ONERA/SARLO-80.
Abstract（参考訳）: マルチモーダル基礎モデルは大規模な光学ベンチマークによって急速に進歩しているが、合成開口レーダ(SAR)に匹敵する資源は依然として限られている。既存のSAR-光学データセットは、主に低解像度で強度のみのグラウンドレンジ検出〜(GRD)製品に依存しており、複雑な値のSAR測定や、物理的に基礎となるマルチモーダル学習を制限するネイティブな取得幾何学を保存していない。特に、超高解像度(VHR) SAR SLC、アライメント光学画像、自然言語記述を組み合わせた大規模な公開データセットは、いまだに不足している。本稿では,SICD(Sensor Independent Complex Data)として分散されたオープンアクセスUmbraスポットライトによるVHR SAR-光テキストデータセットを提案する。 2500の世界のシーン(VV/HH, 20cm--2mネイティブレゾリューション)から、帯域制限のFFTリサンプリングによってSARデータを80cmスランググリッドに標準化し、画像を1024×1024パッチにタイル化する。各SARパッチに対して、高分解能の光学タイルを取得し、局所座標対応を用いてSARグリッドにワープし、局所画素レベルのアライメントを行う。さらに3つの字幕変種(SHORT/MID/LONG)を生成し,視覚言語訓練と評価を支援する。本データセットは,72ヶ国にまたがる257カ所の土地とインフラを網羅する119,566個のトリプル(複雑・振幅スラントレンジSARパッチ,アライメント光学パッチ,自然言語記述)を含む。固定列車/検証/テスト分割と、全前処理およびベースラインコードを生成し、ネイティブSAR幾何学におけるクロスモーダル検索と条件生成のマルチモーダルアライメントのための再現可能なベンチマークを可能にする。データセットはHugging Face Hubでhttps://huggingface.co/datasets/ONERA/SARLO-80で公開されている。

関連論文リスト

CrossEarth-SAR: A SAR-Centric and Billion-Scale Geospatial Foundation Model for Domain Generalizable Semantic Segmentation [51.94680303125737]
我々は、新しい物理誘導型スパース・オブ・エキスパート(MoE)アーキテクチャに基づいて構築された、最初の10億ドル規模のSARビジョン基盤モデルであるCrossEarth-SARを紹介する。大規模な事前トレーニングを容易にするために,公共およびプライベートなSAR画像を統合する弱く完全に教師付きデータセットであるCrossEarth-SAR-200Kを開発した。また、8つの異なる領域ギャップをまたいだ22のサブベンチマークからなるベンチマークスイートを導入し、SAR画像上でのドメイン一般化セマンティックセマンティックセグメンテーションのための最初の統一標準を確立した。
論文参考訳（メタデータ） (2026-03-12T14:52:35Z)
SAR Strikes Back: A New Hope for RSVQA [1.6249398255272318]
リモートセンシング視覚質問回答(Remote Sensing Visual Question Answering、RSVQA)は、衛星画像から情報を抽出して自然言語で質問に答えるタスクである。本稿では,SARに基づくRSVQAを実現するためのデータセットと,そのタスクのための2つのパイプラインを探索する。
論文参考訳（メタデータ） (2025-01-14T14:07:48Z)
3MOS: Multi-sources, Multi-resolutions, and Multi-scenes dataset for Optical-SAR image matching [6.13702551312774]
光SAR画像マッチングのための大規模マルチソース、マルチ解像度、マルチシーンデータセット(3MOS)を紹介する。 6つの商用衛星からのSARデータを含む155Kの光学SAR画像対で構成され、解像度は1.25mから12.5mである。データは、都市、農村、平野、丘、山、水、砂漠、凍った土を含む8つのシーンに分類されている。
論文参考訳（メタデータ） (2024-04-01T00:31:11Z)
SARDet-100K: Towards Open-Source Benchmark and ToolKit for Large-Scale SAR Object Detection [79.23689506129733]
我々は,大規模SARオブジェクト検出のための新しいベンチマークデータセットとオープンソース手法を構築した。私たちのデータセットであるSARDet-100Kは、10の既存のSAR検出データセットの厳格な調査、収集、標準化の結果です。私たちの知る限りでは、SARDet-100KはCOCOレベルの大規模マルチクラスSARオブジェクト検出データセットとしては初めてのものです。
論文参考訳（メタデータ） (2024-03-11T09:20:40Z)
Ultra-High Resolution Segmentation with Ultra-Rich Context: A Novel Benchmark [57.55282704762691]
URURデータセットには、サイズ5,120x5,120の3,008枚の画像、63都市からの幅広い複雑なシーン、豊富なコンテキストが含まれている。また、UHRセグメンテーションのためのより効率的で効果的なフレームワークであるWSDNetを、特に超リッチなコンテキストで提案する。いくつかのUHRデータセットの実験は、最先端のパフォーマンスを示している。
論文参考訳（メタデータ） (2023-05-18T11:54:13Z)
The QXS-SAROPT Dataset for Deep Learning in SAR-Optical Data Fusion [14.45289690639374]
QXS-SAROPTデータセットを公開し、SAR-オプティカルデータ融合におけるディープラーニング研究を促進します。光学画像からのクロスモーダル情報によって強化されたSAR光画像マッチングとSAR船舶検出の2つの代表的な用途の例を示す。
論文参考訳（メタデータ） (2021-03-15T10:22:46Z)
X-ModalNet: A Semi-Supervised Deep Cross-Modal Network for Classification of Remote Sensing Data [69.37597254841052]
我々はX-ModalNetと呼ばれる新しいクロスモーダルディープラーニングフレームワークを提案する。 X-ModalNetは、ネットワークの上部にある高レベルな特徴によって構築されたアップダスタブルグラフ上にラベルを伝搬するため、うまく一般化する。我々は2つのマルチモーダルリモートセンシングデータセット(HSI-MSIとHSI-SAR)上でX-ModalNetを評価し、いくつかの最先端手法と比較して大幅に改善した。
論文参考訳（メタデータ） (2020-06-24T15:29:41Z)
SpaceNet 6: Multi-Sensor All Weather Mapping Dataset [13.715388432549373]
オープンなMulti-Sensor All Weather Mapping (MSAW)データセットと課題について述べる。 MSAWは複数の重なり合う集合体を120 km2で覆っており、48,000以上のユニークな建物フットプリントラベルがアノテートされている。我々は,SARデータを用いた足跡抽出のためのベースラインとベンチマークを提案し,光学データに基づいて事前訓練された最先端セグメンテーションモデルを発見し,SARで訓練した。
論文参考訳（メタデータ） (2020-04-14T13:43:11Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。