論文の概要: SMART-Ship: A Comprehensive Synchronized Multi-modal Aligned Remote Sensing Targets Dataset and Benchmark for Berthed Ships Analysis
- arxiv url: http://arxiv.org/abs/2508.02384v1
- Date: Mon, 04 Aug 2025 13:09:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-05 18:25:22.346157
- Title: SMART-Ship: A Comprehensive Synchronized Multi-modal Aligned Remote Sensing Targets Dataset and Benchmark for Berthed Ships Analysis
- Title(参考訳): SMART-Ship: 総合的同期型マルチモーダルアライメントリモートセンシングターゲットデータセットとベルト船解析のためのベンチマーク
- Authors: Chen-Chen Fan, Peiyao Guo, Linping Zhang, Kehan Qi, Haolin Huang, Yong-Qiang Mao, Yuxi Suo, Zhizhuo Jiang, Yu Liu, You He,
- Abstract要約: このデータセットは1092個のマルチモーダル画像セットで構成され、38,838隻の船をカバーしている。
各画像セットは1週間以内に取得され、時間的一貫性を確保するために登録される。
5つの基本的なタスクのベンチマークを定義し、データセット間でメソッドを比較します。
- 参考スコア(独自算出の注目度): 12.87083600993665
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Given the limitations of satellite orbits and imaging conditions, multi-modal remote sensing (RS) data is crucial in enabling long-term earth observation. However, maritime surveillance remains challenging due to the complexity of multi-scale targets and the dynamic environments. To bridge this critical gap, we propose a Synchronized Multi-modal Aligned Remote sensing Targets dataset for berthed ships analysis (SMART-Ship), containing spatiotemporal registered images with fine-grained annotation for maritime targets from five modalities: visible-light, synthetic aperture radar (SAR), panchromatic, multi-spectral, and near-infrared. Specifically, our dataset consists of 1092 multi-modal image sets, covering 38,838 ships. Each image set is acquired within one week and registered to ensure spatiotemporal consistency. Ship instances in each set are annotated with polygonal location information, fine-grained categories, instance-level identifiers, and change region masks, organized hierarchically to support diverse multi-modal RS tasks. Furthermore, we define standardized benchmarks on five fundamental tasks and comprehensively compare representative methods across the dataset. Thorough experiment evaluations validate that the proposed SMART-Ship dataset could support various multi-modal RS interpretation tasks and reveal the promising directions for further exploration.
- Abstract(参考訳): 衛星軌道と撮像条件の限界を考えると、マルチモーダルリモートセンシング(RS)データは長期的な地球観測に不可欠である。
しかし、マルチスケールターゲットと動的環境の複雑さのため、海上監視は依然として困難である。
この重要なギャップを埋めるために, 近赤外光, 合成開口レーダ (SAR) , 汎色, マルチスペクトル, 近赤外光の5つのモードから, 海中目標に対する微粒なアノテーションを付した時空間登録画像を含む, バースト船解析のための同期型マルチモーダルアラインドリモートセンシングターゲットデータセットを提案する。
具体的には、我々のデータセットは、38,838隻の船舶をカバーする1092個のマルチモーダル画像集合で構成されている。
各画像セットは1週間以内に取得され、時空間一貫性を確保するために登録される。
各セットの船のインスタンスには、多角形の位置情報、きめ細かいカテゴリ、インスタンスレベルの識別子、変更領域マスクがアノテートされ、階層的に構成され、多様なマルチモーダルRSタスクをサポートする。
さらに,5つの基本的なタスクの標準化されたベンチマークを定義し,データセット間の代表的メソッドを包括的に比較する。
詳細な実験評価により、提案したSMART-Shipデータセットは、様々なマルチモーダルRS解釈タスクをサポートし、さらなる探索のための有望な方向を明らかにすることができることが示された。
関連論文リスト
- Cross-modal Ship Re-Identification via Optical and SAR Imagery: A Novel Dataset and Method [16.8202125093375]
海上での船の追跡は、海上捜索救助、法執行、船舶分析などの用途に不可欠である。
現在の船舶追跡手法のほとんどは静止衛星やビデオ衛星に依存している。
これらの制約に対処するため,Hybrid Optical and Synthetic Aperture Radar (SAR) Ship Re-Identificationデータセットを提案する。
論文 参考訳(メタデータ) (2025-06-27T09:13:22Z) - MSSDF: Modality-Shared Self-supervised Distillation for High-Resolution Multi-modal Remote Sensing Image Learning [25.381211868583826]
本稿では,高解像度RGB画像,マルチスペクトルデータ,デジタル表面モデル(DSM)を事前学習に用いるマルチモーダル自己教師学習フレームワークを提案する。
提案手法は,シーン分類,セマンティックセグメンテーション,変化検出,オブジェクト検出,深度推定など,典型的なリモートセンシングアプリケーションを対象として,複数のダウンストリームタスクに対して評価を行う。
論文 参考訳(メタデータ) (2025-06-11T02:01:36Z) - MID: A Comprehensive Shore-Based Dataset for Multi-Scale Dense Ship Occlusion and Interaction Scenarios [10.748210940033484]
海上航行行動データセット(MID)は、複雑な海上環境における船舶検出の課題に対処するために設計されている。
MIDには5,673の画像と135,884の微調整されたターゲットインスタンスが含まれており、教師付き学習と半教師付き学習の両方をサポートしている。
MIDの画像は、43の水域を横断する現実世界のナビゲーションの高精細なビデオクリップから得られたもので、天候や照明条件も様々である。
論文 参考訳(メタデータ) (2024-12-08T09:34:23Z) - MTMMC: A Large-Scale Real-World Multi-Modal Camera Tracking Benchmark [63.878793340338035]
マルチターゲットマルチカメラトラッキングは、複数のカメラからのビデオストリームを使用して個人を特定し、追跡する重要なタスクである。
このタスクの既存のデータセットは、制御されたカメラネットワーク設定内で合成または人工的に構築される。
我々は16台のマルチモーダルカメラで2つの異なる環境でキャプチャされた長いビデオシーケンスを含む実世界の大規模データセットであるMTMMCを紹介する。
論文 参考訳(メタデータ) (2024-03-29T15:08:37Z) - SARDet-100K: Towards Open-Source Benchmark and ToolKit for Large-Scale SAR Object Detection [79.23689506129733]
我々は,大規模SARオブジェクト検出のための新しいベンチマークデータセットとオープンソース手法を構築した。
私たちのデータセットであるSARDet-100Kは、10の既存のSAR検出データセットの厳格な調査、収集、標準化の結果です。
私たちの知る限りでは、SARDet-100KはCOCOレベルの大規模マルチクラスSARオブジェクト検出データセットとしては初めてのものです。
論文 参考訳(メタデータ) (2024-03-11T09:20:40Z) - SISP: A Benchmark Dataset for Fine-grained Ship Instance Segmentation in
Panchromatic Satellite Images [25.259591254585388]
本研究では,パンクロマティック衛星画像,すなわちSISPの粒度の細かいShip Instanceのベンチマークデータセットを提案する。
SISPには56,693のよく注釈付けされた船のインスタンスがあり、1万のスライスされた画像に4つの細かいカテゴリがある。
提案したSISPデータセットのターゲットには、実際の衛星シーンと整合した特性がある。
論文 参考訳(メタデータ) (2024-02-06T05:02:33Z) - Rotated Multi-Scale Interaction Network for Referring Remote Sensing Image Segmentation [63.15257949821558]
Referring Remote Sensing Image (RRSIS)は、コンピュータビジョンと自然言語処理を組み合わせた新しい課題である。
従来の参照画像(RIS)アプローチは、空中画像に見られる複雑な空間スケールと向きによって妨げられている。
本稿ではRMSIN(Rotated Multi-Scale Interaction Network)を紹介する。
論文 参考訳(メタデータ) (2023-12-19T08:14:14Z) - Visible-Thermal UAV Tracking: A Large-Scale Benchmark and New Baseline [80.13652104204691]
本稿では,可視熱UAV追跡(VTUAV)のための高多様性の大規模ベンチマークを構築する。
本稿では, フレームレベルの属性を, チャレンジ固有のトラッカーの可能性を利用するための粗粒度属性アノテーションを提案する。
さらに,様々なレベルでRGB-Tデータを融合するHMFT(Hierarchical Multi-modal Fusion Tracker)という新しいRGB-Tベースラインを設計する。
論文 参考訳(メタデータ) (2022-04-08T15:22:33Z) - Know Your Surroundings: Panoramic Multi-Object Tracking by Multimodality
Collaboration [56.01625477187448]
MMPAT(MultiModality PAnoramic Multi-object Tracking framework)を提案する。
2次元パノラマ画像と3次元点雲を入力とし、マルチモーダルデータを用いて目標軌道を推定する。
提案手法は,検出タスクと追跡タスクの両方においてMMPATが最高性能を達成するJRDBデータセット上で評価する。
論文 参考訳(メタデータ) (2021-05-31T03:16:38Z) - X-ModalNet: A Semi-Supervised Deep Cross-Modal Network for
Classification of Remote Sensing Data [69.37597254841052]
我々はX-ModalNetと呼ばれる新しいクロスモーダルディープラーニングフレームワークを提案する。
X-ModalNetは、ネットワークの上部にある高レベルな特徴によって構築されたアップダスタブルグラフ上にラベルを伝搬するため、うまく一般化する。
我々は2つのマルチモーダルリモートセンシングデータセット(HSI-MSIとHSI-SAR)上でX-ModalNetを評価し、いくつかの最先端手法と比較して大幅に改善した。
論文 参考訳(メタデータ) (2020-06-24T15:29:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。