論文の概要: Deep Learning in Multimodal Remote Sensing Data Fusion: A Comprehensive
Review
- arxiv url: http://arxiv.org/abs/2205.01380v1
- Date: Tue, 3 May 2022 09:08:16 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-04 13:36:24.438434
- Title: Deep Learning in Multimodal Remote Sensing Data Fusion: A Comprehensive
Review
- Title(参考訳): マルチモーダルリモートセンシングデータ融合における深層学習
- Authors: Jiaxin Li, Danfeng Hong, Lianru Gao, Jing Yao, Ke Zheng, Bing Zhang,
Jocelyn Chanussot
- Abstract要約: 本調査は,DLに基づくマルチモーダルRSデータ融合の体系的概要を示すことを目的としている。
マルチモーダルRSデータ融合におけるサブフィールドについて,to-be-fusedデータモダリティの観点から検討する。
残る課題と今後の方向性が強調される。
- 参考スコア(独自算出の注目度): 33.40031994803646
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With the extremely rapid advances in remote sensing (RS) technology, a great
quantity of Earth observation (EO) data featuring considerable and complicated
heterogeneity is readily available nowadays, which renders researchers an
opportunity to tackle current geoscience applications in a fresh way. With the
joint utilization of EO data, much research on multimodal RS data fusion has
made tremendous progress in recent years, yet these developed traditional
algorithms inevitably meet the performance bottleneck due to the lack of the
ability to comprehensively analyse and interpret these strongly heterogeneous
data. Hence, this non-negligible limitation further arouses an intense demand
for an alternative tool with powerful processing competence. Deep learning
(DL), as a cutting-edge technology, has witnessed remarkable breakthroughs in
numerous computer vision tasks owing to its impressive ability in data
representation and reconstruction. Naturally, it has been successfully applied
to the field of multimodal RS data fusion, yielding great improvement compared
with traditional methods. This survey aims to present a systematic overview in
DL-based multimodal RS data fusion. More specifically, some essential knowledge
about this topic is first given. Subsequently, a literature survey is conducted
to analyse the trends of this field. Some prevalent sub-fields in the
multimodal RS data fusion are then reviewed in terms of the to-be-fused data
modalities, i.e., spatiospectral, spatiotemporal, light detection and
ranging-optical, synthetic aperture radar-optical, and RS-Geospatial Big Data
fusion. Furthermore, We collect and summarize some valuable resources for the
sake of the development in multimodal RS data fusion. Finally, the remaining
challenges and potential future directions are highlighted.
- Abstract(参考訳): リモートセンシング(rs)技術の急速な進歩により、大量の地球観測データ(eo)が、非常に複雑で複雑な異質性を特徴とするものになってきている。
eoデータの共同利用により、近年はマルチモーダルrsデータ融合の研究が盛んに進んでいるが、これらの強力な異種データを総合的に分析し解釈する能力の欠如により、従来のアルゴリズムは性能ボトルネックを必然的に満たしている。
したがって、この非無視的な制限により、強力な処理能力を持つ代替ツールの需要はさらに高まる。
最先端技術であるdeep learning(dl)は、データ表現と再構成の素晴らしい能力によって、多くのコンピュータビジョンタスクにおいて驚くべきブレークスルーを目撃している。
当然、マルチモーダルRSデータ融合の分野にも適用され、従来の手法に比べて大幅に改善されている。
本調査は,DLに基づくマルチモーダルRSデータ融合の体系的概要を示すことを目的としている。
より具体的には、このトピックに関する基本的な知識が最初に与えられる。
その後、この分野の動向を分析するために文献調査が行われる。
マルチモーダルRSデータ融合におけるいくつかの代表的なサブフィールドは、ト・バイ・フュージョン(to-be-fused)データモダリティ(spatiospectral, spatiotemporal, light detection and range-optical, synthetic aperture radar-optical, RS-Geospatial Big Data fusion)でレビューされる。
さらに,マルチモーダルrsデータ融合における開発のために,貴重な資源を収集し,まとめる。
最後に、残る課題と今後の方向性が強調される。
関連論文リスト
- Foundation Models for Remote Sensing and Earth Observation: A Survey [101.77425018347557]
本調査は、リモートセンシング基礎モデル(RSFM)の新しい分野を体系的にレビューする。
モチベーションと背景の概要から始まり、続いて基本概念が導入された。
我々はこれらのモデルを公開データセットと比較し、既存の課題について議論し、今後の研究方向性を提案する。
論文 参考訳(メタデータ) (2024-10-22T01:08:21Z) - From Linguistic Giants to Sensory Maestros: A Survey on Cross-Modal Reasoning with Large Language Models [56.9134620424985]
クロスモーダル推論(CMR)は、より高度な人工知能システムへの進化における重要な能力として、ますます認識されている。
CMRタスクに取り組むためにLLM(Large Language Models)をデプロイする最近のトレンドは、その有効性を高めるためのアプローチの新たな主流となっている。
本調査では,LLMを用いてCMRで適用された現在の方法論を,詳細な3階層分類に分類する。
論文 参考訳(メタデータ) (2024-09-19T02:51:54Z) - Earth System Data Cubes: Avenues for advancing Earth system research [4.408949931570938]
地球系データキューブ(ESDC)は、このデータの洪水をシンプルで堅牢なフォーマットに変換するのに適したソリューションの1つとして登場した。
ESDCは、データをテンポラリグリッドを備えた分析可能なフォーマットに整理することで、これを実現している。
新たなクラウドベースの技術に照らして、データの潜在能力を最大限に実現するための障壁がある。
論文 参考訳(メタデータ) (2024-08-05T09:50:16Z) - Semantic-Aware Representation of Multi-Modal Data for Data Ingress: A Literature Review [1.8590097948961688]
LLM(Large Language Models)のような生成AIは、テキスト、画像、オーディオ、ビデオなどのマルチモーダルデータを処理するために広く採用されている。
このデータを効率的に管理することは、データ量が2倍にならないため、業界倍の課題となっている。
本研究では,モノモーダル,マルチモーダル,クロスモーダルデータから埋め込みを抽出するセマンティック・アウェア技術に着目した。
論文 参考訳(メタデータ) (2024-07-17T09:49:11Z) - MMA-DFER: MultiModal Adaptation of unimodal models for Dynamic Facial Expression Recognition in-the-wild [81.32127423981426]
実世界のアプリケーションでは,音声およびビデオデータに基づくマルチモーダル感情認識が重要である。
近年の手法は、強力なマルチモーダルエンコーダの事前学習に自己教師付き学習(SSL)の進歩を活用することに重点を置いている。
SSL-pre-trained disimodal encoders を用いて,この問題に対する異なる視点とマルチモーダル DFER の性能向上について検討する。
論文 参考訳(メタデータ) (2024-04-13T13:39:26Z) - Enhancing Human-like Multi-Modal Reasoning: A New Challenging Dataset
and Comprehensive Framework [51.44863255495668]
マルチモーダル推論は、人間のような知性を示す人工知能システムの追求において重要な要素である。
提案するマルチモーダル推論(COCO-MMR)データセットは,オープンエンド質問の集合を包含する新しいデータセットである。
画像とテキストエンコーダを強化するために,マルチホップ・クロスモーダル・アテンションや文レベルのコントラスト学習などの革新的な手法を提案する。
論文 参考訳(メタデータ) (2023-07-24T08:58:25Z) - Tensor Decompositions for Hyperspectral Data Processing in Remote
Sensing: A Comprehensive Review [85.36368666877412]
ハイパースペクトル(HS)リモートセンシング(RS)イメージングは、地球表面の観測と分析のためにかなりの量の空間的およびスペクトル的情報を提供している。
近年のHS RS技術の進歩と革命は、様々な応用の可能性を実現する機会を与えている。
3次元HS固有の構造が維持されているため、テンソル分解はHSデータ処理タスクにおける幅広い関心や研究を引き起こしている。
論文 参考訳(メタデータ) (2022-05-13T00:39:23Z) - A systematic review and meta-analysis of Digital Elevation Model (DEM)
fusion: pre-processing, methods and applications [0.0]
2.5D/3Dデジタル標高モデル(DEM)融合はリモートセンシングにおけるデータ融合の鍵となる応用である。
DEM融合は、より完全で正確で信頼性の高いデータセットを提供するために、マルチソースDEMの相補的な特性を利用する。
本稿では,DEM融合の体系的レビューとして,メタ分析により拡張された事前処理ワークフロー,メソッド,アプリケーションについて述べる。
論文 参考訳(メタデータ) (2022-03-28T18:39:14Z) - Paradigm selection for Data Fusion of SAR and Multispectral Sentinel
data applied to Land-Cover Classification [63.072664304695465]
本稿では、畳み込みニューラルネットワーク(CNN)に基づく4つのデータ融合パラダイムを分析し、実装する。
目標は、最良のデータ融合フレームワークを選択するための体系的な手順を提供することであり、その結果、最高の分類結果が得られる。
この手順は、土地被覆分類のために検証されているが、他のケースに転送することができる。
論文 参考訳(メタデータ) (2021-06-18T11:36:54Z) - Survey on Deep Multi-modal Data Analytics: Collaboration, Rivalry and
Fusion [6.225190099424806]
マルチモーダルまたはマルチビューデータは、各モーダル/ビューがデータオブジェクトの個々のプロパティをエンコードする、ビッグデータの主要なストリームとして急増している。
既存の最先端技術のほとんどは、より優れたパフォーマンスを実現するために、マルチモーダル空間からのエネルギーや情報を融合する方法に重点を置いている。
ディープニューラルネットワークは、高次元マルチメディアデータの非線形分布をうまく捉えるための強力なアーキテクチャとして現れてきた。
論文 参考訳(メタデータ) (2020-06-15T06:42:04Z) - Deep Learning in Mining Biological Data [7.834172629639729]
ディープラーニング(DL)は多くの複雑なパターン認識問題の解決に成功している。
本稿では,生物配列,画像,信号データへのDLの適用について述べる。
また、生物データのマイニングにおけるいくつかのオープンな研究課題についても概説している。
論文 参考訳(メタデータ) (2020-02-28T23:14:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。