論文の概要: Common Practices and Taxonomy in Deep Multi-view Fusion for Remote
Sensing Applications
- arxiv url: http://arxiv.org/abs/2301.01200v1
- Date: Tue, 20 Dec 2022 15:12:27 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-09 07:15:03.039306
- Title: Common Practices and Taxonomy in Deep Multi-view Fusion for Remote
Sensing Applications
- Title(参考訳): リモートセンシングのための深層マルチビュー融合における共通プラクティスと分類法
- Authors: Francisco Mena and Diego Arenas and Marlon Nuske and Andreas Dengel
- Abstract要約: リモートセンシング技術の進歩は、地球観測への応用を後押ししている。
深層学習モデルは複数の視点から情報を融合するために応用されている。
本稿は,地球観測のための多視点融合について,文献における共通プラクティスとアプローチに着目した研究をまとめたものである。
- 参考スコア(独自算出の注目度): 3.883984493622102
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The advances in remote sensing technologies have boosted applications for
Earth observation. These technologies provide multiple observations or views
with different levels of information. They might contain static or temporary
views with different levels of resolution, in addition to having different
types and amounts of noise due to sensor calibration or deterioration. A great
variety of deep learning models have been applied to fuse the information from
these multiple views, known as deep multi-view or multi-modal fusion learning.
However, the approaches in the literature vary greatly since different
terminology is used to refer to similar concepts or different illustrations are
given to similar techniques. This article gathers works on multi-view fusion
for Earth observation by focusing on the common practices and approaches used
in the literature. We summarize and structure insights from several different
publications concentrating on unifying points and ideas. In this manuscript, we
provide a harmonized terminology while at the same time mentioning the various
alternative terms that are used in literature. The topics covered by the works
reviewed focus on supervised learning with the use of neural network models. We
hope this review, with a long list of recent references, can support future
research and lead to a unified advance in the area.
- Abstract(参考訳): リモートセンシング技術の進歩により、地球観測への応用が促進された。
これらの技術は、異なるレベルの情報を持つ複数の観察やビューを提供する。
解像度の異なる静的ビューや一時的なビュー、センサーのキャリブレーションや劣化によるさまざまなタイプやノイズの量が含まれる可能性がある。
深層マルチビュー(deep multi-view)やマルチモーダル融合(multi-modal fusion)学習(multi-modal fusion learning)と呼ばれる複数のビューから情報を融合するために、さまざまなディープラーニングモデルが適用されています。
しかし、異なる用語を類似した概念、または類似した技法に異なる図形を与えるため、文献のアプローチは様々である。
本稿では,地球観測のための多視点融合について,文献に共通する慣習とアプローチに注目して研究を行う。
我々は、いくつかの異なる出版物からの洞察を要約し、構造化し、ポイントとアイデアの統一に集中する。
本写本では、文献で用いられる様々な代替用語について言及しながら、調和した用語を提供する。
本研究で取り上げたトピックは,ニューラルネットワークモデルを用いた教師あり学習に焦点をあてたものだ。
このレビューは、多くの最近の参考文献とともに、将来の研究を支援し、この地域の統一的な進歩につながることを願っている。
関連論文リスト
- Understanding Cross-Lingual Alignment -- A Survey [52.572071017877704]
言語間アライメントは多言語言語モデルにおける言語間の表現の有意義な類似性である。
本研究は,言語間アライメントの向上,手法の分類,分野全体からの洞察の要約といった手法の文献を調査する。
論文 参考訳(メタデータ) (2024-04-09T11:39:53Z) - A Comprehensive Survey of 3D Dense Captioning: Localizing and Describing
Objects in 3D Scenes [80.20670062509723]
3Dシークエンスキャプションは、3Dシーンの詳細な説明を作成することを目的とした、視覚言語によるブリッジングタスクである。
2次元の視覚的キャプションと比較して、現実世界の表現が密接なため、大きな可能性と課題が提示される。
既存手法の人気と成功にもかかわらず、この分野の進歩を要約した総合的な調査は乏しい。
論文 参考訳(メタデータ) (2024-03-12T10:04:08Z) - Leveraging Open-Vocabulary Diffusion to Camouflaged Instance
Segmentation [59.78520153338878]
テキスト・ツー・イメージ拡散技術は、テキスト記述から高品質な画像を生成する素晴らしい能力を示している。
そこで本研究では,オープン語彙を応用した最先端拡散モデルを用いて,多スケールのテキスト・視覚的特徴を学習する手法を提案する。
論文 参考訳(メタデータ) (2023-12-29T07:59:07Z) - Towards Open Vocabulary Learning: A Survey [146.90188069113213]
ディープニューラルネットワークは,セグメンテーションやトラッキング,検出といった,さまざまなコアタスクにおいて,目覚ましい進歩を遂げている。
近年、視覚言語事前学習の急速な進歩により、オープンな語彙設定が提案されている。
本稿では,その分野における最近の発展を要約し分析し,オープンな語彙学習の徹底的なレビューを行う。
論文 参考訳(メタデータ) (2023-06-28T02:33:06Z) - Multispectral Contrastive Learning with Viewmaker Networks [8.635434871127512]
さまざまなリモートセンシングデータセットにコントラスト学習アプローチを適用することに注力する。
また,ビューメーカネットワークは,広範囲なドメイン知識や試行錯誤を必要とせずに,この設定でビューを作成することを約束していることを示す。
論文 参考訳(メタデータ) (2023-02-11T18:44:12Z) - Visual SLAM: What are the Current Trends and What to Expect? [0.0]
視力に基づくセンサは、SLAMシステムにおいて、大幅な性能、精度、効率の向上を示した。
VSLAMs領域で発行された45件のインパクトのある論文について,詳細な文献調査を行った。
論文 参考訳(メタデータ) (2022-10-19T11:56:32Z) - Vision+X: A Survey on Multimodal Learning in the Light of Data [64.03266872103835]
様々なソースからのデータを組み込んだマルチモーダル機械学習が,ますます普及している研究分野となっている。
我々は、視覚、音声、テキスト、動きなど、各データフォーマットの共通点と特異点を分析する。
本稿では,表現学習と下流アプリケーションレベルの両方から,マルチモーダル学習に関する既存の文献を考察する。
論文 参考訳(メタデータ) (2022-10-05T13:14:57Z) - Deflectometry for specular surfaces: an overview [0.0]
反射面を評価するための技術的アプローチとしてのデフレクトメトリーは、現在40年近く存在しています。
この手法の様々な側面とバリエーションが、複数の論文や研究論文で研究され、また特定のサブトピックにもレビューが利用できるようになった。
論文 参考訳(メタデータ) (2022-04-10T22:17:47Z) - Recent Advances and Trends in Multimodal Deep Learning: A Review [9.11022096530605]
マルチモーダルディープラーニングは、様々なモーダルを使って情報を処理およびリンクできるモデルを作成することを目的としている。
本稿では,画像,ビデオ,テキスト,音声,身体ジェスチャー,表情,生理的信号など,多種類のモダリティに焦点を当てる。
様々なマルチモーダル深層学習応用のきめ細かい分類法が提案され、様々な応用をより深く研究している。
論文 参考訳(メタデータ) (2021-05-24T04:20:45Z) - Stance Detection in Web and Social Media: A Comparative Study [3.937145867005019]
オンラインフォーラムやソーシャルメディアプラットフォームは、異なる人々が異なる姿勢をとるさまざまな極性に関するトピックを議論するために、ますます利用されています。
テキストからの自動姿勢検出のためのいくつかの手法が文献で提案されている。
我々の知る限りでは、それらとその比較パフォーマンスについて、体系的な調査は行われていない。
論文 参考訳(メタデータ) (2020-07-12T12:39:35Z) - Image Segmentation Using Deep Learning: A Survey [58.37211170954998]
イメージセグメンテーションは、画像処理とコンピュータビジョンにおいて重要なトピックである。
深層学習モデルを用いた画像セグメンテーション手法の開発を目的とした研究が,これまでに数多く行われている。
論文 参考訳(メタデータ) (2020-01-15T21:37:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。