Fugu-MT 論文翻訳(概要): SAR-to-EO Image Translation with Multi-Conditional Adversarial Networks

論文の概要: SAR-to-EO Image Translation with Multi-Conditional Adversarial Networks

arxiv url: http://arxiv.org/abs/2207.13184v1
Date: Tue, 26 Jul 2022 21:19:34 GMT
ステータス: 翻訳完了
システム内更新日: 2022-07-28 13:53:13.194712
Title: SAR-to-EO Image Translation with Multi-Conditional Adversarial Networks
Title（参考訳）: 多条件逆ネットワークを用いたsar-to-eo画像翻訳
Authors: Armando Cabrera, Miriam Cha, Prafull Sharma, Michael Newey
Abstract要約: GoogleマップやIRのような複数の補完的なモダリティを組み込むことで、SAR-to-EO画像の変換をさらに改善できることを示す。提案手法は,SAR-to-EO画像変換性能向上のために,複数のモダリティを利用する最初の手法である。
参考スコア（独自算出の注目度）: 4.576080539427072
License: http://creativecommons.org/licenses/by/4.0/
Abstract: This paper explores the use of multi-conditional adversarial networks for SAR-to-EO image translation. Previous methods condition adversarial networks only on the input SAR. We show that incorporating multiple complementary modalities such as Google maps and IR can further improve SAR-to-EO image translation especially on preserving sharp edges of manmade objects. We demonstrate effectiveness of our approach on a diverse set of datasets including SEN12MS, DFC2020, and SpaceNet6. Our experimental results suggest that additional information provided by complementary modalities improves the performance of SAR-to-EO image translation compared to the models trained on paired SAR and EO data only. To best of our knowledge, our approach is the first to leverage multiple modalities for improving SAR-to-EO image translation performance.
Abstract（参考訳）: 本稿では,SAR-to-EO画像翻訳におけるマルチ条件対応ネットワークの利用について検討する。従来は入力SARのみに条件付き敵ネットワークが存在した。本稿では,GoogleマップやIRなどの複数の相補的なモダリティを組み込むことにより,SAR-to-EO画像の変換をさらに向上させることができることを示す。我々は,SEN12MS,DFC2020,SpaceNet6などの多様なデータセットに対して,アプローチの有効性を示す。実験結果から,相補的なモダリティによって提供される付加情報により,SAR-EO画像変換の性能が向上することが示唆された。我々の知る限り、SAR-to-EO画像翻訳性能を改善するために、まず複数のモダリティを活用する。

関連論文リスト

SAR-TEXT: A Large-Scale SAR Image-Text Dataset Built with SAR-Narrator and Progressive Transfer Learning [15.611051083630862]
我々は130,000以上のSAR画像テキストペアからなる大規模で高品質なSAR画像テキストデータセットを構築した。 SAR-Textデータセットの有効性を検証するために,3つの典型的な視覚言語タスクについて実験を行った。 SAR-RS-CLIPは検索性能を大幅に改善し、平均リコール率は16.43%向上した。キャプションタスクにおいて、SAR-RS-CoCaは、元のCoCaモデルよりもそれぞれ8倍、4倍、10倍のBLEU-4、SPICE、CIDErスコアを達成する。
論文参考訳（メタデータ） (2025-07-24T18:45:30Z)
Data-Efficient Generalization for Zero-shot Composed Image Retrieval [67.46975191141928]
ZS-CIRは、トレーニングのために配布する三つ子を必要とせず、参照画像とテキスト記述に基づいて対象画像を検索することを目的としている。 1つの一般的なアプローチは、マッピングネットワークを用いてテキスト埋め込み空間内の擬似ワードトークンに画像埋め込みを転送するビジョン言語事前学習パラダイムである。テキスト・サプリメント(TS)モジュールとセマンティック・セット(S-Set)という2つの新しい設計を含む,データ効率の一般化(DeG)フレームワークを提案する。
論文参考訳（メタデータ） (2025-03-07T07:49:31Z)
C-DiffSET: Leveraging Latent Diffusion for SAR-to-EO Image Translation with Confidence-Guided Reliable Object Generation [23.63992950769041]
C-DiffSETは、訓練済みの遅延拡散モデル(LDM)を自然画像で広く訓練したフレームワークである。顕著なことに、事前訓練されたVAEエンコーダは、SAR入力のノイズレベルが異なる場合でも、同じ潜時空間でSARとEOの画像を整列する。
論文参考訳（メタデータ） (2024-11-16T12:28:40Z)
Electrooptical Image Synthesis from SAR Imagery Using Generative Adversarial Networks [0.0]
本研究は,SAR画像とEO画像のギャップを埋めることでリモートセンシングの分野に寄与する。その結果,解釈可能性が大きく向上し,EO画像に精通したアナリストがSARデータにアクセスしやすくなった。本研究は,SAR画像とEO画像のギャップを埋めることでリモートセンシングの分野に寄与し,データ解釈を向上するための新しいツールを提供する。
論文参考訳（メタデータ） (2024-09-07T14:31:46Z)
Trustworthy Image Semantic Communication with GenAI: Explainablity, Controllability, and Efficiency [59.15544887307901]
画像意味コミュニケーション(ISC)は,高効率な映像コンテンツ伝送を実現する可能性に注目されている。既存のISCシステムは、解釈可能性、操作性、互換性の課題に直面している。我々は、複数の下流推論タスクにGenerative Artificial Intelligence(GenAI)を利用する新しい信頼できるISCフレームワークを提案する。
論文参考訳（メタデータ） (2024-08-07T14:32:36Z)
Multi-task SAR Image Processing via GAN-based Unsupervised Manipulation [6.154796320245652]
GAN(Generative Adversarial Networks)は、多数の現実的なSAR画像の合成において、大きな可能性を秘めている。本稿では、GANベースのUnsupervised Editing (GUE)と呼ばれる新しいSAR画像処理フレームワークを提案する。
論文参考訳（メタデータ） (2024-08-02T19:49:30Z)
Rotated Multi-Scale Interaction Network for Referring Remote Sensing Image Segmentation [63.15257949821558]
Referring Remote Sensing Image (RRSIS)は、コンピュータビジョンと自然言語処理を組み合わせた新しい課題である。従来の参照画像(RIS)アプローチは、空中画像に見られる複雑な空間スケールと向きによって妨げられている。本稿ではRMSIN(Rotated Multi-Scale Interaction Network)を紹介する。
論文参考訳（メタデータ） (2023-12-19T08:14:14Z)
OT-Attack: Enhancing Adversarial Transferability of Vision-Language Models via Optimal Transport Optimization [65.57380193070574]
視覚言語事前学習モデルは、マルチモーダル対逆例に対して脆弱である。近年の研究では、データ拡張と画像-テキストのモーダル相互作用を活用することで、対向的な例の転送可能性を高めることが示されている。本稿では,OT-Attack と呼ばれる最適輸送方式の敵攻撃を提案する。
論文参考訳（メタデータ） (2023-12-07T16:16:50Z)
A Dual-fusion Semantic Segmentation Framework With GAN For SAR Images [10.147351262526282]
合成開口レーダ(SAR)画像セグメンテーションを実現するために,広く使用されているエンコーダデコーダアーキテクチャに基づくネットワークを提案する。光画像のより優れた表現能力により、多数のSARおよび光画像によって訓練された生成反転ネットワーク(GAN)を介して生成された光画像とSAR画像を統合することを提案する。
論文参考訳（メタデータ） (2022-06-02T15:22:29Z)
Transformer-based SAR Image Despeckling [53.99620005035804]
本稿では,SAR画像復号化のためのトランスフォーマーネットワークを提案する。提案する非特定ネットワークは、トランスフォーマーベースのエンコーダにより、異なる画像領域間のグローバルな依存関係を学習することができる。実験により,提案手法は従来型および畳み込み型ニューラルネットワークに基づく解法よりも大幅に改善されていることが示された。
論文参考訳（メタデータ） (2022-01-23T20:09:01Z)
Enhancing Photorealism Enhancement [83.88433283714461]
本稿では,畳み込みネットワークを用いた合成画像のリアリズム向上手法を提案する。一般的に使用されるデータセットのシーンレイアウトの分布を分析し、重要な方法で異なることを見つけます。近年のイメージ・ツー・イメージ翻訳法と比較して,安定性とリアリズムの大幅な向上が報告されている。
論文参考訳（メタデータ） (2021-05-10T19:00:49Z)
Visualization of Deep Transfer Learning In SAR Imagery [0.0]
eo shipデータセットでトレーニングされたネットワークの深い機能を活用するために、転送学習を検討する。クラスアクティベーションマップの形でネットワークアクティベーションを調べることで、ディープネットワークが新しいモダリティをどのように解釈するかを知ることができます。
論文参考訳（メタデータ） (2021-03-20T00:16:15Z)
MAF: Multimodal Alignment Framework for Weakly-Supervised Phrase Grounding [74.33171794972688]
本稿では,詳細な視覚表現と視覚認識言語表現を活用することで,句オブジェクトの関連性をモデル化するアルゴリズムを提案する。広く採用されているFlickr30kデータセットで実施された実験は、既存の弱教師付き手法よりも大幅に改善されている。
論文参考訳（メタデータ） (2020-10-12T00:43:52Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。