論文の概要: A Strategy Optimized Pix2pix Approach for SAR-to-Optical Image
Translation Task
- arxiv url: http://arxiv.org/abs/2206.13042v2
- Date: Tue, 28 Jun 2022 02:35:48 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-03 00:47:12.045711
- Title: A Strategy Optimized Pix2pix Approach for SAR-to-Optical Image
Translation Task
- Title(参考訳): SAR-to-Optical画像変換タスクにおけるPix2pix手法の最適化
- Authors: Fujian Cheng, Yashu Kang, Chunlei Chen, Kezhao Jiang
- Abstract要約: マルチモーダル・ラーニング・フォー・アース・アース・チャレンジ(MultiEarth 2022)における画像と画像の翻訳タスクの分析とアプローチについて要約する。
戦略最適化の観点では、クラウド分類は、教師あり学習のようなアプローチを支援するために、濃密なクラウドカバレッジを持つ光学画像のフィルタリングに利用される。
その結果,リモートセンシングタスクにおけるSAR-to-optical Translationへの大きな可能性,特に長期環境モニタリングと保護の支援が示唆された。
- 参考スコア(独自算出の注目度): 0.9176056742068814
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This technical report summarizes the analysis and approach on the
image-to-image translation task in the Multimodal Learning for Earth and
Environment Challenge (MultiEarth 2022). In terms of strategy optimization,
cloud classification is utilized to filter optical images with dense cloud
coverage to aid the supervised learning alike approach. The commonly used
pix2pix framework with a few optimizations is applied to build the model. A
weighted combination of mean squared error and mean absolute error is
incorporated in the loss function. As for evaluation, peak to signal ratio and
structural similarity were both considered in our preliminary analysis. Lastly,
our method achieved the second place with a final error score of 0.0412. The
results indicate great potential towards SAR-to-optical translation in remote
sensing tasks, specifically for the support of long-term environmental
monitoring and protection.
- Abstract(参考訳): 本報告は,地球環境問題のためのマルチモーダル学習(multiearth 2022)における画像から画像への翻訳タスクの分析とアプローチを要約する。
戦略最適化の観点では、クラウド分類は、教師あり学習のようなアプローチを支援するために、濃密なクラウドカバレッジを持つ光学画像のフィルタリングに利用される。
いくつかの最適化を備えたpix2pixフレームワークは、モデルの構築に適用される。
損失関数には平均二乗誤差と平均絶対誤差の重み付けの組み合わせが組み込まれている。
予備分析では,ピーク・ツー・シグナル比と構造的類似性について検討した。
最後に,最終誤差スコア0.0412で2位となった。
その結果,リモートセンシングタスクにおけるSAR-to-optical Translationへの大きな可能性,特に長期環境モニタリングと保護の支援が示唆された。
関連論文リスト
- Corner-to-Center Long-range Context Model for Efficient Learned Image
Compression [70.0411436929495]
学習された画像圧縮のフレームワークでは、コンテキストモデルは潜在表現間の依存関係をキャプチャする上で重要な役割を果たす。
本研究では,textbfCorner-to-Center 変換器を用いたコンテキストモデル (C$3$M) を提案する。
また,解析および合成変換における受容場を拡大するために,エンコーダ/デコーダのLong-range Crossing Attention Module (LCAM) を用いる。
論文 参考訳(メタデータ) (2023-11-29T21:40:28Z) - PAIF: Perception-Aware Infrared-Visible Image Fusion for Attack-Tolerant
Semantic Segmentation [50.556961575275345]
対向シーンにおけるセグメンテーションの堅牢性を促進するための認識認識型融合フレームワークを提案する。
我々は,先進の競争相手に比べて15.3% mIOUの利得で,ロバスト性を大幅に向上させることを示す。
論文 参考訳(メタデータ) (2023-08-08T01:55:44Z) - Unsupervised Light Field Depth Estimation via Multi-view Feature
Matching with Occlusion Prediction [15.421219881815956]
監督訓練に十分な深度ラベルを得ることは費用がかかる。
本稿では,LF画像から深度を推定するための教師なしフレームワークを提案する。
論文 参考訳(メタデータ) (2023-01-20T06:11:17Z) - Generative Adversarial Network (GAN) based Image-Deblurring [0.0]
スペクトル正則化手法の有効性を示し、スペクトルフィルタリング結果と正則化最適化の解とのリンクを指摘する。
画像の劣化のような不適切な問題に対して、最適化の目的は、我々の以前の知識をソリューションにエンコードする正規化項を含む。
ワッサーシュタイン生成逆数モデルの概念に基づき、正規化関数を学ぶためにCNNを訓練することができる。
論文 参考訳(メタデータ) (2022-08-24T15:46:09Z) - Hierarchical Similarity Learning for Aliasing Suppression Image
Super-Resolution [64.15915577164894]
エイリアスの影響を抑制するために階層画像超解像ネットワーク(HSRNet)を提案する。
HSRNetは、他の作品よりも定量的かつ視覚的なパフォーマンスを向上し、エイリアスをより効果的に再送信する。
論文 参考訳(メタデータ) (2022-06-07T14:55:32Z) - Provable Stochastic Optimization for Global Contrastive Learning: Small
Batch Does Not Harm Performance [53.49803579981569]
各正の対と全ての負の対をアンカーポイントで対比する、コントラスト学習のグローバルな目的を考える。
SimCLRのような既存のメソッドは、十分な結果を得るために大きなバッチサイズを必要とする。
本稿では,SogCLRという表現のグローバルコントラスト学習を解くためのメモリ効率の最適化アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-02-24T22:16:53Z) - Unpaired Image Super-Resolution with Optimal Transport Maps [128.1189695209663]
実世界の画像超解像(SR)タスクは、しばしば、教師付き技術の適用を制限するペアデータセットを持っていない。
本稿では,非バイアスのOTマップを知覚輸送コストで学習する未ペアSRのアルゴリズムを提案する。
我々のアルゴリズムは、大規模無人AIM-19データセット上で、最先端のパフォーマンスをほぼ提供する。
論文 参考訳(メタデータ) (2022-02-02T16:21:20Z) - Perceptual Loss for Robust Unsupervised Homography Estimation [1.2891210250935146]
BiHomEは、ソース視点からの歪んだ画像とターゲット視点からの対応する画像との間の特徴空間における距離を最小化する。
我々は、biHomEが合成COCOデータセットの最先端のパフォーマンスを達成することを示しています。
論文 参考訳(メタデータ) (2021-04-20T14:41:54Z) - Greenhouse Segmentation on High-Resolution Optical Satellite Imagery
using Deep Learning Techniques [0.0]
本稿では,光衛星アゼルスキー (SPOT-7) が取得した画像の画素ワイズ分類のための音響手法を提案する。
U-Netのようなアーキテクチャのカスタマイズされたバリエーションは、温室を特定するために使用される。
拡張畳み込みとスキップ接続を独自に組み込んだ2つのモデルが提案されている。
論文 参考訳(メタデータ) (2020-07-22T06:12:57Z) - Image Fine-grained Inpainting [89.17316318927621]
拡張畳み込みの密結合を利用してより大きく効果的な受容場を得る一段階モデルを提案する。
この効率的なジェネレータをよく訓練するために、頻繁に使用されるVGG特徴整合損失を除いて、新しい自己誘導回帰損失を設計する。
また、局所的・グローバルな分枝を持つ識別器を用いて、局所的・グローバルな内容の整合性を確保する。
論文 参考訳(メタデータ) (2020-02-07T03:45:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。