論文の概要: Pansharpening by convolutional neural networks in the full resolution
framework
- arxiv url: http://arxiv.org/abs/2111.08334v1
- Date: Tue, 16 Nov 2021 10:03:11 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-17 15:22:51.293523
- Title: Pansharpening by convolutional neural networks in the full resolution
framework
- Title(参考訳): 畳み込みニューラルネットワークによるフルレゾリューションフレームワークのパンシャープ化
- Authors: Matteo Ciotola, Sergio Vitale, Antonio Mazza, Giovanni Poggi, Giuseppe
Scarpa
- Abstract要約: 提案フレームワークでトレーニングした手法は,完全解像度の数値指標と視覚的品質の両方において優れた性能を保証している。
フレームワークは完全に汎用的であり、ディープラーニングベースのパンシャーピングネットワークのトレーニングと微調整に使用することができる。
- 参考スコア(独自算出の注目度): 3.8323580808203785
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: In recent years, there has been a growing interest on deep learning-based
pansharpening. Research has mainly focused on architectures. However, lacking a
ground truth, model training is also a major issue. A popular approach is to
train networks in a reduced resolution domain, using the original data as
ground truths. The trained networks are then used on full resolution data,
relying on an implicit scale invariance hypothesis. Results are generally good
at reduced resolution, but more questionable at full resolution. Here, we
propose a full-resolution training framework for deep learning-based
pansharpening. Training takes place in the high resolution domain, relying only
on the original data, with no loss of information. To ensure spectral and
spatial fidelity, suitable losses are defined, which force the pansharpened
output to be consistent with the available panchromatic and multispectral
input. Experiments carried out on WorldView-3, WorldView-2, and GeoEye-1 images
show that methods trained with the proposed framework guarantee an excellent
performance in terms of both full-resolution numerical indexes and visual
quality. The framework is fully general, and can be used to train and fine-tune
any deep learning-based pansharpening network.
- Abstract(参考訳): 近年、深層学習に基づくパンシャーピングへの関心が高まっている。
研究は主に建築に焦点を当てている。
しかし、基礎的な真実を欠くモデルトレーニングも大きな問題である。
一般的なアプローチは、元のデータを根拠として、解像度の低いドメインでネットワークをトレーニングすることだ。
トレーニングされたネットワークは、暗黙のスケール不変性仮説に依存するフル解像度データに使用される。
結果は一般的に解像度が低下するが、完全な解像度ではより疑わしい。
本稿では,深層学習に基づくパンシャーピングのためのフルレゾリューショントレーニングフレームワークを提案する。
トレーニングは、元のデータのみに依存する高解像度ドメインで行われ、情報の損失は発生しない。
スペクトルと空間の忠実性を確保するために、パンシャープ出力を利用可能なパンクロマティックおよびマルチスペクトル入力と一致させる適切な損失を定義する。
WorldView-3、WorldView-2、GeoEye-1で行った実験では、提案フレームワークでトレーニングした手法は、完全な数値インデックスと視覚的品質の両方において優れた性能を保証している。
フレームワークは完全に汎用的であり、ディープラーニングベースのパンシャーピングネットワークのトレーニングと微調整に使用することができる。
関連論文リスト
- Band-wise Hyperspectral Image Pansharpening using CNN Model Propagation [4.246657212475299]
ハイパースペクトルパンシャーピングのための新しい深層学習法を提案する。
バンドワイド適応方式でネストされた単純な単一バンドアン教師付きパンシャーペニングモデルを継承する。
提案手法は,従来の学習基準法と深層学習基準法の両方より優れた結果が得られる。
論文 参考訳(メタデータ) (2023-11-11T08:53:54Z) - Unsupervised Deep Learning-based Pansharpening with Jointly-Enhanced
Spectral and Spatial Fidelity [4.425982186154401]
本稿では,この手法の可能性をフル活用した,ディープラーニングに基づくパンシャーピングモデルを提案する。
提案モデルでは,パンシャーペンデータのスペクトルと空間的品質を協調的に向上する新たな損失関数を特徴とする。
挑戦的なシナリオで実施された多種多様なテスト画像の実験により,提案手法が技術状況と良好に比較できることが実証された。
論文 参考訳(メタデータ) (2023-07-26T17:25:28Z) - Any-resolution Training for High-resolution Image Synthesis [55.19874755679901]
生成モデルは、様々な大きさの自然画像であっても、一定の解像度で動作します。
すべてのピクセルが重要であり、そのネイティブ解像度で収集された可変サイズのイメージを持つデータセットを作成する、と我々は主張する。
ランダムなスケールでパッチをサンプリングし、可変出力解像度で新しいジェネレータを訓練するプロセスである。
論文 参考訳(メタデータ) (2022-04-14T17:59:31Z) - Proximal PanNet: A Model-Based Deep Network for Pansharpening [11.695233311615498]
本稿では,モデルに基づく手法と深層学習手法を組み合わせることで,パンシャーピングのための新しいディープネットワークを提案する。
畳み込みニューラルネットワークを用いて近位演算子を学習することにより、反復アルゴリズムをPanNetと呼ばれるディープネットワークに展開する。
いくつかのベンチマークデータセットの実験結果から、我々のネットワークは定量的にも定性的にも他の先進的な手法よりも優れた性能を示している。
論文 参考訳(メタデータ) (2022-02-12T15:49:13Z) - Low-light Image Enhancement by Retinex Based Algorithm Unrolling and
Adjustment [50.13230641857892]
本稿では,低照度画像強調(LIE)問題に対する新たなディープラーニングフレームワークを提案する。
提案フレームワークは,大域的明るさと局所的明るさ感度の両方を考慮したアルゴリズムアンロールと調整ネットワークに着想を得た分解ネットワークを含む。
一連の典型的なLIEデータセットの実験では,既存の手法と比較して,定量的かつ視覚的に,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2022-02-12T03:59:38Z) - Enhanced Performance of Pre-Trained Networks by Matched Augmentation
Distributions [10.74023489125222]
列車-テストの分散シフトに対処するための簡単な解を提案する。
テスト画像に対して、複数のランダムな作物に対して結果を合成する。
これは列車の時間拡張と一致するだけでなく、入力画像の完全なカバレッジも提供する。
論文 参考訳(メタデータ) (2022-01-19T22:33:00Z) - Stereo Matching by Self-supervision of Multiscopic Vision [65.38359887232025]
カメラ位置の整列で撮影した複数の画像を利用したステレオマッチングのための新しい自己監視フレームワークを提案する。
ネットワークを最適化するために、クロスフォトメトリックロス、不確実性を認識した相互監督損失、および新しい平滑性損失が導入されます。
我々のモデルは、KITTIデータセット上の以前の教師なし手法よりも、より良い不均一性マップを得る。
論文 参考訳(メタデータ) (2021-04-09T02:58:59Z) - Deep Gradient Projection Networks for Pan-sharpening [20.929492740317915]
本稿では,モデルに基づくディープパンシャーピング手法を提案する。
2つのブロックを積み重ねることで、グラデーションプロジェクションベースのパンスハーピングニューラルネットワークと呼ばれる新しいネットワークが構築される。
さまざまな種類の衛星データセットの実験結果は、新しいネットワークが視覚的および定量的に最先端の方法よりも優れていることを示しています。
論文 参考訳(メタデータ) (2021-03-08T07:51:58Z) - Image Restoration by Deep Projected GSURE [115.57142046076164]
Ill-posed inverse problem は、デブロアリングや超解像など、多くの画像処理アプリケーションに現れる。
本稿では,一般化されたSteinUnbiased Risk Estimator(GSURE)の「投影変換」とCNNによる潜在画像のパラメータ化を含む損失関数の最小化に基づく,新たな画像復元フレームワークを提案する。
論文 参考訳(メタデータ) (2021-02-04T08:52:46Z) - Recurrent Multi-view Alignment Network for Unsupervised Surface
Registration [79.72086524370819]
非厳格な登録をエンドツーエンドで学習することは、本質的に高い自由度とラベル付きトレーニングデータの欠如により困難である。
我々は、いくつかの剛性変換のポイントワイドな組み合わせで、非剛性変換を表現することを提案する。
また,投影された多視点2次元深度画像上での3次元形状の類似度を計測する可微分損失関数も導入する。
論文 参考訳(メタデータ) (2020-11-24T14:22:42Z) - Improving Deep Stereo Network Generalization with Geometric Priors [93.09496073476275]
地上の真実が密集した多様な現実世界のシーンの大規模なデータセットを得ることは困難である。
多くのアルゴリズムは、似たようなシーンや合成データセットの小さな実世界のデータセットに依存している。
本稿では,シーン幾何学の事前知識をエンド・ツー・エンドのステレオネットワークに統合し,ネットワークの一般化を支援することを提案する。
論文 参考訳(メタデータ) (2020-08-25T15:24:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。