論文の概要: Semantic-aware Network for Aerial-to-Ground Image Synthesis
- arxiv url: http://arxiv.org/abs/2308.06945v1
- Date: Mon, 14 Aug 2023 05:37:07 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-15 14:26:44.484292
- Title: Semantic-aware Network for Aerial-to-Ground Image Synthesis
- Title(参考訳): 航空画像合成のための意味認識ネットワーク
- Authors: Jinhyun Jang, Taeyong Song, Kwanghoon Sohn
- Abstract要約: 構造的アライメントとセマンティックアライメントの強化によって課題を探求する新しい枠組みを提案する。
本稿では,複雑な地理的構造を再構築可能な,セマンティック・アテンテーティブな特徴変換モジュールを提案する。
また,事前学習したセグメンテーションネットワークを利用した意味認識損失関数を提案する。
- 参考スコア(独自算出の注目度): 42.360670351361584
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Aerial-to-ground image synthesis is an emerging and challenging problem that
aims to synthesize a ground image from an aerial image. Due to the highly
different layout and object representation between the aerial and ground
images, existing approaches usually fail to transfer the components of the
aerial scene into the ground scene. In this paper, we propose a novel framework
to explore the challenges by imposing enhanced structural alignment and
semantic awareness. We introduce a novel semantic-attentive feature
transformation module that allows to reconstruct the complex geographic
structures by aligning the aerial feature to the ground layout. Furthermore, we
propose semantic-aware loss functions by leveraging a pre-trained segmentation
network. The network is enforced to synthesize realistic objects across various
classes by separately calculating losses for different classes and balancing
them. Extensive experiments including comparisons with previous methods and
ablation studies show the effectiveness of the proposed framework both
qualitatively and quantitatively.
- Abstract(参考訳): 航空画像合成は,地上画像から地上画像を合成することを目的とした,新たな課題である。
空中画像と地上画像の間に非常に異なるレイアウトとオブジェクト表現のため、既存のアプローチは通常、空中シーンの構成要素を地上シーンに転送するのに失敗する。
本稿では,構造的アライメントと意味的意識の強化によって課題を探究する新しい枠組みを提案する。
そこで本稿では,空中特徴を地盤配置に合わせることにより,複雑な地形構造を再構築できる新しい意味的特徴変換モジュールを提案する。
さらに,事前学習したセグメンテーションネットワークを利用した意味認識損失関数を提案する。
ネットワークは、異なるクラスに対する損失を別々に計算し、それらのバランスをとることによって、様々なクラスにわたる現実的なオブジェクトを合成する。
従来の方法との比較やアブレーション実験を含む広範な実験により,提案手法の有効性が定性的および定量的に示された。
関連論文リスト
- Aerial Lifting: Neural Urban Semantic and Building Instance Lifting from Aerial Imagery [51.73680703579997]
航空画像から都市規模のセマンティックスとビルレベルのインスタンスセグメンテーションのためのニューラルラジアンスフィールド法を提案する。
都市空撮画像の物体は、建物、車、道路など、相当な大きさのバリエーションを示している。
我々は,様々な大きさのオブジェクトのセグメンテーションを強化する,スケール適応型セマンティックラベル融合戦略を導入する。
次に、2次元のインスタンスラベルにおける多視点不整合問題を緩和するために、新しいクロスビューインスタンスラベルグループ化戦略を導入する。
論文 参考訳(メタデータ) (2024-03-18T14:15:39Z) - Layered Rendering Diffusion Model for Zero-Shot Guided Image Synthesis [60.260724486834164]
本稿では,テキストクエリに依存する拡散モデルにおける空間制御性向上のための革新的な手法を提案する。
視覚誘導(Vision Guidance)とレイヤーレンダリング拡散(Layered Rendering Diffusion)フレームワーク(Layered Diffusion)という2つの重要なイノベーションを提示します。
本稿では,ボックス・ツー・イメージ,セマンティック・マスク・ツー・イメージ,画像編集の3つの実践的応用に適用する。
論文 参考訳(メタデータ) (2023-11-30T10:36:19Z) - Edge Guided GANs with Multi-Scale Contrastive Learning for Semantic
Image Synthesis [139.2216271759332]
本稿では,難解なセマンティック画像合成タスクのための新しいECGANを提案する。
セマンティックラベルは詳細な構造情報を提供しておらず、局所的な詳細や構造を合成することは困難である。
畳み込み、ダウンサンプリング、正規化といった広く採用されているCNN操作は、通常、空間分解能の損失を引き起こす。
本稿では,同じセマンティッククラスに属する画素埋め込みを強制して,より類似した画像コンテンツを生成することを目的とした,新しいコントラスト学習手法を提案する。
論文 参考訳(メタデータ) (2023-07-22T14:17:19Z) - Uni-Removal: A Semi-Supervised Framework for Simultaneously Addressing
Multiple Degradations in Real-World Images [6.3351090376024155]
Uni-Removalは、現実世界の画像における複数の劣化を取り除くための2段階の半教師付きフレームワークである。
知識伝達の段階では、Uni-Removalは教師付きマルチ教師と学生アーキテクチャを利用する。
ドメイン適応段階では、現実世界の画像に敵判別器を組み込むことにより、教師なしの微調整を行う。
論文 参考訳(メタデータ) (2023-07-11T07:18:15Z) - Enhancing Photorealism Enhancement [83.88433283714461]
本稿では,畳み込みネットワークを用いた合成画像のリアリズム向上手法を提案する。
一般的に使用されるデータセットのシーンレイアウトの分布を分析し、重要な方法で異なることを見つけます。
近年のイメージ・ツー・イメージ翻訳法と比較して,安定性とリアリズムの大幅な向上が報告されている。
論文 参考訳(メタデータ) (2021-05-10T19:00:49Z) - Adversarial Image Composition with Auxiliary Illumination [53.89445873577062]
本稿では,現実的な画像合成を実現するためのAIC-Netを提案する。
影の発生と前景の移動を両立させる新しい分岐生成機構を提案する。
歩行者と自動車のコンポジションタスクに関する実験により,提案したAIC-Netが優れたコンポジション性能を実現することを示す。
論文 参考訳(メタデータ) (2020-09-17T12:58:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。