論文の概要: DISC-GAN: Disentangling Style and Content for Cluster-Specific Synthetic Underwater Image Generation
- arxiv url: http://arxiv.org/abs/2510.10782v1
- Date: Sun, 12 Oct 2025 19:56:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-14 18:06:30.10581
- Title: DISC-GAN: Disentangling Style and Content for Cluster-Specific Synthetic Underwater Image Generation
- Title(参考訳): DISC-GAN:クラスタ特化合成水中画像生成のためのディエンタングスタイルとコンテンツ
- Authors: Sneha Varur, Anirudh R Hanchinamani, Tarun S Bagewadi, Uma Mudenagudi, Chaitra D Desai, Sujata C, Padmashree Desai, Sumit Meharwade,
- Abstract要約: 本研究では, 水中画像合成のためのクラスタ固有のトレーニング戦略とスタイル・コンテント・アンタングルを統合した新しいフレームワーク, Disentangled Style-Content GAN (DISC-GAN) を提案する。
提案手法は,写真構造類似度指数(SSIM)0.9012,平均ピーク信号雑音比(PSNR)32.5118dB,Frechet Inception Distance(FID)13.3728である。
- 参考スコア(独自算出の注目度): 4.045232231131666
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we propose a novel framework, Disentangled Style-Content GAN (DISC-GAN), which integrates style-content disentanglement with a cluster-specific training strategy towards photorealistic underwater image synthesis. The quality of synthetic underwater images is challenged by optical due to phenomena such as color attenuation and turbidity. These phenomena are represented by distinct stylistic variations across different waterbodies, such as changes in tint and haze. While generative models are well-suited to capture complex patterns, they often lack the ability to model the non-uniform conditions of diverse underwater environments. To address these challenges, we employ K-means clustering to partition a dataset into style-specific domains. We use separate encoders to get latent spaces for style and content; we further integrate these latent representations via Adaptive Instance Normalization (AdaIN) and decode the result to produce the final synthetic image. The model is trained independently on each style cluster to preserve domain-specific characteristics. Our framework demonstrates state-of-the-art performance, obtaining a Structural Similarity Index (SSIM) of 0.9012, an average Peak Signal-to-Noise Ratio (PSNR) of 32.5118 dB, and a Frechet Inception Distance (FID) of 13.3728.
- Abstract(参考訳): 本稿では,光リアルな水中画像合成に向けたクラスタ固有のトレーニング戦略とスタイル・コンテント・ディコンタングルを統合した新しいフレームワークDistangled Style-Content GAN(DISC-GAN)を提案する。
合成水中画像の品質は、色減衰や濁度などの現象により光学的に問題視されている。
これらの現象は、スズやヘイズの変化など、異なる水系の異なるスタイルのバリエーションによって表される。
生成モデルは複雑なパターンを捉えるのに適しているが、様々な水中環境の均一でない状態をモデル化する能力に欠けることが多い。
これらの課題に対処するために、データセットをスタイル固有のドメインに分割するために、K平均クラスタリングを使用します。
さらに、アダプティブインスタンス正規化(AdaIN)を介してこれらの潜在表現を統合し、結果をデコードして最終的な合成画像を生成する。
モデルは各スタイルクラスタ上で独立してトレーニングされ、ドメイン固有の特性を保持する。
提案手法では,SSIMが0.9012,PSNRが32.5118dB,Frechet Inception Distanceが13.3728であった。
関連論文リスト
- Neural Scene Designer: Self-Styled Semantic Image Manipulation [67.43125248646653]
我々は,ユーザが指定したシーン領域のリアルな写真操作を可能にする新しいフレームワークであるNeural Scene Designer (NSD)を紹介した。
NSDは、ユーザ意図とのセマンティックアライメントと、周辺環境とのスタイリスティックな整合性の両方を保証する。
細かなスタイル表現を捉えるために,プログレッシブ・セルフスタイル表現学習(PSRL)モジュールを提案する。
論文 参考訳(メタデータ) (2025-09-01T11:59:03Z) - ZePo: Zero-Shot Portrait Stylization with Faster Sampling [61.14140480095604]
本稿では,4つのサンプリングステップでコンテンツとスタイルの融合を実現する拡散モデルに基づく,インバージョンフリーなポートレートスタイリングフレームワークを提案する。
本稿では,一貫性機能における冗長な特徴をマージする機能統合戦略を提案し,注意制御の計算負荷を低減させる。
論文 参考訳(メタデータ) (2024-08-10T08:53:41Z) - DGNet: Dynamic Gradient-Guided Network for Water-Related Optics Image
Enhancement [77.0360085530701]
水中画像強調(UIE)は、水中環境によって引き起こされる複雑な劣化のために難しい課題である。
従来の手法では、劣化過程を理想化し、中音や物体の動きが画像の特徴の分布に与える影響を無視することが多い。
提案手法では,予測画像を用いて疑似ラベルを動的に更新し,動的勾配を加えてネットワークの勾配空間を最適化する。
論文 参考訳(メタデータ) (2023-12-12T06:07:21Z) - Improving Few-shot Image Generation by Structural Discrimination and
Textural Modulation [10.389698647141296]
画像生成の目的は、このカテゴリからいくつかの画像が与えられた場合、あるカテゴリに対して可塑性で多様な画像を生成することである。
既存のアプローチでは、異なる画像をグローバルに補間するか、事前に定義された係数で局所表現を融合する。
本稿では,内部局所表現に外部意味信号を注入する新しいメカニズムを提案する。
論文 参考訳(メタデータ) (2023-08-30T16:10:21Z) - A Generalized Physical-knowledge-guided Dynamic Model for Underwater
Image Enhancement [15.625794673532509]
我々は、物理知識誘導動的モデル(GUPDM用ショート)による一般化水中画像強調法を設計する。
本研究は, 大気光と透過率を変化させ, 様々な水中画像タイプをシミュレートする。
次に、動的畳み込みを用いて水中画像から事前情報を適応的に抽出し、PMSのパラメータを生成するADSとTDSを設計する。
論文 参考訳(メタデータ) (2023-08-10T09:09:15Z) - PUGAN: Physical Model-Guided Underwater Image Enhancement Using GAN with
Dual-Discriminators [120.06891448820447]
鮮明で視覚的に快適な画像を得る方法は、人々の共通の関心事となっている。
水中画像強調(UIE)の課題も、時間とともに現れた。
本稿では,UIE のための物理モデル誘導型 GAN モデルを提案する。
我々のPUGANは質的および定量的な測定値において最先端の手法より優れています。
論文 参考訳(メタデータ) (2023-06-15T07:41:12Z) - Underwater object classification combining SAS and transferred
optical-to-SAS Imagery [12.607649347048442]
本研究では,人工目標と岩やごみなどの対象物とを識別するマルチモーダルの組み合わせを提案する。
本稿では,2つのモード間の強度差と物体形成差を克服する新しい分類アルゴリズムを提案する。
海洋実験で収集した7,052対のSASと光学画像から,分類性能が向上した。
論文 参考訳(メタデータ) (2023-04-24T07:42:16Z) - SIAN: Style-Guided Instance-Adaptive Normalization for Multi-Organ
Histopathology Image Synthesis [63.845552349914186]
本研究では,異なる臓器に対して,現実的な色分布とテクスチャを合成するためのスタイル誘導型インスタンス適応正規化(SIAN)を提案する。
4つのフェーズは一緒に動作し、生成ネットワークに統合され、イメージセマンティクス、スタイル、インスタンスレベルのバウンダリを埋め込む。
論文 参考訳(メタデータ) (2022-09-02T16:45:46Z) - Semantic Image Synthesis via Diffusion Models [174.24523061460704]
Denoising Diffusion Probabilistic Models (DDPM) は様々な画像生成タスクにおいて顕著な成功を収めた。
セマンティック画像合成に関する最近の研究は、主に事実上のGANベースのアプローチに従っている。
意味画像合成のためのDDPMに基づく新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2022-06-30T18:31:51Z) - Domain Adaptation for Underwater Image Enhancement via Content and Style
Separation [7.077978580799124]
水中画像は、カラーキャスト、低コントラスト、光吸収、屈折、散乱によるハジー効果に悩まされている。
近年の学習に基づく手法は水中画像の強調に驚くべき性能を示した。
本稿では,コンテンツとスタイル分離による水中画像強調のためのドメイン適応フレームワークを提案する。
論文 参考訳(メタデータ) (2022-02-17T09:30:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。