Fugu-MT 論文翻訳(概要): Underwater Organism Color Enhancement via Color Code Decomposition, Adaptation and Interpolation

論文の概要: Underwater Organism Color Enhancement via Color Code Decomposition, Adaptation and Interpolation

arxiv url: http://arxiv.org/abs/2409.19685v1
Date: Sun, 29 Sep 2024 12:24:34 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-05 21:49:14.343651
Title: Underwater Organism Color Enhancement via Color Code Decomposition, Adaptation and Interpolation
Title（参考訳）: カラーコード分解・適応・補間による水中生物色強調
Authors: Xiaofeng Cong, Jing Zhang, Yeying Jin, Junming Hou, Yu Zhao, Jie Gui, James Tin-Yau Kwok, Yuan Yan Tang,
Abstract要約: そこで本稿では,範囲制御可能なカラー出力を提供しながら,水中画像を強化するTextitColorCodeという手法を提案する。我々のアプローチは、教師付きトレーニングを通じて水中画像を基準強調画像に復元し、色と内容コードに分解することである。カラーコードはガウス分布に従うように明示的に制約され、効率的なサンプリングと推論が可能である。
参考スコア（独自算出の注目度）: 24.96772289126242
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Underwater images often suffer from quality degradation due to absorption and scattering effects. Most existing underwater image enhancement algorithms produce a single, fixed-color image, limiting user flexibility and application. To address this limitation, we propose a method called \textit{ColorCode}, which enhances underwater images while offering a range of controllable color outputs. Our approach involves recovering an underwater image to a reference enhanced image through supervised training and decomposing it into color and content codes via self-reconstruction and cross-reconstruction. The color code is explicitly constrained to follow a Gaussian distribution, allowing for efficient sampling and interpolation during inference. ColorCode offers three key features: 1) color enhancement, producing an enhanced image with a fixed color; 2) color adaptation, enabling controllable adjustments of long-wavelength color components using guidance images; and 3) color interpolation, allowing for the smooth generation of multiple colors through continuous sampling of the color code. Quantitative and visual evaluations on popular and challenging benchmark datasets demonstrate the superiority of ColorCode over existing methods in providing diverse, controllable, and color-realistic enhancement results. The source code is available at https://github.com/Xiaofeng-life/ColorCode.
Abstract（参考訳）: 水中画像は、しばしば吸収と散乱効果による品質劣化に悩まされる。既存の水中画像強調アルゴリズムは、単一の固定色画像を生成し、ユーザの柔軟性と応用を制限している。この制限に対処するため,制御可能な色出力の範囲を提供しながら,水中画像の強調を行う「textit{ColorCode}」という手法を提案する。提案手法では、教師付きトレーニングにより水中画像を基準強調画像に復元し、自己再構成とクロスコンストラクションにより色と内容コードに分解する。カラーコードはガウス分布に従うように明示的に制約され、推論中に効率的なサンプリングと補間を可能にする。 ColorCodeには3つの重要な機能がある。 1) 色強調,固定色による強調画像の作成 2) 誘導画像を用いた長波長成分の制御可能な調整を可能にする色適応,及び 3)カラーコードの連続サンプリングにより複数色をスムーズに生成できるカラー補間。人気のある、挑戦的なベンチマークデータセットに対する定量的かつ視覚的な評価は、多様な、制御可能な、色現実的な拡張結果を提供することにおいて、既存のメソッドよりもColorCodeの方が優れていることを示している。ソースコードはhttps://github.com/Xiaofeng-life/ColorCodeで入手できる。

関連論文リスト

VanGogh: A Unified Multimodal Diffusion-based Framework for Video Colorization [53.35016574938809]
ビデオのカラー化は、時間的一貫性と構造的整合性を維持しながら、グレースケールのビデオを鮮やかな色表現に変換することを目的としている。既存のビデオカラー化法は、しばしば色出血に悩まされ、包括的な制御が欠如している。我々はVanGoghを紹介した。VanGoghはビデオカラー化のためのマルチモーダル拡散に基づく統合フレームワークである。
論文参考訳（メタデータ） (2025-01-16T12:20:40Z)
ColorFlow: Retrieval-Augmented Image Sequence Colorization [65.93834649502898]
産業用途における画像シーケンスのカラー化に適した3段階拡散に基づくフレームワークを提案する。 IDごとの微調整や明示的なID埋め込み抽出を必要とする既存の手法とは異なり、我々は新たにRetrieval Augmented Colorization Pipelineを提案する。パイプラインには、カラーアイデンティティ抽出のためのブランチと、カラー化のためのブランチという、デュアルブランチ設計も備えています。
論文参考訳（メタデータ） (2024-12-16T14:32:49Z)
FDCE-Net: Underwater Image Enhancement with Embedding Frequency and Dual Color Encoder [49.79611204954311]
水中画像は、低明度、色の変化、ぼやけた詳細、吸光光によるノイズ、水や懸濁粒子による散乱などの様々な問題に悩まされることが多い。従来の水中画像強調法(UIE)は主に空間領域の強調に焦点を当てており、画像固有の周波数領域情報を無視している。
論文参考訳（メタデータ） (2024-04-27T15:16:34Z)
Control Color: Multimodal Diffusion-based Interactive Image Colorization [81.68817300796644]
Control Color (Ctrl Color) は、事前訓練された安定拡散(SD)モデルを利用する多モードカラー化手法である。ユーザのストロークをエンコードして、局所的な色操作を正確に行うための効果的な方法を提案する。また、カラーオーバーフローと不正確な色付けの長年の問題に対処するために、自己注意に基づく新しいモジュールとコンテンツ誘導型変形可能なオートエンコーダを導入する。
論文参考訳（メタデータ） (2024-02-16T17:51:13Z)
DiffColor: Toward High Fidelity Text-Guided Image Colorization with Diffusion Models [12.897939032560537]
そこで我々はDiffColorと呼ばれる新しい手法を提案し、プロンプトテキストに条件付けされた鮮やかな色を復元する。私たちはまず、CLIPベースのコントラスト損失を用いて色付き画像を生成するために、事前訓練されたテキスト・ツー・イメージ・モデルを微調整する。次に、色付き画像とテキストプロンプトを整列した最適化されたテキスト埋め込みと、高品質な画像再構成を可能にする微調整拡散モデルを得る。提案手法は,複数回の反復で鮮やかな多彩な色を生成でき,その構造と背景をそのままに保ちつつ,対象言語指導に適合させる。
論文参考訳（メタデータ） (2023-08-03T09:38:35Z)
Improving Video Colorization by Test-Time Tuning [79.67548221384202]
テスト時間チューニングによる映像の着色性向上を目的とした,効果的な手法を提案する。提案手法は,テスト中に追加のトレーニングサンプルを構築するための基準を利用して,PSNRにおいて平均13dBの性能向上を実現している。
論文参考訳（メタデータ） (2023-06-25T05:36:40Z)
DDColor: Towards Photo-Realistic Image Colorization via Dual Decoders [19.560271615736212]
DDColorは画像カラー化のためのデュアルデコーダを備えたエンドツーエンドの手法である。我々のアプローチには、ピクセルデコーダとクエリベースのカラーデコーダが含まれる。我々の2つのデコーダは、色とマルチスケールの意味表現の相関を確立するために協力する。
論文参考訳（メタデータ） (2022-12-22T11:17:57Z)
Towards Vivid and Diverse Image Colorization with Generative Color Prior [17.087464490162073]
最近のディープラーニングベースの手法は、画像のカラー化を低コストで行うことができる。我々は,事前学習されたGAN(Generative Adversarial Networks)にカプセル化されている,豊かで多様な色を活かして鮮やかな色を復元することを目的としている。先進的なデザインと繊細なデザインの強力な生成色のおかげで、我々の手法は1つの前進パスで鮮やかな色を作り出すことができた。
論文参考訳（メタデータ） (2021-08-19T17:49:21Z)
Underwater Image Enhancement via Medium Transmission-Guided Multi-Color Space Embedding [88.46682991985907]
本稿では,Ucolor と呼ばれる媒体透過誘導多色空間埋め込みによる水中画像強調ネットワークを提案する。当社のネットワークは、複数の色空間を埋め込むことにより、水中画像の視覚的品質を効果的に改善できます。
論文参考訳（メタデータ） (2021-04-27T07:35:30Z)
In&Out : Diverse Image Outpainting via GAN Inversion [89.84841983778672]
image outpaintingは、利用可能なコンテンツを超えて、入力画像の意味的に一貫した拡張を求める。本研究では、生成的対向ネットワークの反転の観点から問題を定式化する。私達の発電機はイメージの彼らの共同潜入コードそして個々の位置で調節されるマイクロパッチをレンダリングします。
論文参考訳（メタデータ） (2021-04-01T17:59:10Z)
Learning to Structure an Image with Few Colors [59.34619548026885]
そこで,カラー量子化ネットワークであるColorCNNを提案する。 1ビットのカラースペース(すなわち2色)だけで、提案されたネットワークはCIFAR10データセット上で82.1%のトップ-1の精度を達成した。アプリケーションの場合、PNGでエンコードされた場合、提案したカラー量子化は、極低ビットレート方式の他の画像圧縮方法よりも優れていることを示す。
論文参考訳（メタデータ） (2020-03-17T17:56:15Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。