Fugu-MT 論文翻訳(概要): Fine color guidance in diffusion models and its application to image compression at extremely low bitrates

論文の概要: Fine color guidance in diffusion models and its application to image compression at extremely low bitrates

arxiv url: http://arxiv.org/abs/2404.06865v1
Date: Wed, 10 Apr 2024 09:45:02 GMT
ステータス: 翻訳完了
システム内更新日: 2024-04-11 15:00:17.520405
Title: Fine color guidance in diffusion models and its application to image compression at extremely low bitrates
Title（参考訳）: 拡散モデルにおける微細色誘導と極低ビットレートにおける画像圧縮への応用
Authors: Tom Bordin, Thomas Maugey,
Abstract要約: 本研究では,拡散モデルを用いて生成した画像のグローバルな色相を,トレーニングや微調整なしで制御することの課題に対処する。出力が既知のカラーマップに近いことを保証するため、誘導方程式を書き換えるが、これは生成の質を損なうことはない。
参考スコア（独自算出の注目度）: 9.17424462858218
License: http://creativecommons.org/licenses/by/4.0/
Abstract: This study addresses the challenge of, without training or fine-tuning, controlling the global color aspect of images generated with a diffusion model. We rewrite the guidance equations to ensure that the outputs are closer to a known color map, and this without hindering the quality of the generation. Our method leads to new guidance equations. We show in the color guidance context that, the scaling of the guidance should not decrease but remains high throughout the diffusion process. In a second contribution, our guidance is applied in a compression framework, we combine both semantic and general color information on the image to decode the images at low cost. We show that our method is effective at improving fidelity and realism of compressed images at extremely low bit rates, when compared to other classical or more semantic oriented approaches.
Abstract（参考訳）: 本研究では,拡散モデルを用いて生成した画像のグローバルな色相を,トレーニングや微調整なしで制御することの課題に対処する。出力が既知のカラーマップに近いことを保証するため、誘導方程式を書き換えるが、これは生成の質を損なうことはない。我々の手法は新たなガイダンス方程式につながる。カラーガイダンスの文脈では、誘導のスケーリングは減少するべきではないが、拡散過程を通して高い値を維持することが示される。第2のコントリビューションでは、画像のセマンティックな色情報と一般的な色情報を組み合わせて、低コストでデコードする。提案手法は,他の古典的,より意味論的指向アプローチと比較して,圧縮画像の忠実度とリアリズムを極端に低ビットレートで向上させるのに有効であることを示す。

関連論文リスト

FreeInpaint: Tuning-free Prompt Alignment and Visual Rationality Enhancement in Image Inpainting [98.04041133839088]
ユーザからのテキストプロンプトを用いて,画像の特定領域内で新たなコンテンツを生成する。 FreeInpaintは,画像の忠実度を向上させるために,インジェクション中の拡散潜水剤を直接最適化する,プラグアンドプレイのチューニング不要な手法である。
論文参考訳（メタデータ） (2025-12-24T11:06:26Z)
Free-Lunch Color-Texture Disentanglement for Stylized Image Generation [58.406368812760256]
本稿では,タイマライズされたT2I生成において,フリーランチなカラーテクスチャ・ディコンタングルを実現するための,最初のチューニング自由アプローチを提案する。色とテクスチャの基準画像からCTE(Color-Texture Embeddings)を分離・抽出する技術を開発した。生成した画像の色パレットが色基準と密接に一致していることを確認するため、白と彩色変換を適用する。
論文参考訳（メタデータ） (2025-03-18T14:10:43Z)
PrefPaint: Aligning Image Inpainting Diffusion Model with Human Preference [62.72779589895124]
画像インペイントのための拡散モデルと人間の審美基準との整合性を、強化学習フレームワークを用いて初めて試みる。我々は、人間の好みを付加した約51,000枚の画像からなるデータセットで報酬モデルを訓練する。画像拡張や3次元再構成などの下流タスクの塗装比較実験により, 提案手法の有効性が示された。
論文参考訳（メタデータ） (2024-10-29T11:49:39Z)
Semi-LLIE: Semi-supervised Contrastive Learning with Mamba-based Low-light Image Enhancement [59.17372460692809]
本研究は、平均教師による半教師付き低照度強化(Semi-LLIE)フレームワークを提案する。照度分布を忠実に伝達するために、意味認識によるコントラスト損失を導入し、自然色による画像の強調に寄与する。また,大規模な視覚言語認識モデル(RAM)に基づく新たな知覚損失を提案し,よりリッチなテキストによる画像生成を支援する。
論文参考訳（メタデータ） (2024-09-25T04:05:32Z)
Multimodal Semantic-Aware Automatic Colorization with Diffusion Prior [15.188673173327658]
色を可塑性意味論で合成する前に拡散の異常な生成能力を利用する。モデルが画像の内容を理解し、飽和色を提供するのに役立つため、マルチモーダルなハイレベルセマンティクスを前もって採用する。輝度対応デコーダは細部を復元し、全体的な視覚的品質を向上させるように設計されている。
論文参考訳（メタデータ） (2024-04-25T15:28:22Z)
Diffusing Colors: Image Colorization with Text Guided Diffusion [11.727899027933466]
粒状テキストプロンプトを用いた画像拡散技術を利用した新しい画像カラー化フレームワークを提案する。本手法は,視覚的品質とセマンティック・コヒーレンスの観点から,既存の技術よりも優れた自動化と制御のバランスを与える。我々のアプローチは、特に色強調と歴史的イメージのカラー化の可能性を秘めている。
論文参考訳（メタデータ） (2023-12-07T08:59:20Z)
LLDiffusion: Learning Degradation Representations in Diffusion Models for Low-Light Image Enhancement [118.83316133601319]
現在の低照度画像強調(LLIE)の深層学習法は、通常、ペア化されたデータから学んだピクセルワイドマッピングに依存している。本稿では,拡散モデルを用いたLLIEの劣化認識学習手法を提案する。
論文参考訳（メタデータ） (2023-07-27T07:22:51Z)
Improving Diffusion-based Image Translation using Asymmetric Gradient Guidance [51.188396199083336]
非対称勾配法の適用により拡散サンプリングの逆過程を導出する手法を提案する。我々のモデルの適応性は、画像融合モデルと潜時拡散モデルの両方で実装できる。実験により,本手法は画像翻訳タスクにおいて,様々な最先端モデルよりも優れていることが示された。
論文参考訳（メタデータ） (2023-06-07T12:56:56Z)
Low-Light Image Enhancement with Wavelet-based Diffusion Models [50.632343822790006]
拡散モデルは画像復元作業において有望な結果を得たが、時間を要する、過剰な計算資源消費、不安定な復元に悩まされている。本稿では,DiffLLと呼ばれる高能率かつ高能率な拡散型低光画像強調手法を提案する。
論文参考訳（メタデータ） (2023-06-01T03:08:28Z)
Improved Diffusion-based Image Colorization via Piggybacked Models [19.807766482434563]
既存の強力なT2I拡散モデルに基づく色付けモデルを提案する。拡散誘導器は、潜伏拡散モデルの事前訓練された重みを組み込むように設計されている。次に、輝度認識VQVAEは、所定のグレースケール画像に画素完全アライメントされた色付き結果を生成する。
論文参考訳（メタデータ） (2023-04-21T16:23:24Z)
Zero-Shot Contrastive Loss for Text-Guided Diffusion Image Style Transfer [38.957512116073616]
我々は、追加の微調整や補助的なネットワークを必要としない拡散モデルに対して、ゼロショットのコントラスト損失を提案する。本手法は,ゼロショット方式で,ソース画像と同一のセマンティックな内容の画像を生成できる。
論文参考訳（メタデータ） (2023-03-15T13:47:02Z)
Degrade is Upgrade: Learning Degradation for Low-light Image Enhancement [52.49231695707198]
2段階の工程で細部と色を精錬しながら、内在的な劣化と低照度画像を照らし出す。カラー画像の定式化に触発されて,まず低照度入力からの劣化を推定し,環境照明色の歪みをシミュレーションし,そのコンテンツを精錬して拡散照明色の損失を回復した。 LOL1000データセットではPSNRで0.95dB、ExDarkデータセットでは3.18%のmAPでSOTAを上回った。
論文参考訳（メタデータ） (2021-03-19T04:00:27Z)
Burst Denoising of Dark Images [19.85860245798819]
超暗い生画像からクリーンでカラフルなRGB画像を得るためのディープラーニングフレームワークを提案する。我々のフレームワークのバックボーンは、プログレッシブな方法で高品質な出力を生成する新しい粗いネットワークアーキテクチャである。実験により,提案手法は最先端の手法よりも知覚的により満足な結果をもたらすことが示された。
論文参考訳（メタデータ） (2020-03-17T17:17:36Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。