Fugu-MT 論文翻訳(概要): Applying a Color Palette with Local Control using Diffusion Models

論文の概要: Applying a Color Palette with Local Control using Diffusion Models

arxiv url: http://arxiv.org/abs/2307.02698v3
Date: Sat, 2 Sep 2023 18:28:49 GMT
ステータス: 翻訳完了
システム内更新日: 2023-09-07 04:14:07.825810
Title: Applying a Color Palette with Local Control using Diffusion Models
Title（参考訳）: 拡散モデルを用いた局所制御によるカラーパレットの適用
Authors: Vaibhav Vavilala and David Forsyth
Abstract要約: ベクトル量子化のパイプライン、マッチング、および(拡散モデルを用いて)dequantization''が極端なパレット転送を成功させることを示す。我々は,Yu-Gi-Ohカードアートデータセットに挑戦する手法を実証する。
参考スコア（独自算出の注目度）: 6.942167888954434
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: We demonstrate two novel editing procedures in the context of fantasy art. Palette transfer applies a specified reference palette to a given image. For fantasy art, the desired change in palette can be very large, leading to huge changes in the ``look'' of the art. We show that a pipeline of vector quantization; matching; and ``dequantization'' (using a diffusion model) produces successful extreme palette transfers. A novel training loss measures the match between color distribution in control and generated images even when a ground truth target is not available. This measurably improves performance. Segment control allows an artist to move one or more image segments, and to optionally specify the desired color of the result. The combination of these two types of edit yields valuable workflows. We demonstrate our methods on the challenging Yu-Gi-Oh card art dataset.
Abstract（参考訳）: ファンタジーアートの文脈における2つの新しい編集手順を実証する。パレット転送は、指定された参照パレットを所定の画像に適用する。ファンタジーアートでは、パレットの望ましい変化が非常に大きくなり、芸術の『展望』に大きな変化をもたらす。ベクトル量子化のパイプライン,マッチング,および ''dequantization'' (拡散モデルを用いて) が極端なパレット転送を成功させることを示す。新たなトレーニング損失は、グラウンド真理目標が利用できない場合でも、制御中の色分布と生成された画像との一致を測定する。これにより性能が向上する。セグメント制御により、アーティストは1つ以上の画像セグメントを移動でき、任意に結果の色を指定することができる。これら2種類の編集の組み合わせは、貴重なワークフローをもたらす。我々は,Yu-Gi-Ohカードアートデータセットに挑戦する手法を実証する。

関連論文リスト

Color Conditional Generation with Sliced Wasserstein Guidance [44.99833362998488]
SW-Guidance(SW-Guidance)は、参照画像の色分布に条件付けされた画像生成のためのトレーニング不要のアプローチである。本手法は,カラーコンディショナリ生成の最先端技術よりも,基準色との類似性に優れる。
論文参考訳（メタデータ） (2025-03-24T18:06:03Z)
Free-Lunch Color-Texture Disentanglement for Stylized Image Generation [58.406368812760256]
本稿では,タイマライズされたT2I生成において,フリーランチなカラーテクスチャ・ディコンタングルを実現するための,最初のチューニング自由アプローチを提案する。色とテクスチャの基準画像からCTE(Color-Texture Embeddings)を分離・抽出する技術を開発した。生成した画像の色パレットが色基準と密接に一致していることを確認するため、白と彩色変換を適用する。
論文参考訳（メタデータ） (2025-03-18T14:10:43Z)
Leveraging Semantic Attribute Binding for Free-Lunch Color Control in Diffusion Models [53.73253164099701]
拡散モデルにおいて、微調整なしで正確なRGBレベルの色制御を実現する、トレーニング不要なアプローチであるColorWaveを導入する。我々は、カラーウェーブが、構造化された、色一貫性の拡散に基づく画像合成のための新しいパラダイムを確立することを実証した。
論文参考訳（メタデータ） (2025-03-12T21:49:52Z)
Training-free Color-Style Disentanglement for Constrained Text-to-Image Synthesis [16.634138745034733]
そこで本研究では,参照画像から色とスタイル属性のテキスト・ツー・イメージを分離する,最初のトレーニングフリーでテスト時間のみの手法を提案する。
論文参考訳（メタデータ） (2024-09-04T04:16:58Z)
Palette-based Color Transfer between Images [9.471264982229508]
そこで我々は,新しいカラースキームを自動生成できるパレットベースのカラートランスファー手法を提案する。再設計されたパレットベースのクラスタリング手法により、色分布に応じて画素を異なるセグメントに分類することができる。本手法は, 自然リアリズム, 色整合性, 一般性, 堅牢性の観点から, ピア法に対して有意な優位性を示す。
論文参考訳（メタデータ） (2024-05-14T01:41:19Z)
Automatic Controllable Colorization via Imagination [55.489416987587305]
本稿では,反復的な編集と修正が可能な自動色付けフレームワークを提案する。グレースケール画像内のコンテンツを理解することにより、トレーニング済みの画像生成モデルを用いて、同じコンテンツを含む複数の画像を生成する。これらの画像は、人間の専門家の過程を模倣して、色付けの参考となる。
論文参考訳（メタデータ） (2024-04-08T16:46:07Z)
Control Color: Multimodal Diffusion-based Interactive Image Colorization [81.68817300796644]
Control Color (Ctrl Color) は、事前訓練された安定拡散(SD)モデルを利用する多モードカラー化手法である。ユーザのストロークをエンコードして、局所的な色操作を正確に行うための効果的な方法を提案する。また、カラーオーバーフローと不正確な色付けの長年の問題に対処するために、自己注意に基づく新しいモジュールとコンテンツ誘導型変形可能なオートエンコーダを導入する。
論文参考訳（メタデータ） (2024-02-16T17:51:13Z)
Towards Enhanced Image Inpainting: Mitigating Unwanted Object Insertion and Preserving Color Consistency [78.0488707697235]
ASUKA(Aigned Stable Inpainting with UnKnown Areas)と呼ばれるポストプロセッシングアプローチは、インパインティングモデルを改善する。 Masked Auto-Encoder (MAE) は、オブジェクト幻覚を緩和する。ローカルタスクとしてラテント・ツー・イメージ・デコーディングを扱う特殊なVAEデコーダ。
論文参考訳（メタデータ） (2023-12-08T05:08:06Z)
Image Inpainting via Tractable Steering of Diffusion Models [54.13818673257381]
本稿では,トラクタブル確率モデル(TPM)の制約後部を正確に,かつ効率的に計算する能力を活用することを提案する。具体的には、確率回路(PC)と呼ばれる表現型TPMのクラスを採用する。提案手法は, 画像の全体的な品質とセマンティックコヒーレンスを, 計算オーバーヘッドを10%加えるだけで一貫的に改善できることを示す。
論文参考訳（メタデータ） (2023-11-28T21:14:02Z)
PalGAN: Image Colorization with Palette Generative Adversarial Networks [51.59276436217957]
そこで本研究では,パレット推定とカラーアテンションを統合した新しいGANベースのカラー化手法PalGANを提案する。 PalGANは、定量的評価と視覚比較において最先端の成果を上げ、顕著な多様性、コントラスト、およびエッジ保存の外観を提供する。
論文参考訳（メタデータ） (2022-10-20T12:28:31Z)
Palette: Image-to-Image Diffusion Models [50.268441533631176]
我々は条件付き拡散モデルを用いた画像から画像への変換のためのシンプルで一般的なフレームワークであるPaletteを紹介する。 4つの困難な画像から画像への変換タスクにおいて、Paletteは強力なGANと回帰ベースラインを上回っている。本稿では、FID、インセプションスコア、事前訓練されたResNet-50の分類精度、参照画像に対する知覚距離などのサンプル品質スコアについて報告する。
論文参考訳（メタデータ） (2021-11-10T17:49:29Z)
Generative Probabilistic Image Colorization [2.110198946293069]
本稿では,音の劣化の各ステップを逆転させる確率モデル列を訓練する拡散型生成法を提案する。入力として線引き画像が与えられた場合、本手法は複数の候補色付き画像を提案する。提案手法は,色条件の画像生成タスクだけでなく,実用的な画像補完や塗装タスクにも有効である。
論文参考訳（メタデータ） (2021-09-29T16:10:12Z)
Texture for Colors: Natural Representations of Colors Using Variable Bit-Depth Textures [13.180922099929765]
そこで本研究では,画像の強度だけでなく,元の色も表わす2値テクスチャの組に画像が変換される自動手法を提案する。このシステムは、様々な画像ソースでテストすると、美的にバイナリイメージを満足させる。
論文参考訳（メタデータ） (2021-05-04T21:22:02Z)
In&Out : Diverse Image Outpainting via GAN Inversion [89.84841983778672]
image outpaintingは、利用可能なコンテンツを超えて、入力画像の意味的に一貫した拡張を求める。本研究では、生成的対向ネットワークの反転の観点から問題を定式化する。私達の発電機はイメージの彼らの共同潜入コードそして個々の位置で調節されるマイクロパッチをレンダリングします。
論文参考訳（メタデータ） (2021-04-01T17:59:10Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。