論文の概要: Hist2Style: Histogram-Guided Stylization with Bilateral Grids
- arxiv url: http://arxiv.org/abs/2606.01819v1
- Date: Mon, 01 Jun 2026 07:34:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-02 21:34:31.497331
- Title: Hist2Style: Histogram-Guided Stylization with Bilateral Grids
- Title(参考訳): Hist2-Style:Histogram-Guided Stylization with bilateral Grids
- Authors: Dekel Galor, Adam Pikielny, Zhoutong Zhang, Ke Wang, Laura Waller, Jiawen Chen, Ilya Chugunov,
- Abstract要約: フォトリアリスティックなスタイル転送は、入力画像の色とトーンを、オリジナルシーンの内容と詳細を保存しながら、スタイルターゲットの色とトーンに合わせることを目的としている。
本モデルでは,大規模な教師付きコーパスのトレーニングにより,大規模な画像編集モデルを軽量ネットワークに抽出する。
Hist2Styleは、インタラクティブなユーザ制御可能な色とトーン調整を備えたリアルタイムで高解像度のフォトリアリスティックスタイリングをサポートする。
- 参考スコア(独自算出の注目度): 12.102070036832783
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Photorealistic style transfer aims to match the color and tone of an input image to that of a style target while preserving the content and details of the original scene. Although existing large image models can facilitate these kinds of appearance edits, their high computational demands, potential for hallucinations, and limited user control make them unsuitable for high-resolution, real-time workflows. We introduce Hist2Style, a bilateral-grid formulation for fast, edge-aware stylization that preserves visual fidelity by constraining operations to locally affine transforms in bilateral space. Our model distills a large image editing model into a lightweight network by training on a large supervised corpus generated with language and vision-language models, targeting spatially varying color edits. The network conditions on a histogram-based embedding of the style target to provide an interpretable interface for adjusting the output style by modifying the target color distribution. Overall, Hist2Style maintains content structure by construction, avoids hallucinations, and supports real-time, high-resolution photorealistic stylization with interactive user-controllable color and tone adjustments.
- Abstract(参考訳): フォトリアリスティックなスタイル転送は、入力画像の色とトーンを、オリジナルシーンの内容と詳細を保存しながら、スタイルターゲットの色とトーンに合わせることを目的としている。
既存の大規模な画像モデルはこのような外観編集を容易にするが、その高い計算要求、幻覚の可能性を秘めているため、高解像度でリアルタイムなワークフローには適さない。
両空間における局所アフィン変換に演算を制約することで視覚的忠実さを保ちながら、高速なエッジ認識型スタイリングのための両側グリッド式Hist2Styleを導入する。
本モデルでは,空間的に異なる色編集をターゲットとした,言語モデルと視覚言語モデルを用いた大規模教師付きコーパスのトレーニングにより,大規模な画像編集モデルを軽量ネットワークに抽出する。
ヒストグラムに基づくスタイルターゲットの埋め込みのネットワーク条件は、ターゲット色分布を変更して出力スタイルを調整するための解釈可能なインターフェースを提供する。
全体として、Hist2Styleは、構成によるコンテンツ構造を維持し、幻覚を回避し、インタラクティブなユーザ制御可能な色とトーン調整によるリアルタイムで高解像度のフォトリアリスティックスタイリングをサポートする。
関連論文リスト
- Inversion-Free Style Transfer with Dual Rectified Flows [57.02757226679549]
本稿では,2つの修正フローに基づく新しいテキスト変換自由なスタイル転送フレームワークを提案する。
提案手法は,コンテントとスタイルのトラジェクトリを並列に予測し,動的中間点を通して融合する。
様々なスタイルやコンテンツにまたがる一般化を実証し、効果的かつ効率的なスタイル転送パイプラインを提供する。
論文 参考訳(メタデータ) (2025-11-26T02:28:51Z) - Color3D: Controllable and Consistent 3D Colorization with Personalized Colorizer [58.94607850223466]
静的な3Dシーンと動的な3Dシーンの両方をモノクロ入力から色づけする、高度に適応可能なフレームワークであるColor3Dを提案する。
当社のアプローチは、クロスビューとクロスタイムの一貫性を確保しながら、カラー多様性とステアビリティを維持できます。
論文 参考訳(メタデータ) (2025-10-11T10:21:19Z) - IMAGGarment: Fine-Grained Garment Generation for Controllable Fashion Design [42.47747601358035]
IMAGGarmentは、シルエット、色、ロゴの配置を正確に制御し、高忠実な衣服合成を可能にするフレームワークである。
提案手法は既存のベースラインより優れ, 優れた構造安定性, カラー忠実度, 局所制御性性能を実現している。
論文 参考訳(メタデータ) (2025-04-17T17:59:47Z) - Free-Lunch Color-Texture Disentanglement for Stylized Image Generation [62.215875006311876]
本稿では,タイマライズされたT2I生成において,フリーランチなカラーテクスチャ・ディコンタングルを実現するための,最初のチューニング自由アプローチを提案する。
Our Style Attributes Disentanglement approach (SADis)は、より正確でカスタマイズ可能な、スタイリングされた画像生成ソリューションを提供する。
WikiArtとStyleDropのデータセットの画像に対する実験は、SADisがDisIGタスクの最先端化方法を上回ることを実証している。
論文 参考訳(メタデータ) (2025-03-18T14:10:43Z) - MRStyle: A Unified Framework for Color Style Transfer with Multi-Modality Reference [32.64957647390327]
MRStyleは、画像やテキストを含む多モード参照を用いたカラースタイルの転送を可能にするフレームワークである。
テキスト参照では、安定拡散前のテキスト特徴とIRStyleのスタイル特徴とを一致させて、テキスト誘導カラースタイル転送(TRStyle)を行う。
我々のTRStyle法はトレーニングと推論の両方において極めて効率的であり、オープンセットのテキスト誘導転送結果を生成する。
論文 参考訳(メタデータ) (2024-09-09T00:01:48Z) - ZePo: Zero-Shot Portrait Stylization with Faster Sampling [61.14140480095604]
本稿では,4つのサンプリングステップでコンテンツとスタイルの融合を実現する拡散モデルに基づく,インバージョンフリーなポートレートスタイリングフレームワークを提案する。
本稿では,一貫性機能における冗長な特徴をマージする機能統合戦略を提案し,注意制御の計算負荷を低減させる。
論文 参考訳(メタデータ) (2024-08-10T08:53:41Z) - PIA: Your Personalized Image Animator via Plug-and-Play Modules in Text-to-Image Models [14.657472801570284]
PIAは、条件画像との整合性、テキストによる動作制御性、および特定のチューニングなしで様々なパーソナライズされたT2Iモデルとの互換性に優れる。
PIAのキーコンポーネントは条件モジュールの導入であり、入力として条件フレームとフレーム間の親和性を利用する。
論文 参考訳(メタデータ) (2023-12-21T15:51:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。