論文の概要: OmniColor: A Unified Framework for Multi-modal Lineart Colorization
- arxiv url: http://arxiv.org/abs/2603.27531v1
- Date: Sun, 29 Mar 2026 05:46:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-31 23:18:45.00758
- Title: OmniColor: A Unified Framework for Multi-modal Lineart Colorization
- Title(参考訳): OmniColor: マルチモーダルリニアトカラー化のための統一フレームワーク
- Authors: Xulu Zhang, Haoqian Du, Xiaoyong Wei, Qing Li,
- Abstract要約: マルチモーダル線形色化のための統一フレームワークであるOmniColorを提案する。
誘導信号は空間的に整合した条件と意味的参照条件の2つのタイプに分類する。
実験により、OmniColorは優れた制御性、視覚的品質、時間的安定性を実現することが示された。
- 参考スコア(独自算出の注目度): 12.417479154389751
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Lineart colorization is a critical stage in professional content creation, yet achieving precise and flexible results under diverse user constraints remains a significant challenge. To address this, we propose OmniColor, a unified framework for multi-modal lineart colorization that supports arbitrary combinations of control signals. Specifically, we systematically categorize guidance signals into two types: spatially-aligned conditions and semantic-reference conditions. For spatially-aligned inputs, we employ a dual-path encoding strategy paired with a Dense Feature Alignment loss to ensure rigorous boundary preservation and precise color restoration. For semantic-reference inputs, we utilize a VLM-only encoding scheme integrated with a Temporal Redundancy Elimination mechanism to filter repetitive information and enhance inference efficiency. To resolve potential input conflicts, we introduce an Adaptive Spatial-Semantic Gating module that dynamically balances multi-modal constraints. Experimental results demonstrate that OmniColor achieves superior controllability, visual quality, and temporal stability, providing a robust and practical solution for lineart colorization. The source code and dataset will be open at https://github.com/zhangxulu1996/OmniColor.
- Abstract(参考訳): ラインアートのカラー化は、プロのコンテンツ制作において重要な段階であるが、多様なユーザー制約の下で正確で柔軟な結果を達成することは、依然として大きな課題である。
そこで本稿では,制御信号の任意の組み合わせをサポートする多モード線形色化フレームワークであるOmniColorを提案する。
具体的には、誘導信号を空間的整合条件と意味的参照条件の2つのタイプに分類する。
空間的に整合した入力に対して、厳密な境界保存と正確な色復元を確保するために、Dense Feature Alignment Losと組み合わせたデュアルパス符号化方式を用いる。
セマンティック・レファレンス・インプットでは,テンポラル・冗長性除去機構と統合されたVLMのみの符号化方式を用いて繰り返し情報をフィルタリングし,推論効率を向上させる。
潜在的な入力競合を解決するために,マルチモーダル制約を動的にバランスする適応型空間意味ゲーティングモジュールを導入する。
実験により,OmniColorは優れた制御性,視覚的品質,時間的安定性を実現し,リニアトカラー化のための堅牢で実用的なソリューションを提供することが示された。
ソースコードとデータセットはhttps://github.com/zhangxulu1996/OmniColor.comで公開される。
関連論文リスト
- CAST-LUT: Tokenizer-Guided HSV Look-Up Tables for Purple Flare Removal [23.950152572091543]
分離されたHSVルックアップテーブル(LUT)上に構築された新しいネットワークを提案する。
本手法は,Hue (H), Saturation (S), Value (V)コンポーネントを独立に調整することで,色補正を簡略化することを目的とする。
我々のモデルは、視覚効果において既存の手法を著しく上回るだけでなく、あらゆる定量的指標に対して最先端のパフォーマンスも達成する。
論文 参考訳(メタデータ) (2025-11-10T06:45:03Z) - Color3D: Controllable and Consistent 3D Colorization with Personalized Colorizer [58.94607850223466]
静的な3Dシーンと動的な3Dシーンの両方をモノクロ入力から色づけする、高度に適応可能なフレームワークであるColor3Dを提案する。
当社のアプローチは、クロスビューとクロスタイムの一貫性を確保しながら、カラー多様性とステアビリティを維持できます。
論文 参考訳(メタデータ) (2025-10-11T10:21:19Z) - Leveraging Semantic Attribute Binding for Free-Lunch Color Control in Diffusion Models [53.73253164099701]
拡散モデルにおいて、微調整なしで正確なRGBレベルの色制御を実現する、トレーニング不要なアプローチであるColorWaveを導入する。
我々は、カラーウェーブが、構造化された、色一貫性の拡散に基づく画像合成のための新しいパラダイムを確立することを実証した。
論文 参考訳(メタデータ) (2025-03-12T21:49:52Z) - MangaNinja: Line Art Colorization with Precise Reference Following [84.2001766692797]
MangaNinjiaは、ラインアートのカラー化に特化している。
文字の詳細を正確に書き起こすために、2つの思慮深い設計を取り入れる。
基準カラー画像と対象ラインアートとの対応学習を容易にするパッチシャッフルモジュールと、きめ細かい色マッチングを可能にするポイント駆動制御スキームとを備える。
論文 参考訳(メタデータ) (2025-01-14T18:59:55Z) - DreamColour: Controllable Video Colour Editing without Training [80.90808879991182]
直感的なインタフェースにより、正確な映像色編集を可能にする訓練不要のフレームワークを提案する。
色編集の空間的側面と時間的側面を分離することにより、ユーザの自然なワークフローをより良く整合させることができる。
当社のアプローチは、トレーニングや特別なハードウェアの必要性を排除しつつ、最先端の手法に適合または超越しています。
論文 参考訳(メタデータ) (2024-12-06T16:57:54Z) - Control Color: Multimodal Diffusion-based Interactive Image Colorization [81.68817300796644]
Control Color (Ctrl Color) は、事前訓練された安定拡散(SD)モデルを利用する多モードカラー化手法である。
ユーザのストロークをエンコードして、局所的な色操作を正確に行うための効果的な方法を提案する。
また、カラーオーバーフローと不正確な色付けの長年の問題に対処するために、自己注意に基づく新しいモジュールとコンテンツ誘導型変形可能なオートエンコーダを導入する。
論文 参考訳(メタデータ) (2024-02-16T17:51:13Z) - Neural Preset for Color Style Transfer [46.66925849502683]
本稿では,既存のカラースタイル転送手法の限界に対処するニューラルプレセット手法を提案する。
提案手法は2つのコア設計に基づいており,まず,各画素に対して連続的に動作する決定論的ニューラルカラーマッピング(DNCM)を提案する。
第2に、タスクをカラー正規化とスタイル化に分割することで、2段階のパイプラインを構築する。
論文 参考訳(メタデータ) (2023-03-23T17:59:10Z) - BiSTNet: Semantic Image Prior Guided Bidirectional Temporal Feature
Fusion for Deep Exemplar-based Video Colorization [70.14893481468525]
本稿では,参照例の色を探索し,映像のカラー化を支援するために有効なBiSTNetを提案する。
まず、各フレームと参照例間の深い特徴空間における意味的対応を確立し、参照例からの色情報を探究する。
我々は,フレームのオブジェクト境界をモデル化するための意味情報を抽出する混合専門家ブロックを開発した。
論文 参考訳(メタデータ) (2022-12-05T13:47:15Z) - UniColor: A Unified Framework for Multi-Modal Colorization with
Transformer [23.581502129504287]
各種条件を1つのモデルに組み込むための2段階カラー化フレームワークを提案する。
第一段階では、マルチモーダル条件はヒントポイントの共通表現に変換される。
第2段階では,Chroma-VQGANとHybrid-Transformerで構成されるTransformerベースのネットワークを提案し,ヒント点に条件付き多彩で高品質なカラー化結果を生成する。
論文 参考訳(メタデータ) (2022-09-22T17:59:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。