論文の概要: Cobra: Efficient Line Art COlorization with BRoAder References
- arxiv url: http://arxiv.org/abs/2504.12240v1
- Date: Wed, 16 Apr 2025 16:45:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-17 14:39:19.150852
- Title: Cobra: Efficient Line Art COlorization with BRoAder References
- Title(参考訳): Cobra: BRoAderリファレンスによる効率的なラインアートのコーロライゼーション
- Authors: Junhao Zhuang, Lingen Li, Xuan Ju, Zhaoyang Zhang, Chun Yuan, Ying Shan,
- Abstract要約: 漫画のページは多彩なキャラクター、オブジェクト、背景を含むことが多く、色付け過程を複雑にしている。
画像生成のための拡散モデルの発展にもかかわらず、ラインアートのカラー化への応用は限定的である。
カラーヒントをサポートし,200以上の参照画像を利用する,効率的で汎用的な手法であるCobraを紹介する。
- 参考スコア(独自算出の注目度): 62.452143512625724
- License:
- Abstract: The comic production industry requires reference-based line art colorization with high accuracy, efficiency, contextual consistency, and flexible control. A comic page often involves diverse characters, objects, and backgrounds, which complicates the coloring process. Despite advancements in diffusion models for image generation, their application in line art colorization remains limited, facing challenges related to handling extensive reference images, time-consuming inference, and flexible control. We investigate the necessity of extensive contextual image guidance on the quality of line art colorization. To address these challenges, we introduce Cobra, an efficient and versatile method that supports color hints and utilizes over 200 reference images while maintaining low latency. Central to Cobra is a Causal Sparse DiT architecture, which leverages specially designed positional encodings, causal sparse attention, and Key-Value Cache to effectively manage long-context references and ensure color identity consistency. Results demonstrate that Cobra achieves accurate line art colorization through extensive contextual reference, significantly enhancing inference speed and interactivity, thereby meeting critical industrial demands. We release our codes and models on our project page: https://zhuang2002.github.io/Cobra/.
- Abstract(参考訳): コミック製作業界は、高い精度、効率、文脈整合性、柔軟な制御を備えた基準ベースのラインアートカラー化を必要としている。
漫画のページは多彩なキャラクター、オブジェクト、背景を含むことが多く、色付け過程を複雑にしている。
画像生成のための拡散モデルの発展にもかかわらず、ラインアートのカラー化への応用は限定的であり、広範な参照画像の処理、時間消費推論、柔軟な制御に関する課題に直面している。
ラインアートのカラー化における画像指導の必要性について検討する。
これらの課題に対処するために、カラーヒントをサポートし、低レイテンシを維持しながら200以上の参照画像を利用する、効率的で汎用的な方法であるCobraを紹介した。
CobraのCentral to CobraはCausal Sparse DiTアーキテクチャであり、特殊に設計された位置エンコーディング、因果スパースアテンション、キーバリューキャッシュを活用して、長いコンテキスト参照を効果的に管理し、カラーアイデンティティの整合性を確保する。
以上の結果から,コブラは広範囲な文脈参照により正確なラインアートのカラー化を実現し,推論速度と相互作用性を著しく向上し,重要な産業的要求を満たすことが示唆された。
私たちはプロジェクトページでコードとモデルを公開しています。
関連論文リスト
- MangaNinja: Line Art Colorization with Precise Reference Following [84.2001766692797]
MangaNinjiaは、ラインアートのカラー化に特化している。
文字の詳細を正確に書き起こすために、2つの思慮深い設計を取り入れる。
基準カラー画像と対象ラインアートとの対応学習を容易にするパッチシャッフルモジュールと、きめ細かい色マッチングを可能にするポイント駆動制御スキームとを備える。
論文 参考訳(メタデータ) (2025-01-14T18:59:55Z) - Paint Bucket Colorization Using Anime Character Color Design Sheets [72.66788521378864]
ネットワークがセグメント間の関係を理解することができる包摂的マッチングを導入する。
ネットワークのトレーニングパイプラインは、カラー化と連続フレームカラー化の両方のパフォーマンスを著しく向上させる。
ネットワークのトレーニングをサポートするために、PaintBucket-Characterというユニークなデータセットを開発しました。
論文 参考訳(メタデータ) (2024-10-25T09:33:27Z) - Learning Inclusion Matching for Animation Paint Bucket Colorization [76.4507878427755]
ネットワークにセグメント間の包摂関係を理解するための,学習に基づく新たな包摂的マッチングパイプラインを導入する。
提案手法では,粗いカラーワープモジュールと包括的マッチングモジュールを統合した2段階のパイプラインを特徴とする。
ネットワークのトレーニングを容易にするため,PaintBucket-Characterと呼ばれるユニークなデータセットも開発した。
論文 参考訳(メタデータ) (2024-03-27T08:32:48Z) - Diffusing Colors: Image Colorization with Text Guided Diffusion [11.727899027933466]
粒状テキストプロンプトを用いた画像拡散技術を利用した新しい画像カラー化フレームワークを提案する。
本手法は,視覚的品質とセマンティック・コヒーレンスの観点から,既存の技術よりも優れた自動化と制御のバランスを与える。
我々のアプローチは、特に色強調と歴史的イメージのカラー化の可能性を秘めている。
論文 参考訳(メタデータ) (2023-12-07T08:59:20Z) - BiSTNet: Semantic Image Prior Guided Bidirectional Temporal Feature
Fusion for Deep Exemplar-based Video Colorization [70.14893481468525]
本稿では,参照例の色を探索し,映像のカラー化を支援するために有効なBiSTNetを提案する。
まず、各フレームと参照例間の深い特徴空間における意味的対応を確立し、参照例からの色情報を探究する。
我々は,フレームのオブジェクト境界をモデル化するための意味情報を抽出する混合専門家ブロックを開発した。
論文 参考訳(メタデータ) (2022-12-05T13:47:15Z) - Line Art Correlation Matching Feature Transfer Network for Automatic
Animation Colorization [0.0]
色付き参照特徴を学習可能な方法で整列させるための相関マッチング特徴伝達モデル(CMFT)を提案する。
これにより、ジェネレータはディープセマンティックコードから徐々にコンテンツにレイヤーワイドの同期機能を転送できる。
論文 参考訳(メタデータ) (2020-04-14T06:50:08Z) - Deep Line Art Video Colorization with a Few References [49.7139016311314]
そこで本稿では,対象の参照画像と同一のカラースタイルでラインアートビデオを自動的に色付けする深層アーキテクチャを提案する。
本フレームワークはカラートランスフォーメーションネットワークと時間制約ネットワークから構成される。
本モデルでは,少量のサンプルでパラメータを微調整することで,より優れたカラー化を実現することができる。
論文 参考訳(メタデータ) (2020-03-24T06:57:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。