論文の概要: Screentone-Preserved Manga Retargeting
- arxiv url: http://arxiv.org/abs/2203.03396v1
- Date: Mon, 7 Mar 2022 13:48:15 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-08 17:13:53.111685
- Title: Screentone-Preserved Manga Retargeting
- Title(参考訳): スクリーントン保存マンガリターゲティング
- Authors: Minshan Xie, Menghan Xia, Xueting Liu, Tien-Tsin Wong
- Abstract要約: スクリーントーンを各スクリーン領域に保持しながら,再スケールしたマンガ画像を合成する手法を提案する。
再スケールされたマンガは,原漫画と同一領域のスクリーントーン対応を有しており,スクリーントーン問題を単純化することができる。
- 参考スコア(独自算出の注目度): 27.415654292345355
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As a popular comic style, manga offers a unique impression by utilizing a
rich set of bitonal patterns, or screentones, for illustration. However,
screentones can easily be contaminated with visual-unpleasant aliasing and/or
blurriness after resampling, which harms its visualization on displays of
diverse resolutions. To address this problem, we propose the first manga
retargeting method that synthesizes a rescaled manga image while retaining the
screentone in each screened region. This is a non-trivial task as accurate
region-wise segmentation remains challenging. Fortunately, the rescaled manga
shares the same region-wise screentone correspondences with the original manga,
which enables us to simplify the screentone synthesis problem as an
anchor-based proposals selection and rearrangement problem. Specifically, we
design a novel manga sampling strategy to generate aliasing-free screentone
proposals, based on hierarchical grid-based anchors that connect the
correspondences between the original and the target rescaled manga.
Furthermore, a Recurrent Proposal Selection Module (RPSM) is proposed to
adaptively integrate these proposals for target screentone synthesis. Besides,
to deal with the translation insensitivity nature of screentones, we propose a
translation-invariant screentone loss to facilitate the training convergence.
Extensive qualitative and quantitative experiments are conducted to verify the
effectiveness of our method, and notably compelling results are achieved
compared to existing alternative techniques.
- Abstract(参考訳): マンガは人気漫画のスタイルとして、ビトンパターンやスクリーントーンの豊富なセットをイラストに活用してユニークな印象を与えている。
しかし、スクリーントンは再サンプリング後の視覚的不快なエイリアスやぼかしによって容易に汚染され、多様な解像度のディスプレイ上での可視化に悪影響を及ぼす。
そこで本研究では,スクリーントーンを維持しつつ,再スケールしたマンガ画像を合成する最初のマンガ再ターゲティング手法を提案する。
正確な領域分割は依然として困難である。
幸運なことに、再スケールされたマンガは、元のマンガと同じ領域的なスクリーントーン対応を共有しており、アンカーベースの提案選択および再配置問題として、スクリーントーン合成問題を単純化することができる。
具体的には,オリジナルと再スケールしたマンガの対応関係を接続する階層的グリッドベースのアンカーに基づいて,エイリアスフリーなスクリーントーン提案を生成する新しいマンガサンプリング戦略を設計する。
さらに,これらの提案を適応的に統合するために,RPSM (Recurrent Proposal Selection Module) を提案する。
また,スクリーントーンの翻訳過敏性に対処するため,学習収束を容易にするために,翻訳不可変スクリーントーン損失を提案する。
本手法の有効性を検証するために広範囲な質的・定量的実験を行い,既存の代替手法と比較して特に説得力のある結果を得た。
関連論文リスト
- Layered Rendering Diffusion Model for Zero-Shot Guided Image Synthesis [60.260724486834164]
本稿では,テキストクエリに依存する拡散モデルにおける空間制御性向上のための革新的な手法を提案する。
視覚誘導(Vision Guidance)とレイヤーレンダリング拡散(Layered Rendering Diffusion)フレームワーク(Layered Diffusion)という2つの重要なイノベーションを提示します。
本稿では,ボックス・ツー・イメージ,セマンティック・マスク・ツー・イメージ,画像編集の3つの実践的応用に適用する。
論文 参考訳(メタデータ) (2023-11-30T10:36:19Z) - Scenimefy: Learning to Craft Anime Scene via Semi-Supervised
Image-to-Image Translation [75.91455714614966]
そこで我々は,新しい半教師付き画像-画像間翻訳フレームワークであるScenimefyを提案する。
提案手法は,構造に一貫性のある擬似ペアデータによる学習を導く。
スタイル化と細部を改善するために、パッチワイドのコントラストスタイルロスが導入されている。
論文 参考訳(メタデータ) (2023-08-24T17:59:50Z) - Manga Rescreening with Interpretable Screentone Representation [21.638561901817866]
マンガページの適応または再購入のプロセスは、マンガアーティストがすべてのスクリーントーン領域で手作業で作業する必要がある時間を要する作業である。
マンガ適応に関わる人的労力を最小限に抑えることを目的とした自動マンガ再スクリーニングパイプラインを提案する。
パイプラインは自動的にスクリーントーン領域を認識し,新たに指定された特徴を持つ新規なスクリーントーンを生成する。
論文 参考訳(メタデータ) (2023-06-07T02:55:09Z) - Conditional Score Guidance for Text-Driven Image-to-Image Translation [52.73564644268749]
本稿では,事前訓練されたテキスト・画像拡散モデルに基づく,テキスト駆動型画像・画像変換のための新しいアルゴリズムを提案する。
本手法は,ソース画像の関心領域を選択的に編集することで,対象画像を生成することを目的とする。
論文 参考訳(メタデータ) (2023-05-29T10:48:34Z) - Break-A-Scene: Extracting Multiple Concepts from a Single Image [80.47666266017207]
テキストシーン分解の課題を紹介する。
本稿では,対象概念の存在を示すマスクを用いた入力画像の拡張を提案する。
次に、新しい2段階のカスタマイズプロセスを示す。
論文 参考訳(メタデータ) (2023-05-25T17:59:04Z) - Screentone-Aware Manga Super-Resolution Using DeepLearning [3.0638744222997034]
高品質な画像は送信を妨げ、視聴体験に影響を与える可能性がある。
従来のベクトル化法では、スクリーントーンの処理にかなりの量の手動パラメータ調整が必要となる。
超高解像度画像は、低透過率を維持し、高品質な結果を提供するとともに、高解像度画像を高解像度画像に変換することができる。
論文 参考訳(メタデータ) (2023-05-15T03:24:36Z) - High-Fidelity Guided Image Synthesis with Latent Diffusion Models [50.39294302741698]
提案手法は, ユーザ満足度スコアを85.32%以上上回り, 従来の最先端技術よりも優れていた。
人的ユーザ調査の結果、提案手法は、全体のユーザ満足度スコアにおいて、従来の最先端技術よりも85.32%以上優れていたことが示されている。
論文 参考訳(メタデータ) (2022-11-30T15:43:20Z) - Exploiting Aliasing for Manga Restoration [14.978972444431832]
劣化したマンガから品質ビットマンガを復元する革新的な二段階法を提案する。
まず, スケール推定ネットワーク(SE-Net)を用いて, 劣化マンガから目標分解能を予測する。
そして、目標解像度で、マンガリカバリーネットワーク(MR-Net)を介して、地域単位のバイトンスクリーントーンを復元します。
論文 参考訳(メタデータ) (2021-05-14T13:47:04Z) - Semantic Layout Manipulation with High-Resolution Sparse Attention [106.59650698907953]
本稿では,意味ラベルマップを編集して入力画像を操作するセマンティックイメージレイアウト操作の課題に対処する。
このタスクの中核的な問題は、視覚的にイメージを現実的にしながら、入力画像から新しいセマンティックレイアウトに視覚的な詳細を転送する方法です。
512×512の解像度で視覚的詳細を新しいレイアウトに効果的に転送する高分解能スパースアテンションモジュールを提案する。
論文 参考訳(メタデータ) (2020-12-14T06:50:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。