論文の概要: Diffusion-based Aesthetic QR Code Generation via Scanning-Robust Perceptual Guidance
- arxiv url: http://arxiv.org/abs/2403.15878v1
- Date: Sat, 23 Mar 2024 16:08:48 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-26 20:42:03.561877
- Title: Diffusion-based Aesthetic QR Code Generation via Scanning-Robust Perceptual Guidance
- Title(参考訳): 走査ロバスト知覚誘導による拡散型審美QRコード生成
- Authors: Jia-Wei Liao, Winston Wang, Tzu-Sian Wang, Li-Xuan Peng, Cheng-Fu Chou, Jun-Cheng Chen,
- Abstract要約: 日々のアプリケーションで広く使われているQRコードは、従来の白黒デザインのために視覚的な魅力を欠いている。
本稿では,事前学習した制御ネットを利用して,拡散モデルに基づく新しい審美的QRコード生成パイプラインを提案する。
定量的、質的、主観的な実験により、提案手法は様々な審美的なQRコードを詳細に生成できることを示した。
- 参考スコア(独自算出の注目度): 9.905296922309157
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: QR codes, prevalent in daily applications, lack visual appeal due to their conventional black-and-white design. Integrating aesthetics while maintaining scannability poses a challenge. In this paper, we introduce a novel diffusion-model-based aesthetic QR code generation pipeline, utilizing pre-trained ControlNet and guided iterative refinement via a novel classifier guidance (SRG) based on the proposed Scanning-Robust Loss (SRL) tailored with QR code mechanisms, which ensures both aesthetics and scannability. To further improve the scannability while preserving aesthetics, we propose a two-stage pipeline with Scanning-Robust Perceptual Guidance (SRPG). Moreover, we can further enhance the scannability of the generated QR code by post-processing it through the proposed Scanning-Robust Projected Gradient Descent (SRPGD) post-processing technique based on SRL with proven convergence. With extensive quantitative, qualitative, and subjective experiments, the results demonstrate that the proposed approach can generate diverse aesthetic QR codes with flexibility in detail. In addition, our pipelines outperforming existing models in terms of Scanning Success Rate (SSR) 86.67% (+40%) with comparable aesthetic scores. The pipeline combined with SRPGD further achieves 96.67% (+50%). Our code will be available https://github.com/jwliao1209/DiffQRCode.
- Abstract(参考訳): 日々のアプリケーションで広く使われているQRコードは、従来の白黒デザインのために視覚的な魅力を欠いている。
審美性を維持しながら審美性を統合することは、課題である。
本稿では,QRコード機構を組み込んだScanning-Robust Loss (SRL) に基づく新しい分類器ガイダンス (SRG) を用いて,事前学習した制御ネットを活用する,新しい拡散モデルに基づくQRコード生成パイプラインを提案する。
審美性を維持しながらスキャン性をさらに向上するため,SRPG(Scanning-Robust Perceptual Guidance)を用いた2段階パイプラインを提案する。
さらに,SRLに基づくSRPGD(Scanning-Robust Projected Gradient Descent)後処理技術により,生成QRコードのスキャン性をさらに向上させることができる。
定量的、質的、主観的な実験により、提案手法は様々な審美的なQRコードを詳細に生成できることを示した。
さらに、SSR(Scanning Success Rate)の86.67%(+40%)と同等の美的スコアで既存のモデルを上回っています。
SRPGDと組み合わせたパイプラインはさらに96.67%(+50%)を達成した。
私たちのコードはhttps://github.com/jwliao1209/DiffQRCode.comで利用可能です。
関連論文リスト
- DiffQRCoder: Diffusion-based Aesthetic QR Code Generation with Scanning Robustness Guided Iterative Refinement [9.43230708612551]
本稿では,DiffusionベースのQRコード生成器(DiffQRCoder)を提案する。
提案手法では,拡散モデルのための新しい拡散誘導であるSRPG(Scanning-Robust Perceptual Guidance)を導入する。
我々のアプローチは95%以上のSSRを強力に達成し、実世界のアプリケーションにその能力を示す。
論文 参考訳(メタデータ) (2024-09-10T09:22:35Z) - Text2QR: Harmonizing Aesthetic Customization and Scanning Robustness for
Text-Guided QR Code Generation [38.281805719692194]
デジタル時代には、QRコードは仮想空間と物理領域を繋ぐリンチピンとして機能する。
一般的な方法は、カスタマイズとスキャナビリティのバランスをとるという、本質的な課題に対処します。
本稿では,安定拡散モデルを利用した先駆的アプローチであるText2QRを紹介する。
論文 参考訳(メタデータ) (2024-03-11T06:03:31Z) - NeRF-VPT: Learning Novel View Representations with Neural Radiance
Fields via View Prompt Tuning [63.39461847093663]
本研究では,これらの課題に対処するための新しいビュー合成手法であるNeRF-VPTを提案する。
提案するNeRF-VPTは、先行レンダリング結果から得られたRGB情報を、その後のレンダリングステージのインストラクティブな視覚的プロンプトとして機能するカスケーディングビュープロンプトチューニングパラダイムを用いている。
NeRF-VPTは、追加のガイダンスや複雑なテクニックに頼ることなく、トレーニングステージ毎に前のステージレンダリングからRGBデータをサンプリングするだけである。
論文 参考訳(メタデータ) (2024-03-02T22:08:10Z) - Iterative Token Evaluation and Refinement for Real-World
Super-Resolution [77.74289677520508]
実世界の画像超解像(RWSR)は、低品質(LQ)画像が複雑で未同定の劣化を起こすため、長年にわたる問題である。
本稿では,RWSRのための反復的トークン評価・リファインメントフレームワークを提案する。
ITERはGAN(Generative Adversarial Networks)よりも訓練が容易であり,連続拡散モデルよりも効率的であることを示す。
論文 参考訳(メタデータ) (2023-12-09T17:07:32Z) - RBSR: Efficient and Flexible Recurrent Network for Burst
Super-Resolution [57.98314517861539]
バースト超解像(BurstSR)は、高解像度(HR)画像を低解像度(LR)画像と雑音画像から再構成することを目的としている。
本稿では,効率よくフレキシブルなリカレントネットワークでフレーム単位のキューを融合させることを提案する。
論文 参考訳(メタデータ) (2023-06-30T12:14:13Z) - Rolling Shutter Inversion: Bring Rolling Shutter Images to High
Framerate Global Shutter Video [111.08121952640766]
本稿では,RS時相超解問題に対する新しいディープラーニングに基づく解法を提案する。
RSイメージングプロセスの多視点幾何関係を利用して,高フレームレートGS生成を実現する。
提案手法は,高精細で高品質なGS画像系列を生成でき,最先端の手法よりも優れている。
論文 参考訳(メタデータ) (2022-10-06T16:47:12Z) - Visual Radial Basis Q-Network [0.2148535041822524]
トレーニング可能なパラメータの少ない原画像からスパース特徴を抽出する汎用手法を提案する。
提案手法は、概念的に単純でありながら、トレーニング可能なパラメータが少ない場合もあれば、より優れたパフォーマンスを提供する。
論文 参考訳(メタデータ) (2022-06-14T09:34:34Z) - UltraSR: Spatial Encoding is a Missing Key for Implicit Image
Function-based Arbitrary-Scale Super-Resolution [74.82282301089994]
本研究では,暗黙的イメージ関数に基づく,シンプルで効果的な新しいネットワーク設計であるUltraSRを提案する。
空間符号化は,次の段階の高精度暗黙的画像機能に対する欠落鍵であることを示す。
UltraSRは、すべての超解像スケールでDIV2Kベンチマークに最新のパフォーマンスを設定します。
論文 参考訳(メタデータ) (2021-03-23T17:36:42Z) - An End-to-end Method for Producing Scanning-robust Stylized QR Codes [45.35370585928748]
そこで我々はArtCoderという新しいエンドツーエンド手法を提案し,QRコードをスタイリングする。
実験の結果,スタイリングQRコードは視覚効果とスキャニング・ロバスト性の両方において高品質であることがわかった。
論文 参考訳(メタデータ) (2020-11-16T09:38:27Z) - LinksIQ: Robust and Efficient Modulation Recognition with Imperfect
Spectrum Scans [14.27482188246212]
LinksIQは、仮定を単純化して設計された実世界のスペクトルセンシングとModrecメソッドのギャップを埋める。
我々の重要な洞察は、順序付きIQサンプルが、スキャンの欠陥があっても持続する変調にまたがる独特のパターンを形成することである。
本研究は,小型トランスミッターフィンガープリントの実現可能性を示すものである。
論文 参考訳(メタデータ) (2020-05-07T12:16:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。