論文の概要: DiffQRCoder: Diffusion-based Aesthetic QR Code Generation with Scanning Robustness Guided Iterative Refinement
- arxiv url: http://arxiv.org/abs/2409.06355v1
- Date: Tue, 10 Sep 2024 09:22:35 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-11 18:19:52.480167
- Title: DiffQRCoder: Diffusion-based Aesthetic QR Code Generation with Scanning Robustness Guided Iterative Refinement
- Title(参考訳): DiffQRCoder: 走査ロバスト性誘導反復リファインメントによる拡散型審美QRコード生成
- Authors: Jia-Wei Liao, Winston Wang, Tzu-Sian Wang, Li-Xuan Peng, Ju-Hsuan Weng, Cheng-Fu Chou, Jun-Cheng Chen,
- Abstract要約: 本稿では,DiffusionベースのQRコード生成器(DiffQRCoder)を提案する。
提案手法では,拡散モデルのための新しい拡散誘導であるSRPG(Scanning-Robust Perceptual Guidance)を導入する。
我々のアプローチは95%以上のSSRを強力に達成し、実世界のアプリケーションにその能力を示す。
- 参考スコア(独自算出の注目度): 9.43230708612551
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: With the success of Diffusion Models for image generation, the technologies also have revolutionized the aesthetic Quick Response (QR) code generation. Despite significant improvements in visual attractiveness for the beautified codes, their scannabilities are usually sacrificed and thus hinder their practical uses in real-world scenarios. To address this issue, we propose a novel Diffusion-based QR Code generator (DiffQRCoder) to effectively craft both scannable and visually pleasing QR codes. The proposed approach introduces Scanning-Robust Perceptual Guidance (SRPG), a new diffusion guidance for Diffusion Models to guarantee the generated aesthetic codes to obey the ground-truth QR codes while maintaining their attractiveness during the denoising process. Additionally, we present another post-processing technique, Scanning Robust Manifold Projected Gradient Descent (SR-MPGD), to further enhance their scanning robustness through iterative latent space optimization. With extensive experiments, the results demonstrate that our approach not only outperforms other compared methods in Scanning Success Rate (SSR) with better or comparable CLIP aesthetic score (CLIP-aes.) but also significantly improves the SSR of the ControlNet-only approach from 60% to 99%. The subjective evaluation indicates that our approach achieves promising visual attractiveness to users as well. Finally, even with different scanning angles and the most rigorous error tolerance settings, our approach robustly achieves over 95% SSR, demonstrating its capability for real-world applications.
- Abstract(参考訳): 画像生成のための拡散モデルの成功により、これらの技術は美的クイックレスポンス(QR)コード生成にも革命をもたらした。
美化されたコードの視覚的魅力は大幅に改善されているが、そのスキャン能力は通常犠牲にされ、現実のシナリオにおける実用性を妨げている。
この問題に対処するために,DiffusionベースのQRコード生成器(DiffQRCoder)を提案する。
提案手法では,Diffusion Models の新たな拡散誘導である Scanning-Robust Perceptual Guidance (SRPG) を導入し,Diffusion Models が生成した審美コードに対して,デノナイジング過程における魅力を維持しつつ,基礎的なQRコードに従うことを保証した。
さらに,Scanning Robust Manifold Projected Gradient Descent (SR-MPGD) も提案する。
より広範な実験により,本手法は,SSR(Scanning Success Rate)とCLIP-aes(CLIP-aes.)の他の比較手法よりも優れるだけでなく,コントロールネットのみのアプローチのSSRを60%から99%に向上させることが示された。
主観的評価は,提案手法がユーザにとって有望な視覚的魅力を実現することを示唆している。
最後に、異なる走査角と最も厳密なエラートレランス設定であっても、95%以上のSSRを確実に達成し、実世界のアプリケーションにその能力を示す。
関連論文リスト
- PassionSR: Post-Training Quantization with Adaptive Scale in One-Step Diffusion based Image Super-Resolution [87.89013794655207]
拡散に基づく画像超解像(SR)モデルでは、複数のデノナイジングステップのコストで優れた性能を示す。
本稿では,一段階拡散(OSD)画像SR,PassionSRにおける適応スケールの学習後量子化手法を提案する。
我々のPassionSRは、画像SRの最近の先進的な低ビット量子化法に対して大きな利点がある。
論文 参考訳(メタデータ) (2024-11-26T04:49:42Z) - Adversarial Diffusion Compression for Real-World Image Super-Resolution [16.496532580598007]
現実世界の超解像は、複雑なプロセスによって劣化した低解像度の入力から高解像度の画像を再構成することを目的としている。
OSEDiffやS3Diffのような一段階拡散ネットワークはこの問題を緩和するが、それでも高い計算コストがかかる。
本稿では,一段階拡散ネットワークOSEDiffを流線形拡散GANモデルに蒸留することにより,新しいリアルISR法AdcSRを提案する。
論文 参考訳(メタデータ) (2024-11-20T15:13:36Z) - Diffusion-based Aesthetic QR Code Generation via Scanning-Robust Perceptual Guidance [9.905296922309157]
日々のアプリケーションで広く使われているQRコードは、従来の白黒デザインのために視覚的な魅力を欠いている。
本稿では,事前学習した制御ネットを利用して,拡散モデルに基づく新しい審美的QRコード生成パイプラインを提案する。
定量的、質的、主観的な実験により、提案手法は様々な審美的なQRコードを詳細に生成できることを示した。
論文 参考訳(メタデータ) (2024-03-23T16:08:48Z) - Text2QR: Harmonizing Aesthetic Customization and Scanning Robustness for
Text-Guided QR Code Generation [38.281805719692194]
デジタル時代には、QRコードは仮想空間と物理領域を繋ぐリンチピンとして機能する。
一般的な方法は、カスタマイズとスキャナビリティのバランスをとるという、本質的な課題に対処します。
本稿では,安定拡散モデルを利用した先駆的アプローチであるText2QRを紹介する。
論文 参考訳(メタデータ) (2024-03-11T06:03:31Z) - Iterative Token Evaluation and Refinement for Real-World
Super-Resolution [77.74289677520508]
実世界の画像超解像(RWSR)は、低品質(LQ)画像が複雑で未同定の劣化を起こすため、長年にわたる問題である。
本稿では,RWSRのための反復的トークン評価・リファインメントフレームワークを提案する。
ITERはGAN(Generative Adversarial Networks)よりも訓練が容易であり,連続拡散モデルよりも効率的であることを示す。
論文 参考訳(メタデータ) (2023-12-09T17:07:32Z) - RBSR: Efficient and Flexible Recurrent Network for Burst
Super-Resolution [57.98314517861539]
バースト超解像(BurstSR)は、高解像度(HR)画像を低解像度(LR)画像と雑音画像から再構成することを目的としている。
本稿では,効率よくフレキシブルなリカレントネットワークでフレーム単位のキューを融合させることを提案する。
論文 参考訳(メタデータ) (2023-06-30T12:14:13Z) - Low-Light Image Enhancement with Wavelet-based Diffusion Models [50.632343822790006]
拡散モデルは画像復元作業において有望な結果を得たが、時間を要する、過剰な計算資源消費、不安定な復元に悩まされている。
本稿では,DiffLLと呼ばれる高能率かつ高能率な拡散型低光画像強調手法を提案する。
論文 参考訳(メタデータ) (2023-06-01T03:08:28Z) - CCLF: A Contrastive-Curiosity-Driven Learning Framework for
Sample-Efficient Reinforcement Learning [56.20123080771364]
我々は、強化学習のためのモデルに依存しないコントラスト駆動学習フレームワーク(CCLF)を開発した。
CCLFは、サンプルの重要性を完全に活用し、自己管理的な学習効率を向上させる。
このアプローチをDeepMind Control Suite、Atari、MiniGridベンチマークで評価する。
論文 参考訳(メタデータ) (2022-05-02T14:42:05Z) - UltraSR: Spatial Encoding is a Missing Key for Implicit Image
Function-based Arbitrary-Scale Super-Resolution [74.82282301089994]
本研究では,暗黙的イメージ関数に基づく,シンプルで効果的な新しいネットワーク設計であるUltraSRを提案する。
空間符号化は,次の段階の高精度暗黙的画像機能に対する欠落鍵であることを示す。
UltraSRは、すべての超解像スケールでDIV2Kベンチマークに最新のパフォーマンスを設定します。
論文 参考訳(メタデータ) (2021-03-23T17:36:42Z) - An End-to-end Method for Producing Scanning-robust Stylized QR Codes [45.35370585928748]
そこで我々はArtCoderという新しいエンドツーエンド手法を提案し,QRコードをスタイリングする。
実験の結果,スタイリングQRコードは視覚効果とスキャニング・ロバスト性の両方において高品質であることがわかった。
論文 参考訳(メタデータ) (2020-11-16T09:38:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。