Fugu-MT 論文翻訳(概要): Diffusion-based Aesthetic QR Code Generation via Scanning-Robust Perceptual Guidance

論文の概要: Diffusion-based Aesthetic QR Code Generation via Scanning-Robust Perceptual Guidance

arxiv url: http://arxiv.org/abs/2403.15878v1
Date: Sat, 23 Mar 2024 16:08:48 GMT
ステータス: 翻訳完了
システム内更新日: 2024-03-26 20:42:03.561877
Title: Diffusion-based Aesthetic QR Code Generation via Scanning-Robust Perceptual Guidance
Title（参考訳）: 走査ロバスト知覚誘導による拡散型審美QRコード生成
Authors: Jia-Wei Liao, Winston Wang, Tzu-Sian Wang, Li-Xuan Peng, Cheng-Fu Chou, Jun-Cheng Chen,
Abstract要約: 日々のアプリケーションで広く使われているQRコードは、従来の白黒デザインのために視覚的な魅力を欠いている。本稿では,事前学習した制御ネットを利用して,拡散モデルに基づく新しい審美的QRコード生成パイプラインを提案する。定量的、質的、主観的な実験により、提案手法は様々な審美的なQRコードを詳細に生成できることを示した。
参考スコア（独自算出の注目度）: 9.905296922309157
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: QR codes, prevalent in daily applications, lack visual appeal due to their conventional black-and-white design. Integrating aesthetics while maintaining scannability poses a challenge. In this paper, we introduce a novel diffusion-model-based aesthetic QR code generation pipeline, utilizing pre-trained ControlNet and guided iterative refinement via a novel classifier guidance (SRG) based on the proposed Scanning-Robust Loss (SRL) tailored with QR code mechanisms, which ensures both aesthetics and scannability. To further improve the scannability while preserving aesthetics, we propose a two-stage pipeline with Scanning-Robust Perceptual Guidance (SRPG). Moreover, we can further enhance the scannability of the generated QR code by post-processing it through the proposed Scanning-Robust Projected Gradient Descent (SRPGD) post-processing technique based on SRL with proven convergence. With extensive quantitative, qualitative, and subjective experiments, the results demonstrate that the proposed approach can generate diverse aesthetic QR codes with flexibility in detail. In addition, our pipelines outperforming existing models in terms of Scanning Success Rate (SSR) 86.67% (+40%) with comparable aesthetic scores. The pipeline combined with SRPGD further achieves 96.67% (+50%). Our code will be available https://github.com/jwliao1209/DiffQRCode.
Abstract（参考訳）: 日々のアプリケーションで広く使われているQRコードは、従来の白黒デザインのために視覚的な魅力を欠いている。審美性を維持しながら審美性を統合することは、課題である。本稿では,QRコード機構を組み込んだScanning-Robust Loss (SRL) に基づく新しい分類器ガイダンス (SRG) を用いて,事前学習した制御ネットを活用する,新しい拡散モデルに基づくQRコード生成パイプラインを提案する。審美性を維持しながらスキャン性をさらに向上するため,SRPG(Scanning-Robust Perceptual Guidance)を用いた2段階パイプラインを提案する。さらに,SRLに基づくSRPGD(Scanning-Robust Projected Gradient Descent)後処理技術により,生成QRコードのスキャン性をさらに向上させることができる。定量的、質的、主観的な実験により、提案手法は様々な審美的なQRコードを詳細に生成できることを示した。さらに、SSR(Scanning Success Rate)の86.67%(+40%)と同等の美的スコアで既存のモデルを上回っています。 SRPGDと組み合わせたパイプラインはさらに96.67%(+50%)を達成した。私たちのコードはhttps://github.com/jwliao1209/DiffQRCode.comで利用可能です。

関連論文リスト

QRïS: A Preemptive Novel Method for Quishing Detection Through Structural Features of QR [3.1186758722870582]
サイバー攻撃者は偽造情報と誤認情報をQRコードに埋め込んで、様々なフィッシング攻撃を起動する。 QRコードの包括的構造解析によりQRコードを分類する先駆的手法であるQR"iSを提案する。提案手法は明らかに透明であり,再現性,拡張性,理解が容易である。
論文参考訳（メタデータ） (2025-10-20T05:30:47Z)
Scalable Training for Vector-Quantized Networks with 100% Codebook Utilization [60.294965457786844]
ベクトル量子化(VQ)は、画像生成のための離散トークン化器において重要な要素である。 VQBridgeは、地図関数法に基づく堅牢でスケーラブルで効率的なプロジェクタである。 FVQは262kのコードブックでも100%のコードブック利用が可能である。
論文参考訳（メタデータ） (2025-09-12T11:08:21Z)
Robust Latent Matters: Boosting Image Generation with Sampling Error Synthesis [57.7367843129838]
最近の画像生成方式は、凍結した画像トークン化器に依存した事前構築された潜在空間における画像分布を典型的に捉えている。本稿では,遅延空間構築を容易にするための新しいプラグ・アンド・プレイ・トークンライザ・トレーニング手法を提案する。
論文参考訳（メタデータ） (2025-03-11T12:09:11Z)
Scalable Image Tokenization with Index Backpropagation Quantization [74.15447383432262]
インデックスバックプロパゲーション量子化(IBQ)は、すべてのコードブック埋め込みとビジュアルエンコーダの共同最適化のための新しいVQ手法である。 IBQは、ビジュアルトークンのスケーラブルなトレーニングを可能にし、初めて、高次元(256ドル)で高利用率の大規模コードブックを実現する。
論文参考訳（メタデータ） (2024-12-03T18:59:10Z)
Face2QR: A Unified Framework for Aesthetic, Face-Preserving, and Scannable QR Code Generation [33.57668243458616]
Face2QRは、美学、顔のアイデンティティ、スキャナビリティをブレンドするパーソナライズされたQRコードを生成するための、新しいパイプラインである。第一に、IDを精製したQR統合は、背景スタイリングと顔 IDをシームレスに連動させる。第二に、IDを意識したQR ReShuffle(IDRS)は、顔IDとQRパターンの衝突を効果的に修正する。第三に、ID保存Scannability Enhancement(IDSE)は遅延コードの最適化を通じてスキャニングを大幅に強化する。
論文参考訳（メタデータ） (2024-11-28T16:35:16Z)
DiffQRCoder: Diffusion-based Aesthetic QR Code Generation with Scanning Robustness Guided Iterative Refinement [9.43230708612551]
本稿では,DiffusionベースのQRコード生成器(DiffQRCoder)を提案する。提案手法では,拡散モデルのための新しい拡散誘導であるSRPG(Scanning-Robust Perceptual Guidance)を導入する。我々のアプローチは95%以上のSSRを強力に達成し、実世界のアプリケーションにその能力を示す。
論文参考訳（メタデータ） (2024-09-10T09:22:35Z)
Text2QR: Harmonizing Aesthetic Customization and Scanning Robustness for Text-Guided QR Code Generation [38.281805719692194]
デジタル時代には、QRコードは仮想空間と物理領域を繋ぐリンチピンとして機能する。一般的な方法は、カスタマイズとスキャナビリティのバランスをとるという、本質的な課題に対処します。本稿では,安定拡散モデルを利用した先駆的アプローチであるText2QRを紹介する。
論文参考訳（メタデータ） (2024-03-11T06:03:31Z)
NeRF-VPT: Learning Novel View Representations with Neural Radiance Fields via View Prompt Tuning [63.39461847093663]
本研究では,これらの課題に対処するための新しいビュー合成手法であるNeRF-VPTを提案する。提案するNeRF-VPTは、先行レンダリング結果から得られたRGB情報を、その後のレンダリングステージのインストラクティブな視覚的プロンプトとして機能するカスケーディングビュープロンプトチューニングパラダイムを用いている。 NeRF-VPTは、追加のガイダンスや複雑なテクニックに頼ることなく、トレーニングステージ毎に前のステージレンダリングからRGBデータをサンプリングするだけである。
論文参考訳（メタデータ） (2024-03-02T22:08:10Z)
Iterative Token Evaluation and Refinement for Real-World Super-Resolution [77.74289677520508]
実世界の画像超解像(RWSR)は、低品質(LQ)画像が複雑で未同定の劣化を起こすため、長年にわたる問題である。本稿では,RWSRのための反復的トークン評価・リファインメントフレームワークを提案する。 ITERはGAN(Generative Adversarial Networks)よりも訓練が容易であり,連続拡散モデルよりも効率的であることを示す。
論文参考訳（メタデータ） (2023-12-09T17:07:32Z)
RBSR: Efficient and Flexible Recurrent Network for Burst Super-Resolution [57.98314517861539]
バースト超解像(BurstSR)は、高解像度(HR)画像を低解像度(LR)画像と雑音画像から再構成することを目的としている。本稿では,効率よくフレキシブルなリカレントネットワークでフレーム単位のキューを融合させることを提案する。
論文参考訳（メタデータ） (2023-06-30T12:14:13Z)
Rolling Shutter Inversion: Bring Rolling Shutter Images to High Framerate Global Shutter Video [111.08121952640766]
本稿では,RS時相超解問題に対する新しいディープラーニングに基づく解法を提案する。 RSイメージングプロセスの多視点幾何関係を利用して,高フレームレートGS生成を実現する。提案手法は,高精細で高品質なGS画像系列を生成でき,最先端の手法よりも優れている。
論文参考訳（メタデータ） (2022-10-06T16:47:12Z)
Visual Radial Basis Q-Network [0.2148535041822524]
トレーニング可能なパラメータの少ない原画像からスパース特徴を抽出する汎用手法を提案する。提案手法は、概念的に単純でありながら、トレーニング可能なパラメータが少ない場合もあれば、より優れたパフォーマンスを提供する。
論文参考訳（メタデータ） (2022-06-14T09:34:34Z)
UltraSR: Spatial Encoding is a Missing Key for Implicit Image Function-based Arbitrary-Scale Super-Resolution [74.82282301089994]
本研究では,暗黙的イメージ関数に基づく,シンプルで効果的な新しいネットワーク設計であるUltraSRを提案する。空間符号化は,次の段階の高精度暗黙的画像機能に対する欠落鍵であることを示す。 UltraSRは、すべての超解像スケールでDIV2Kベンチマークに最新のパフォーマンスを設定します。
論文参考訳（メタデータ） (2021-03-23T17:36:42Z)
An End-to-end Method for Producing Scanning-robust Stylized QR Codes [45.35370585928748]
そこで我々はArtCoderという新しいエンドツーエンド手法を提案し,QRコードをスタイリングする。実験の結果,スタイリングQRコードは視覚効果とスキャニング・ロバスト性の両方において高品質であることがわかった。
論文参考訳（メタデータ） (2020-11-16T09:38:27Z)
LinksIQ: Robust and Efficient Modulation Recognition with Imperfect Spectrum Scans [14.27482188246212]
LinksIQは、仮定を単純化して設計された実世界のスペクトルセンシングとModrecメソッドのギャップを埋める。我々の重要な洞察は、順序付きIQサンプルが、スキャンの欠陥があっても持続する変調にまたがる独特のパターンを形成することである。本研究は,小型トランスミッターフィンガープリントの実現可能性を示すものである。
論文参考訳（メタデータ） (2020-05-07T12:16:38Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。