論文の概要: Stable Messenger: Steganography for Message-Concealed Image Generation
- arxiv url: http://arxiv.org/abs/2312.01284v1
- Date: Sun, 3 Dec 2023 05:02:43 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-05 18:05:34.285572
- Title: Stable Messenger: Steganography for Message-Concealed Image Generation
- Title(参考訳): 安定したメッセンジャー: メッセージ駆動画像生成のためのステガノグラフィ
- Authors: Quang Nguyen, Truong Vu, Cuong Pham, Anh Tran, Khoi Nguyen
- Abstract要約: 我々は、より総合的な評価のために、デコードされたメッセージ全体を評価する新しいメトリクスである「メッセージ精度」を導入する。
メッセージの精度を高めるために調整された適応的普遍的損失であるLog-Sum-Exponential(LSE)損失を提案する。
我々はまた、事前訓練された安定拡散を利用した高度なステガノグラフィー画像生成のための新しい潜在認識符号化手法である Approach を導入している。
- 参考スコア(独自算出の注目度): 6.770118539610039
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In the ever-expanding digital landscape, safeguarding sensitive information
remains paramount. This paper delves deep into digital protection, specifically
focusing on steganography. While prior research predominantly fixated on
individual bit decoding, we address this limitation by introducing ``message
accuracy'', a novel metric evaluating the entirety of decoded messages for a
more holistic evaluation. In addition, we propose an adaptive universal loss
tailored to enhance message accuracy, named Log-Sum-Exponential (LSE) loss,
thereby significantly improving the message accuracy of recent approaches.
Furthermore, we also introduce a new latent-aware encoding technique in our
framework named \Approach, harnessing pretrained Stable Diffusion for advanced
steganographic image generation, giving rise to a better trade-off between
image quality and message recovery. Throughout experimental results, we have
demonstrated the superior performance of the new LSE loss and latent-aware
encoding technique. This comprehensive approach marks a significant step in
evolving evaluation metrics, refining loss functions, and innovating image
concealment techniques, aiming for more robust and dependable information
protection.
- Abstract(参考訳): デジタルの世界では、機密情報の保護が最重要である。
本稿では,デジタル・プロテクション,特にステガノグラフィーに焦点をあてた。
先行研究は主に個々のビットデコードに固定していたが、より包括的評価のためにデコードされたメッセージの全体を評価する新しい指標である ``message accuracy''' を導入することでこの制限に対処した。
さらに,ログサム指数損失(LSE)と呼ばれるメッセージ精度を向上させるために調整された適応的ユニバーサル損失を提案し,近年のメッセージ精度を大幅に向上させた。
さらに,高度なステガノグラフィ画像生成のために事前訓練された安定拡散を利用して,画像品質とメッセージ復元のトレードオフをより良くする,新しい潜在認識エンコーディング手法である \approach を導入する。
実験結果を通じて,新しいLSE損失と潜在認識符号化技術の優れた性能を実証した。
この包括的なアプローチは、評価指標の進化、損失関数の精製、画像隠蔽技術の革新において重要なステップであり、より堅牢で信頼性の高い情報保護を目指している。
関連論文リスト
- $ε$-VAE: Denoising as Visual Decoding [61.29255979767292]
生成モデリングにおいて、トークン化は複雑なデータをコンパクトで構造化された表現に単純化し、より効率的で学習可能な空間を作り出す。
現在の視覚的トークン化手法は従来のオートエンコーダフレームワークに依存しており、エンコーダはデータを潜在表現に圧縮し、デコーダは元の入力を再構築する。
具体的には,デコーダを拡散処理に置き換え,ノイズを反復的に除去して元のイメージを復元し,エンコーダが提供する潜伏者によって誘導される。
再建(rFID)と生成品質(ジェネレーション品質)の両面からアプローチを評価する。
論文 参考訳(メタデータ) (2024-10-05T08:27:53Z) - DaLPSR: Leverage Degradation-Aligned Language Prompt for Real-World Image Super-Resolution [19.33582308829547]
本稿では, 精度, 精細度, 高忠実度画像復元のために, 劣化対応言語プロンプトを活用することを提案する。
提案手法は,新しい最先端の知覚品質レベルを実現する。
論文 参考訳(メタデータ) (2024-06-24T09:30:36Z) - Improving Text Generation on Images with Synthetic Captions [2.1175632266708733]
SDXLやSD 1.5のような潜伏拡散モデルは、現実的な画像を生成する上で重要な能力を示している。
本稿では,SDXLを大規模データセット上でのトレーニングに要しない,低コストなアプローチを提案する。
提案手法は,異なるシナリオにおけるテキスト生成の精度向上に有効であることを示す。
論文 参考訳(メタデータ) (2024-06-01T17:27:34Z) - Neural Image Compression with Text-guided Encoding for both Pixel-level and Perceptual Fidelity [18.469136842357095]
我々は,高知覚率と画素ワイド忠実度を両立させる新しいテキスト誘導画像圧縮アルゴリズムを開発した。
これにより、テキスト誘導生成モデルに基づく復号化を避けることができる。
提案手法は,人や機械が生成するキャプションを用いて,高いピクセルレベルと知覚品質を実現する。
論文 参考訳(メタデータ) (2024-03-05T13:15:01Z) - Semantic Ensemble Loss and Latent Refinement for High-Fidelity Neural Image Compression [58.618625678054826]
本研究は、最適な視覚的忠実度のために設計された強化されたニューラル圧縮手法を提案する。
我々は,洗練されたセマンティック・アンサンブル・ロス,シャルボニエ・ロス,知覚的損失,スタイル・ロス,非バイナリ・ディバイザ・ロスを組み込んだモデルを構築した。
実験により,本手法は神経画像圧縮の統計的忠実度を著しく向上させることが示された。
論文 参考訳(メタデータ) (2024-01-25T08:11:27Z) - SPIRE: Semantic Prompt-Driven Image Restoration [66.26165625929747]
セマンティック・復元型画像復元フレームワークであるSPIREを開発した。
本手法は,復元強度の量的仕様を言語ベースで記述することで,より詳細な指導を支援する最初のフレームワークである。
本実験は, SPIREの修復性能が, 現状と比較して優れていることを示すものである。
論文 参考訳(メタデータ) (2023-12-18T17:02:30Z) - Towards Robust Image-in-Audio Deep Steganography [14.1081872409308]
本稿では,その堅牢性向上に焦点をあて,既存の音響深部ステガノグラフィー手法を拡張し,拡張する。
提案した機能拡張には、損失関数の修正、短い時間フーリエ変換(STFT)の利用、誤り訂正のための符号化プロセスにおける冗長性の導入、ピクセルサブ畳み込み操作における追加情報のバッファリングが含まれる。
論文 参考訳(メタデータ) (2023-03-09T03:16:04Z) - Dynamic Low-Resolution Distillation for Cost-Efficient End-to-End Text
Spotting [49.33891486324731]
コスト効率の高い動的低分解能蒸留(DLD)テキストスポッティングフレームワークを提案する。
それは、小さなが認識可能な解像度で画像を推測し、精度と効率のバランスを改善することを目的としている。
提案手法はエンド・ツー・エンドを最適化し,既存のテキストスポッティング・フレームワークに実装することで,実践性を向上させる。
論文 参考訳(メタデータ) (2022-07-14T06:49:59Z) - Towards Robust Blind Face Restoration with Codebook Lookup Transformer [94.48731935629066]
ブラインドフェイスの修復は、しばしば補助的なガイダンスを必要とする非常に不適切な問題である。
学習した個別のコードブックを小さなプロキシ空間に配置し,ブラインドフェイスの復元をコード予測タスクとすることを示す。
我々は、低品質顔のグローバルな構成とコンテキストをモデル化するトランスフォーマーベースの予測ネットワーク、CodeFormerを提案する。
論文 参考訳(メタデータ) (2022-06-22T17:58:01Z) - Implicit Neural Representations for Image Compression [103.78615661013623]
Inlicit Neural Representations (INRs) は、様々なデータ型の新規かつ効果的な表現として注目されている。
量子化、量子化を考慮した再学習、エントロピー符号化を含むINRに基づく最初の包括的圧縮パイプラインを提案する。
我々は、INRによるソース圧縮に対する我々のアプローチが、同様の以前の作業よりも大幅に優れていることに気付きました。
論文 参考訳(メタデータ) (2021-12-08T13:02:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。