論文の概要: Multi-Stage Residual Hiding for Image-into-Audio Steganography
- arxiv url: http://arxiv.org/abs/2101.01872v1
- Date: Wed, 6 Jan 2021 05:01:45 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-11 07:33:20.604464
- Title: Multi-Stage Residual Hiding for Image-into-Audio Steganography
- Title(参考訳): Image-into-Audio Steganography のための多段階残像ホディング
- Authors: Wenxue Cui, Shaohui Liu, Feng Jiang, Yongliang Liu, Debin Zhao
- Abstract要約: 本稿では,音声キャリアに画像コンテンツを隠蔽するクロスモーダルステガノグラフィー手法を提案する。
提案するフレームワークはペイロード容量の制御をより柔軟にする。
実験によると、キャリアの変更は人間のリスナーには気づかない。
- 参考スコア(独自算出の注目度): 40.669605041776954
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: The widespread application of audio communication technologies has speeded up
audio data flowing across the Internet, which made it a popular carrier for
covert communication. In this paper, we present a cross-modal steganography
method for hiding image content into audio carriers while preserving the
perceptual fidelity of the cover audio. In our framework, two multi-stage
networks are designed: the first network encodes the decreasing multilevel
residual errors inside different audio subsequences with the corresponding
stage sub-networks, while the second network decodes the residual errors from
the modified carrier with the corresponding stage sub-networks to produce the
final revealed results. The multi-stage design of proposed framework not only
make the controlling of payload capacity more flexible, but also make hiding
easier because of the gradual sparse characteristic of residual errors.
Qualitative experiments suggest that modifications to the carrier are
unnoticeable by human listeners and that the decoded images are highly
intelligible.
- Abstract(参考訳): 音声通信技術の広範な応用により、インターネット上の音声データの流速が向上し、シークレット通信の一般的なキャリアとなった。
本稿では,カバーオーディオの知覚的忠実さを保ちながら,画像コンテンツをオーディオキャリアに隠蔽するクロスモーダルステガノグラフィー手法を提案する。
第1のネットワークは、異なるオーディオサブシーケンス内のマルチレベル残差エラーを対応するステージサブネットワークで符号化し、第2のネットワークは、修正されたキャリアからの残差エラーを対応するステージサブネットワークで復号し、最終的な結果を生成する。
提案するフレームワークのマルチステージ設計により,ペイロード容量の制御がより柔軟になるだけでなく,残差の緩やかな特性から隠蔽も容易になる。
定性的な実験により、キャリアの変更は人間のリスナーには知られず、復号された画像は極めて知性が高いことが示唆された。
関連論文リスト
- High-Fidelity Speech Synthesis with Minimal Supervision: All Using
Diffusion Models [56.00939852727501]
最小教師付き音声合成は、2種類の離散音声表現を組み合わせることでTSを分離する。
非自己回帰フレームワークは、制御可能性を高め、持続拡散モデルは、多様化された韻律表現を可能にする。
論文 参考訳(メタデータ) (2023-09-27T09:27:03Z) - DiffBIR: Towards Blind Image Restoration with Generative Diffusion Prior [73.8274638090392]
本稿では,事前訓練したテキスト・画像拡散モデルを利用したブラインド画像復元問題に対するDiffBIRを提案する。
本稿では, インジェクティブ変調サブネットワーク -- LAControlNet を微調整用として導入し, 事前学習した安定拡散はその生成能力を維持することを目的としている。
実験では、ブラインド画像の超解像とブラインド顔復元の両タスクにおいて、最先端のアプローチよりも優れていることを示した。
論文 参考訳(メタデータ) (2023-08-29T07:11:52Z) - Deep Semantic Statistics Matching (D2SM) Denoising Network [70.01091467628068]
本稿では,Deep Semantic Statistics Matching (D2SM) Denoising Networkを紹介する。
事前訓練された分類ネットワークの意味的特徴を利用して、意味的特徴空間における明瞭な画像の確率的分布と暗黙的に一致させる。
識別画像のセマンティックな分布を学習することで,ネットワークの認知能力を大幅に向上させることを実証的に見出した。
論文 参考訳(メタデータ) (2022-07-19T14:35:42Z) - Timbre Transfer with Variational Auto Encoding and Cycle-Consistent
Adversarial Networks [0.6445605125467573]
本研究は,音源音の音色を目標音の音色に変換し,音質の低下を最小限に抑えた深層学習の音色伝達への適用について検討する。
この手法は、変分オートエンコーダとジェネレーティブ・アドバイサル・ネットワークを組み合わせて、音源の有意義な表現を構築し、ターゲット音声の現実的な世代を生成する。
論文 参考訳(メタデータ) (2021-09-05T15:06:53Z) - Attention-Based Multimodal Image Matching [16.335191345543063]
本稿では,Transformerエンコーダを用いたマルチモーダル画像パッチマッチングのためのアテンションベースアプローチを提案する。
このエンコーダは,タスク固有の外見不変のイメージキューを強調しつつ,マルチスケールな画像埋め込みを効率的に集約する。
これはTransformerエンコーダアーキテクチャをマルチモーダル画像パッチマッチングタスクに実装した最初の成功例である。
論文 参考訳(メタデータ) (2021-03-20T21:14:24Z) - Deep Neural Networks based Invisible Steganography for Audio-into-Image
Algorithm [0.0]
画像と音声の整合性は良好に保たれ、隠れた音声の最大長は大幅に改善されている。
第1のネットワークは秘密の音声を画像に隠蔽し、第2のネットワークは画像を復号して元の音声を得る責務を負う。
論文 参考訳(メタデータ) (2021-02-18T06:13:05Z) - D-Unet: A Dual-encoder U-Net for Image Splicing Forgery Detection and
Localization [108.8592577019391]
画像スプライシング偽造検出は、画像指紋によって改ざんされた領域と非改ざんされた領域を区別するグローバルバイナリ分類タスクである。
画像スプライシングフォージェリ検出のためのデュアルエンコーダU-Net(D-Unet)という,固定されていないエンコーダと固定エンコーダを用いた新しいネットワークを提案する。
D-Unetと最先端技術の比較実験において、D-Unetは画像レベルおよび画素レベルの検出において他の手法よりも優れていた。
論文 参考訳(メタデータ) (2020-12-03T10:54:02Z) - Image Denoising for Strong Gaussian Noises With Specialized CNNs for
Different Frequency Components [4.010371060637209]
ニューラルネットワークをデノイズ化するための機械学習アプローチでは、ノイズの多い画像からクリーンなイメージを復元するために訓練される。
本稿では,複数の特化ネットワークのトレーニングに基づく新しい構造を提案する。
論文 参考訳(メタデータ) (2020-11-26T23:20:25Z) - A Variational Auto-Encoder Approach for Image Transmission in Wireless
Channel [4.82810058837951]
本稿では,変分オートエンコーダの性能について検討し,その結果を標準オートエンコーダと比較する。
実験により,SSIMは受信機における再構成画像の品質を視覚的に向上することを示した。
論文 参考訳(メタデータ) (2020-10-08T13:35:38Z) - Identity Enhanced Residual Image Denoising [61.75610647978973]
我々は、アイデンティティマッピングモジュールのチェーンと、画像の復号化のための残像アーキテクチャの残像からなる、完全な畳み込みネットワークモデルを学ぶ。
提案するネットワークは,従来の最先端・CNNアルゴリズムよりも極めて高い数値精度と画像品質を実現している。
論文 参考訳(メタデータ) (2020-04-26T04:52:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。