論文の概要: Multi-Stage Residual Hiding for Image-into-Audio Steganography
- arxiv url: http://arxiv.org/abs/2101.01872v1
- Date: Wed, 6 Jan 2021 05:01:45 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-11 07:33:20.604464
- Title: Multi-Stage Residual Hiding for Image-into-Audio Steganography
- Title(参考訳): Image-into-Audio Steganography のための多段階残像ホディング
- Authors: Wenxue Cui, Shaohui Liu, Feng Jiang, Yongliang Liu, Debin Zhao
- Abstract要約: 本稿では,音声キャリアに画像コンテンツを隠蔽するクロスモーダルステガノグラフィー手法を提案する。
提案するフレームワークはペイロード容量の制御をより柔軟にする。
実験によると、キャリアの変更は人間のリスナーには気づかない。
- 参考スコア(独自算出の注目度): 40.669605041776954
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: The widespread application of audio communication technologies has speeded up
audio data flowing across the Internet, which made it a popular carrier for
covert communication. In this paper, we present a cross-modal steganography
method for hiding image content into audio carriers while preserving the
perceptual fidelity of the cover audio. In our framework, two multi-stage
networks are designed: the first network encodes the decreasing multilevel
residual errors inside different audio subsequences with the corresponding
stage sub-networks, while the second network decodes the residual errors from
the modified carrier with the corresponding stage sub-networks to produce the
final revealed results. The multi-stage design of proposed framework not only
make the controlling of payload capacity more flexible, but also make hiding
easier because of the gradual sparse characteristic of residual errors.
Qualitative experiments suggest that modifications to the carrier are
unnoticeable by human listeners and that the decoded images are highly
intelligible.
- Abstract(参考訳): 音声通信技術の広範な応用により、インターネット上の音声データの流速が向上し、シークレット通信の一般的なキャリアとなった。
本稿では,カバーオーディオの知覚的忠実さを保ちながら,画像コンテンツをオーディオキャリアに隠蔽するクロスモーダルステガノグラフィー手法を提案する。
第1のネットワークは、異なるオーディオサブシーケンス内のマルチレベル残差エラーを対応するステージサブネットワークで符号化し、第2のネットワークは、修正されたキャリアからの残差エラーを対応するステージサブネットワークで復号し、最終的な結果を生成する。
提案するフレームワークのマルチステージ設計により,ペイロード容量の制御がより柔軟になるだけでなく,残差の緩やかな特性から隠蔽も容易になる。
定性的な実験により、キャリアの変更は人間のリスナーには知られず、復号された画像は極めて知性が高いことが示唆された。
関連論文リスト
- Noise Adaption Network for Morse Code Image Classification [0.3031375888004876]
モース符号画像の伝送は、様々なノイズや歪みのために困難に直面している。
既存の手法は主に、単一種類のノイズに影響されたモールス符号画像の分類に重点を置いている。
モース符号画像分類のための新しい2段階手法であるノイズ適応ネットワーク(NANet)を提案する。
論文 参考訳(メタデータ) (2024-10-24T22:24:52Z) - TMFNet: Two-Stream Multi-Channels Fusion Networks for Color Image Operation Chain Detection [9.346492393908322]
カラー画像操作連鎖検出のための新しい2ストリーム多チャンネル融合ネットワークを提案する。
提案手法はJPEG圧縮に対するロバスト性を維持しつつ,最先端の一般化能力を実現する。
論文 参考訳(メタデータ) (2024-09-12T02:04:26Z) - High-Fidelity Speech Synthesis with Minimal Supervision: All Using
Diffusion Models [56.00939852727501]
最小教師付き音声合成は、2種類の離散音声表現を組み合わせることでTSを分離する。
非自己回帰フレームワークは、制御可能性を高め、持続拡散モデルは、多様化された韻律表現を可能にする。
論文 参考訳(メタデータ) (2023-09-27T09:27:03Z) - Deep Semantic Statistics Matching (D2SM) Denoising Network [70.01091467628068]
本稿では,Deep Semantic Statistics Matching (D2SM) Denoising Networkを紹介する。
事前訓練された分類ネットワークの意味的特徴を利用して、意味的特徴空間における明瞭な画像の確率的分布と暗黙的に一致させる。
識別画像のセマンティックな分布を学習することで,ネットワークの認知能力を大幅に向上させることを実証的に見出した。
論文 参考訳(メタデータ) (2022-07-19T14:35:42Z) - Timbre Transfer with Variational Auto Encoding and Cycle-Consistent
Adversarial Networks [0.6445605125467573]
本研究は,音源音の音色を目標音の音色に変換し,音質の低下を最小限に抑えた深層学習の音色伝達への適用について検討する。
この手法は、変分オートエンコーダとジェネレーティブ・アドバイサル・ネットワークを組み合わせて、音源の有意義な表現を構築し、ターゲット音声の現実的な世代を生成する。
論文 参考訳(メタデータ) (2021-09-05T15:06:53Z) - WaveFill: A Wavelet-based Generation Network for Image Inpainting [57.012173791320855]
WaveFillはウェーブレットベースの塗装ネットワークで、画像を複数の周波数帯域に分解する。
WaveFillは、空間情報を自然に保存する離散ウェーブレット変換(DWT)を用いて画像を分解する。
低周波帯にL1再構成損失を、高周波帯に敵対損失を施し、それによって周波数間紛争を効果的に軽減する。
論文 参考訳(メタデータ) (2021-07-23T04:44:40Z) - Deep Neural Networks based Invisible Steganography for Audio-into-Image
Algorithm [0.0]
画像と音声の整合性は良好に保たれ、隠れた音声の最大長は大幅に改善されている。
第1のネットワークは秘密の音声を画像に隠蔽し、第2のネットワークは画像を復号して元の音声を得る責務を負う。
論文 参考訳(メタデータ) (2021-02-18T06:13:05Z) - D-Unet: A Dual-encoder U-Net for Image Splicing Forgery Detection and
Localization [108.8592577019391]
画像スプライシング偽造検出は、画像指紋によって改ざんされた領域と非改ざんされた領域を区別するグローバルバイナリ分類タスクである。
画像スプライシングフォージェリ検出のためのデュアルエンコーダU-Net(D-Unet)という,固定されていないエンコーダと固定エンコーダを用いた新しいネットワークを提案する。
D-Unetと最先端技術の比較実験において、D-Unetは画像レベルおよび画素レベルの検出において他の手法よりも優れていた。
論文 参考訳(メタデータ) (2020-12-03T10:54:02Z) - Image Denoising for Strong Gaussian Noises With Specialized CNNs for
Different Frequency Components [4.010371060637209]
ニューラルネットワークをデノイズ化するための機械学習アプローチでは、ノイズの多い画像からクリーンなイメージを復元するために訓練される。
本稿では,複数の特化ネットワークのトレーニングに基づく新しい構造を提案する。
論文 参考訳(メタデータ) (2020-11-26T23:20:25Z) - Identity Enhanced Residual Image Denoising [61.75610647978973]
我々は、アイデンティティマッピングモジュールのチェーンと、画像の復号化のための残像アーキテクチャの残像からなる、完全な畳み込みネットワークモデルを学ぶ。
提案するネットワークは,従来の最先端・CNNアルゴリズムよりも極めて高い数値精度と画像品質を実現している。
論文 参考訳(メタデータ) (2020-04-26T04:52:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。