論文の概要: Deep Neural Networks based Invisible Steganography for Audio-into-Image
Algorithm
- arxiv url: http://arxiv.org/abs/2102.09173v1
- Date: Thu, 18 Feb 2021 06:13:05 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-19 14:58:08.456134
- Title: Deep Neural Networks based Invisible Steganography for Audio-into-Image
Algorithm
- Title(参考訳): オーディオ・イント・イメージ・アルゴリズムのためのディープニューラルネットワークを用いた見えないステレオグラフィ
- Authors: Quang Pham Huu, Thoi Hoang Dinh, Ngoc N. Tran, Toan Pham Van and Thanh
Ta Minh
- Abstract要約: 画像と音声の整合性は良好に保たれ、隠れた音声の最大長は大幅に改善されている。
第1のネットワークは秘密の音声を画像に隠蔽し、第2のネットワークは画像を復号して元の音声を得る責務を負う。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: In the last few years, steganography has attracted increasing attention from
a large number of researchers since its applications are expanding further than
just the field of information security. The most traditional method is based on
digital signal processing, such as least significant bit encoding. Recently,
there have been some new approaches employing deep learning to address the
problem of steganography. However, most of the existing approaches are designed
for image-in-image steganography. In this paper, the use of deep learning
techniques to hide secret audio into the digital images is proposed. We employ
a joint deep neural network architecture consisting of two sub-models: the
first network hides the secret audio into an image, and the second one is
responsible for decoding the image to obtain the original audio. Extensive
experiments are conducted with a set of 24K images and the VIVOS Corpus audio
dataset. Through experimental results, it can be seen that our method is more
effective than traditional approaches. The integrity of both image and audio is
well preserved, while the maximum length of the hidden audio is significantly
improved.
- Abstract(参考訳): 過去数年間、ステガノグラフィーは、単に情報セキュリティの分野以上に応用が拡大しているため、多くの研究者から注目を集めている。
最も伝統的な方法は、最下位ビット符号化のようなデジタル信号処理に基づいている。
近年,ステガノグラフィ問題に対する深層学習を用いた新たなアプローチが提案されている。
しかし、既存のアプローチのほとんどはイメージ・イン・イメージ・ステガノグラフィー用に設計されている。
本論文では,秘密音声をデジタル画像に隠蔽する深層学習手法を提案する。
第1のネットワークは秘密の音声を画像に隠蔽し、第2のネットワークは画像を復号して元の音声を得る責務を負う。
大規模な実験は24K画像とVIVOS Corpusオーディオデータセットを用いて行われる。
実験結果から,本手法は従来の手法よりも有効であることがわかった。
画像と音声の整合性は良好に保たれ、隠れた音声の最大長は大幅に改善されている。
関連論文リスト
- Noise Adaption Network for Morse Code Image Classification [0.3031375888004876]
モース符号画像の伝送は、様々なノイズや歪みのために困難に直面している。
既存の手法は主に、単一種類のノイズに影響されたモールス符号画像の分類に重点を置いている。
モース符号画像分類のための新しい2段階手法であるノイズ適応ネットワーク(NANet)を提案する。
論文 参考訳(メタデータ) (2024-10-24T22:24:52Z) - THInImg: Cross-modal Steganography for Presenting Talking Heads in
Images [14.09277898001307]
クロスモーダル・ステガノグラフィー(Cross-modal Steganography)は、公的に利用可能なカバー信号に秘密の信号を隠蔽する手法である。
人間の顔の特徴を活用して、識別画像内に長大な音声データを隠蔽するTHInImgを提案する。
THInImgは、最大80秒間の高品質なトーキーヘッドビデオ(音声を含む)を160x160解像度のアイデンティティ画像に表示することができる。
論文 参考訳(メタデータ) (2023-11-28T19:11:01Z) - Align, Adapt and Inject: Sound-guided Unified Image Generation [50.34667929051005]
本稿では,音声誘導画像生成,編集,スタイリングのための統合フレームワーク「アライン,アダプティブ,インジェクション(AAI)」を提案する。
本手法は,既存のテキスト・ツー・イメージ(T2I)モデルを用いて,入力音を通常の単語のように音声トークンに適応させる。
提案するAAIは、他のテキストや音声誘導方式よりも優れています。
論文 参考訳(メタデータ) (2023-06-20T12:50:49Z) - Human-imperceptible, Machine-recognizable Images [76.01951148048603]
より良い開発AIシステムと、センシティブなトレーニングデータから距離を置くことの間の、ソフトウェアエンジニアに関する大きな対立が露呈している。
画像が暗号化され、人間に認識され、機械に認識される」という、効率的なプライバシー保護学習パラダイムを提案する。
提案手法は,機械が認識可能な情報を保存しながら,暗号化された画像が人間に認識されなくなることを保証できることを示す。
論文 参考訳(メタデータ) (2023-06-06T13:41:37Z) - Deep Audio Waveform Prior [19.826973437576395]
音源分離のための既存のSOTAアーキテクチャは、生波形を扱う場合でも、より深い事前情報を含むことを示す。
関連する深みのあるネットワークは、破損した信号に収束する前に、信号のよりクリーンなバージョンを生成する可能性が高い。
論文 参考訳(メタデータ) (2022-07-21T12:25:03Z) - Voice-assisted Image Labelling for Endoscopic Ultrasound Classification
using Neural Networks [48.732863591145964]
本稿では,臨床医が提示した生音声からのEUS画像にラベルを付けるマルチモーダル畳み込みニューラルネットワークアーキテクチャを提案する。
その結果,5つのラベルを持つデータセットにおいて,画像レベルでの予測精度は76%であった。
論文 参考訳(メタデータ) (2021-10-12T21:22:24Z) - Multi-Stage Residual Hiding for Image-into-Audio Steganography [40.669605041776954]
本稿では,音声キャリアに画像コンテンツを隠蔽するクロスモーダルステガノグラフィー手法を提案する。
提案するフレームワークはペイロード容量の制御をより柔軟にする。
実験によると、キャリアの変更は人間のリスナーには気づかない。
論文 参考訳(メタデータ) (2021-01-06T05:01:45Z) - Multi-Image Steganography Using Deep Neural Networks [9.722040907570072]
スタガノグラフィーは、通常の公開メッセージの中に秘密のメッセージを隠す科学です。
本研究では,ディープニューラルネットワークを用いて,同一解像度の単一のカバー画像内の複数の秘密画像の符号化と復号を行う。
論文 参考訳(メタデータ) (2021-01-02T01:51:38Z) - Free-Form Image Inpainting via Contrastive Attention Network [64.05544199212831]
画像の塗装作業では、複雑なパターンを形成する画像のどこにでも、どんな形でもマスクが現れる。
エンコーダはこの複雑な状況下でこのような強力な表現を捕捉することは困難である。
本稿では,ロバスト性と一般化性を改善するための自己教師型シームズ推論ネットワークを提案する。
論文 参考訳(メタデータ) (2020-10-29T14:46:05Z) - Dual Adversarial Network: Toward Real-world Noise Removal and Noise
Generation [52.75909685172843]
実世界の画像ノイズ除去は、コンピュータビジョンにおける長年の課題である。
本稿では,ノイズ除去およびノイズ発生タスクに対処する新しい統合フレームワークを提案する。
本手法はクリーンノイズ画像対の連成分布を学習する。
論文 参考訳(メタデータ) (2020-07-12T09:16:06Z) - Deep Learning on Image Denoising: An overview [92.07378559622889]
画像認知におけるディープテクニックの比較研究を行っている。
まず、付加的な白色雑音画像に対して、深部畳み込みニューラルネットワーク(CNN)を分類する。
次に、定量的および定性的な分析の観点から、パブリック・デノゲーション・データセットの最先端の手法を比較した。
論文 参考訳(メタデータ) (2019-12-31T05:03:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。