論文の概要: Representation Learning for Audio Privacy Preservation using Source
Separation and Robust Adversarial Learning
- arxiv url: http://arxiv.org/abs/2308.04960v1
- Date: Wed, 9 Aug 2023 13:50:00 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-10 13:23:10.563678
- Title: Representation Learning for Audio Privacy Preservation using Source
Separation and Robust Adversarial Learning
- Title(参考訳): 音源分離とロバスト対応学習を用いた音声プライバシー保護のための表現学習
- Authors: Diep Luong, Minh Tran, Shayan Gharib, Konstantinos Drossos, Tuomas
Virtanen
- Abstract要約: 本稿では,プライバシ保護における2つの一般的なアプローチ – ソース分離と逆表現学習 – の統合を提案する。
提案システムは,音声録音と非音声録音の区別を防止するために,音声録音の潜在表現を学習する。
- 参考スコア(独自算出の注目度): 16.1694012177079
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Privacy preservation has long been a concern in smart acoustic monitoring
systems, where speech can be passively recorded along with a target signal in
the system's operating environment. In this study, we propose the integration
of two commonly used approaches in privacy preservation: source separation and
adversarial representation learning. The proposed system learns the latent
representation of audio recordings such that it prevents differentiating
between speech and non-speech recordings. Initially, the source separation
network filters out some of the privacy-sensitive data, and during the
adversarial learning process, the system will learn privacy-preserving
representation on the filtered signal. We demonstrate the effectiveness of our
proposed method by comparing our method against systems without source
separation, without adversarial learning, and without both. Overall, our
results suggest that the proposed system can significantly improve speech
privacy preservation compared to that of using source separation or adversarial
learning solely while maintaining good performance in the acoustic monitoring
task.
- Abstract(参考訳): プライバシー保護は、スマート音響監視システムにおいて長年懸念されてきた問題であり、そこでは、システムの動作環境におけるターゲット信号とともに、音声を受動的に記録することができる。
本研究では,プライバシ保護においてよく用いられる2つのアプローチ,すなわちソース分離と逆表現学習の統合を提案する。
提案システムは,音声と非音声の区別を防止するために,音声記録の潜在表現を学習する。
当初、ソース分離ネットワークはプライバシーに敏感なデータをフィルタリングし、敵対的な学習プロセスの間、システムはフィルタリングされた信号のプライバシー保護表現を学習する。
提案手法の有効性を,情報源分離のないシステムと,敵対学習のないシステムと,その両方とを比較して示す。
総じて,提案手法は音源分離や逆学習のみを用い,音響監視タスクの性能を維持しつつ,音声のプライバシー保護を著しく向上できることが示唆された。
関連論文リスト
- Adversarial Representation Learning for Robust Privacy Preservation in
Audio [11.409577482625053]
音響イベント検出システムは、ユーザーまたはその周辺に関する機密情報を不注意に明らかにすることができる。
本稿では,音声記録の表現を学習するための新しい逆学習法を提案する。
提案手法は,プライバシ対策を伴わないベースライン手法と,事前の逆行訓練法とを併用して評価する。
論文 参考訳(メタデータ) (2023-04-29T08:39:55Z) - Language-Guided Audio-Visual Source Separation via Trimodal Consistency [64.0580750128049]
この課題の鍵となる課題は、発音対象の言語的記述と、その視覚的特徴と、音声波形の対応する成分とを関連付けることである。
2つの新たな損失関数を通して擬似目標管理を行うために、既成の視覚言語基盤モデルを適用する。
3つの音声・視覚的分離データセットに対する自己教師型アプローチの有効性を実証する。
論文 参考訳(メタデータ) (2023-03-28T22:45:40Z) - Speech Privacy Leakage from Shared Gradients in Distributed Learning [7.8470002970302195]
分散学習環境における共有勾配から個人音声/話者情報を復元する方法を探索する。
本研究では,分散学習フレームワークを用いて,音声内容や話者識別など,さまざまなレベルの側チャネル情報を推定できることを実証する。
論文 参考訳(メタデータ) (2023-02-21T04:48:29Z) - SPADE: Self-supervised Pretraining for Acoustic DisEntanglement [2.294014185517203]
室内音響を音声から切り離す自己教師型手法を提案する。
提案手法は,ラベル付きトレーニングデータが少ない場合に,ベースライン上での性能を著しく向上することを示す。
論文 参考訳(メタデータ) (2023-02-03T01:36:38Z) - An Ensemble Teacher-Student Learning Approach with Poisson Sub-sampling
to Differential Privacy Preserving Speech Recognition [51.20130423303659]
本稿では,Poissonサブサンプルを用いたアンサンブル学習フレームワークを提案する。
DP下での強化を通じて、トレーニングデータから派生した学生モデルは、プライバシ保護なしでトレーニングされたモデルからほとんどモデル劣化を受けない。
提案手法は,<i>Poisson sub-sampling</i>によるプライバシ予算の増幅を行い,同じレベルのプライバシ予算を達成するためにノイズの少ないターゲット予測モデルをトレーニングする。
論文 参考訳(メタデータ) (2022-10-12T16:34:08Z) - Audio-visual multi-channel speech separation, dereverberation and
recognition [70.34433820322323]
本稿では,音声-視覚的多チャンネル音声分離,デバーベレーション,認識手法を提案する。
音声を用いた場合の視覚的モダリティの利点は、2つのニューラルデバーベレーションアプローチでのみ示される。
LRS2データセットを用いて行った実験から,提案手法がベースラインよりも優れていたことが示唆された。
論文 参考訳(メタデータ) (2022-04-05T04:16:03Z) - Configurable Privacy-Preserving Automatic Speech Recognition [5.730142956540673]
音声支援システムにおけるモジュラ自動音声認識がプライバシーを向上するかどうかを検討する。
プライバシの懸念と,システムの各ステージに様々な最先端技術を適用する効果を示す。
これはASRを組み込んだプライバシー保護アプリケーションに新たな機会をもたらすと我々は主張する。
論文 参考訳(メタデータ) (2021-04-01T21:03:49Z) - Robust Audio-Visual Instance Discrimination [79.74625434659443]
音声・映像表現を学習するための自己指導型学習法を提案する。
視聴覚インスタンスの識別の問題に対処し、転送学習パフォーマンスを向上させます。
論文 参考訳(メタデータ) (2021-03-29T19:52:29Z) - An Overview of Deep-Learning-Based Audio-Visual Speech Enhancement and
Separation [57.68765353264689]
音声強調と音声分離は関連する2つの課題である。
伝統的に、これらのタスクは信号処理と機械学習技術を使って取り組まれてきた。
ディープラーニングは強力なパフォーマンスを達成するために利用されています。
論文 参考訳(メタデータ) (2020-08-21T17:24:09Z) - Self-Supervised Learning of Audio-Visual Objects from Video [108.77341357556668]
本稿では,音源の局所化とグループ化,時間とともに情報収集を行うための光フローに着目したモデルを提案する。
本稿では,4つの下流音声指向タスクにおいて,モデルが学習する音声-視覚オブジェクトの埋め込みの有効性を実証する。
論文 参考訳(メタデータ) (2020-08-10T16:18:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。