論文の概要: Stop Bugging Me! Evading Modern-Day Wiretapping Using Adversarial
Perturbations
- arxiv url: http://arxiv.org/abs/2010.12809v2
- Date: Thu, 2 Sep 2021 07:54:52 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-03 13:48:59.524225
- Title: Stop Bugging Me! Evading Modern-Day Wiretapping Using Adversarial
Perturbations
- Title(参考訳): 邪魔するな!
対向的摂動を用いた現代のワイアタッピングの展開
- Authors: Yael Mathov and Tal Ben Senior and Asaf Shabtai and Yuval Elovici
- Abstract要約: ボイスオーバーIP(VoIP)会話のための大量監視システムは、プライバシーに大きなリスクをもたらす。
本稿では、VoIP会話のプライバシー保護のための逆学習に基づくフレームワークを提案する。
- 参考スコア(独自算出の注目度): 47.32228513808444
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Mass surveillance systems for voice over IP (VoIP) conversations pose a great
risk to privacy. These automated systems use learning models to analyze
conversations, and calls that involve specific topics are routed to a human
agent for further examination. In this study, we present an
adversarial-learning-based framework for privacy protection for VoIP
conversations. We present a novel method that finds a universal adversarial
perturbation (UAP), which, when added to the audio stream, prevents an
eavesdropper from automatically detecting the conversation's topic. As shown in
our experiments, the UAP is agnostic to the speaker or audio length, and its
volume can be changed in real time, as needed. Our real-world solution uses a
Teensy microcontroller that acts as an external microphone and adds the UAP to
the audio in real time. We examine different speakers, VoIP applications
(Skype, Zoom, Slack, and Google Meet), and audio lengths. Our results in the
real world suggest that our approach is a feasible solution for privacy
protection.
- Abstract(参考訳): ボイスオーバーIP(VoIP)会話のための大量監視システムは、プライバシーに大きなリスクをもたらす。
これらの自動システムは、会話の分析に学習モデルを使用し、特定のトピックを含む呼び出しを人間のエージェントにルーティングして、さらなる検査を行う。
本研究では,VoIP会話のプライバシー保護のための逆学習に基づくフレームワークを提案する。
そこで本研究では,音声ストリームに付加すると,盗聴者が自動的に会話の話題を検出するのを防止し,uap(universal adversarial perturbation)を求める新しい手法を提案する。
実験で示されたように、UAPは話者または音声長に依存しないため、必要に応じてそのボリュームをリアルタイムで変更することができる。
私たちの現実のソリューションは、外部マイクとして機能し、UAPをリアルタイムでオーディオに追加するTeensyマイクロコントローラを使っています。
さまざまなスピーカー、VoIPアプリケーション(Skype、Zoom、Slack、Google Meet)、オーディオの長さを調べます。
現実の世界における私たちの結果は、私たちのアプローチがプライバシー保護のための実現可能なソリューションであることを示唆しています。
関連論文リスト
- Predictive Speech Recognition and End-of-Utterance Detection Towards Spoken Dialog Systems [55.99999020778169]
本稿では,次の単語を予測し,発話終了まで残される時間を推定する機能について検討する。
我々は,音響情報と言語情報の両方を組み込んだクロスアテンションに基づくアルゴリズムを開発した。
その結果,提案モデルでは,提案する単語を予測し,将来のEOUイベントを実際のEOUより300ミリ秒前まで推定する能力を示した。
論文 参考訳(メタデータ) (2024-09-30T06:29:58Z) - Anonymizing Speech: Evaluating and Designing Speaker Anonymization
Techniques [1.2691047660244337]
音声ユーザインタフェースの利用が増加し、音声データの収集と保存が急増した。
本論文は、音声の匿名化と匿名化の程度を評価するためのソリューションを提案する。
論文 参考訳(メタデータ) (2023-08-05T16:14:17Z) - CAVEN: An Embodied Conversational Agent for Efficient Audio-Visual
Navigation in Noisy Environments [41.21509045214965]
CAVENは、エージェントが音声目標にナビゲートするタスクを解決するためのヒューマン/オーラルと対話することのできるフレームワークである。
以上の結果から,我々の全会話的アプローチは,成功率のオーダー・オブ・マグニチュード改善にほぼ寄与していることがわかった。
論文 参考訳(メタデータ) (2023-06-06T22:32:49Z) - AudioGPT: Understanding and Generating Speech, Music, Sound, and Talking
Head [82.69233563811487]
大規模言語モデル(LLM)は、さまざまな領域やタスクにまたがって顕著な能力を示し、学習と認知の理解に挑戦しています。
本稿では,LLMを基本モデルで補完し,複雑な音声情報を処理するマルチモーダルAIシステムであるAudioGPTを提案する。
論文 参考訳(メタデータ) (2023-04-25T17:05:38Z) - Privacy against Real-Time Speech Emotion Detection via Acoustic
Adversarial Evasion of Machine Learning [7.387631194438338]
DARE-GPは、音声の書き起こし関連部分を保存しながら、ユーザの感情情報を隠蔽する付加的なノイズを生成するソリューションである。
DARE-GPは、既存の作品と異なり、a) 音声の書き起こしを保護しながら、(b) 未確認のブラックボックスのSER分類器に対して、(b) 音の聞こえない発話をリアルタイムに保護し、(c) 声の書き起こしを現実的に音響的に保護する。
論文 参考訳(メタデータ) (2022-11-17T00:25:05Z) - Real-time Caller Intent Detection In Human-Human Customer Support Spoken
Conversations [10.312382727352823]
ヒューマン・ヒューマン・カスタマーサポート音声対話におけるエージェント支援には、発信者の意図に基づくトリガーが必要である(通話の理由)
目的は、エージェントがそれを検出できた時、システムが呼び出し者の意図を検出することである(Intent Boundary)。
音声アシスタントの最近の研究は、単語単位の段階的なリアルタイム予測を使用して、コマンドの終了前に意図を検出する。
論文 参考訳(メタデータ) (2022-08-14T07:50:23Z) - End-to-end Spoken Conversational Question Answering: Task, Dataset and
Model [92.18621726802726]
音声による質問応答では、システムは関連する音声書き起こしの中に連続したテキストスパンからの質問に答えるように設計されている。
本稿では,複雑な対話フローをモデル化することを目的とした音声対話型質問応答タスク(SCQA)を提案する。
本研究の目的は,音声記録に基づく対話型質問に対処するシステムを構築することであり,情報収集システムによる様々なモダリティからより多くの手がかりを提供する可能性を探ることである。
論文 参考訳(メタデータ) (2022-04-29T17:56:59Z) - Configurable Privacy-Preserving Automatic Speech Recognition [5.730142956540673]
音声支援システムにおけるモジュラ自動音声認識がプライバシーを向上するかどうかを検討する。
プライバシの懸念と,システムの各ステージに様々な最先端技術を適用する効果を示す。
これはASRを組み込んだプライバシー保護アプリケーションに新たな機会をもたらすと我々は主張する。
論文 参考訳(メタデータ) (2021-04-01T21:03:49Z) - Speaker De-identification System using Autoencoders and Adversarial
Training [58.720142291102135]
本稿では,対人訓練とオートエンコーダに基づく話者識別システムを提案する。
実験結果から, 対向学習とオートエンコーダを組み合わせることで, 話者検証システムの誤り率が同等になることがわかった。
論文 参考訳(メタデータ) (2020-11-09T19:22:05Z) - Self-Supervised Learning of Audio-Visual Objects from Video [108.77341357556668]
本稿では,音源の局所化とグループ化,時間とともに情報収集を行うための光フローに着目したモデルを提案する。
本稿では,4つの下流音声指向タスクにおいて,モデルが学習する音声-視覚オブジェクトの埋め込みの有効性を実証する。
論文 参考訳(メタデータ) (2020-08-10T16:18:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。