論文の概要: An End-to-End Approach for Korean Wakeword Systems with Speaker Authentication
- arxiv url: http://arxiv.org/abs/2501.12194v1
- Date: Tue, 21 Jan 2025 15:02:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-22 14:23:48.183652
- Title: An End-to-End Approach for Korean Wakeword Systems with Speaker Authentication
- Title(参考訳): 話者認証を用いた韓国語ウェイクワードシステムのためのエンドツーエンドアプローチ
- Authors: Geonwoo Seo,
- Abstract要約: ウェイクワードの検出は、AIアシスタントがユーザの声を聞き、効果的に対話できるようにする上で重要な役割を果たす。
英語以外の言語では、事前訓練されたウェイクワードモデルが欠如している。
本稿では,非英語,特に韓国語のウェイクワードを訓練するエンドツーエンドアプローチを提案し,これを用いて音声認証モデルを構築する。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Wakeword detection plays a critical role in enabling AI assistants to listen to user voices and interact effectively. However, for languages other than English, there is a significant lack of pre-trained wakeword models. Additionally, systems that merely determine the presence of a wakeword can pose serious privacy concerns. In this paper, we propose an end-to-end approach that trains wakewords for Non-English languages, particulary Korean, and uses this to develop a Voice Authentication model to protect user privacy. Our implementation employs an open-source platform OpenWakeWord, which performs wakeword detection using an FCN (Fully-Connected Network) architecture. Once a wakeword is detected, our custom-developed code calculates cosine similarity for robust user authentication. Experimental results demonstrate the effectiveness of our approach, achieving a 16.79% and a 6.6% Equal Error Rate (EER) each in the Wakeword Detection and the Voice Authentication. These findings highlight the model's potential in providing secure and accurate wakeword detection and authentication for Korean users.
- Abstract(参考訳): ウェイクワードの検出は、AIアシスタントがユーザの声を聞き、効果的に対話できるようにする上で重要な役割を果たす。
しかし、英語以外の言語では、事前訓練されたウェイクワードモデルが欠如している。
さらに、ウェイクワードの存在だけを判断するシステムは、深刻なプライバシー上の懸念を引き起こす可能性がある。
本稿では,非英語,特に韓国語のウェイクワードを訓練するエンドツーエンドアプローチを提案し,これをユーザプライバシ保護のための音声認証モデルの開発に活用する。
本実装では,FCN(Fully-Connected Network)アーキテクチャを用いたウェイクワード検出を行うオープンソースプラットフォームであるOpenWakeWordを採用している。
ウェイクワードが検出されると、私たちのカスタム開発コードは、堅牢なユーザ認証のためのコサイン類似性を計算する。
その結果, Wakeword Detection と Voice Authentication では, 16.79%, 6.6% の誤り率 (EER) が得られた。
これらの知見は、韓国のユーザに対して、安全で正確なウェイクワードの検出と認証を提供するモデルの可能性を強調している。
関連論文リスト
- Open-vocabulary Keyword-spotting with Adaptive Instance Normalization [18.250276540068047]
本稿では,キーワード条件付き正規化パラメータを出力するためにテキストエンコーダを訓練するキーワードスポッティングの新しい手法であるAdaKWSを提案する。
近年のキーワードスポッティングやASRベースラインよりも大幅に改善されている。
論文 参考訳(メタデータ) (2023-09-13T13:49:42Z) - To Wake-up or Not to Wake-up: Reducing Keyword False Alarm by Successive
Refinement [58.96644066571205]
既存の深層キーワードスポッティング機構は逐次リファインメントにより改善可能であることを示す。
13Kパラメーターから2.41Mパラメーターまで、複数のモデルにまたがって、連続精製法はFAを最大8.5%削減する。
提案手法は"plug-and-play"であり,任意の深いキーワードスポッティングモデルに適用できる。
論文 参考訳(メタデータ) (2023-04-06T23:49:29Z) - Short-Term Word-Learning in a Dynamically Changing Environment [63.025297637716534]
本稿では、単語/フレーズメモリと、このメモリにアクセスして単語やフレーズを正しく認識するためのメカニズムを用いて、エンドツーエンドのASRシステムを補完する方法を示す。
誤報がわずかに増加しただけで, 単語の検出速度が大幅に向上した。
論文 参考訳(メタデータ) (2022-03-29T10:05:39Z) - EfficientWord-Net: An Open Source Hotword Detection Engine based on
One-shot Learning [0.0]
本稿では,ワンショット学習に基づくホットワード検出エンジンの設計と実装について述べる。
本稿では,94.51%の精度を達成している。
論文 参考訳(メタデータ) (2021-10-31T02:18:01Z) - Dynamic Acoustic Unit Augmentation With BPE-Dropout for Low-Resource
End-to-End Speech Recognition [62.94773371761236]
我々は、OOVレートの高い低リソースセットアップで効果的なエンドツーエンドASRシステムを構築することを検討します。
本稿では,BPE-dropout法に基づく動的音響ユニット拡張法を提案する。
我々の単言語トルココンフォーマーは22.2%の文字誤り率(CER)と38.9%の単語誤り率(WER)の競争結果を確立した。
論文 参考訳(メタデータ) (2021-03-12T10:10:13Z) - Speech Enhancement for Wake-Up-Word detection in Voice Assistants [60.103753056973815]
キースポッティング、特にWake-Up-Word(WUW)検出は音声アシスタントにとって非常に重要なタスクである。
本稿では,WUW検出に適応した音声強調モデルを提案する。
これらのノイズの存在下で、認識率を高め、誤報を減らすことを目的としている。
論文 参考訳(メタデータ) (2021-01-29T18:44:05Z) - Seeing wake words: Audio-visual Keyword Spotting [103.12655603634337]
KWS-Netは、類似マップ中間表現を用いてタスクをシーケンスマッチングとパターン検出に分離する新しい畳み込みアーキテクチャである。
本手法は他の言語,特にフランス語とドイツ語に一般化し,より少ない言語データで英語に匹敵する性能が得られることを示す。
論文 参考訳(メタデータ) (2020-09-02T17:57:38Z) - Accurate Detection of Wake Word Start and End Using a CNN [7.127506795239017]
小さなフットプリント組み込みデバイスは、音声アシスタントを実現するために、小さなモデルサイズと検出遅延を持つキーワードスポッター(KWS)を必要とする。
単一段階の単語レベルニューラルネットワークを用いたニューラルKWSにおけるウェイクワードの終端を検出する2つの新しい手法を提案する。
論文 参考訳(メタデータ) (2020-08-09T19:02:41Z) - Wake Word Detection with Alignment-Free Lattice-Free MMI [66.12175350462263]
音声言語インタフェース、例えばパーソナルデジタルアシスタントは、音声入力の処理を開始するためにウェイクワードに依存している。
本稿では,部分的にラベル付けされたトレーニングデータから,ハイブリッドDNN/HMM覚醒単語検出システムの学習方法を提案する。
提案手法を2つの実データ集合上で評価し, 前報よりも50%~90%の誤報率の減少率を示した。
論文 参考訳(メタデータ) (2020-05-17T19:22:25Z) - Small-Footprint Open-Vocabulary Keyword Spotting with Quantized LSTM
Networks [3.8382752162527933]
本稿では,オープン語彙のキーワードスポッティング手法に着目し,モデル全体を再トレーニングすることなく,ユーザが独自のキーワードを定義できるようにする。
ユーザ定義キーワードの任意のセットに対して,小さなデバイス上で動作可能な高速かつ小型のフットプリントシステムを実現するための,さまざまな設計選択について説明する。
論文 参考訳(メタデータ) (2020-02-25T13:27:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。