論文の概要: Active Speech Enhancement: Active Speech Denoising Decliping and Deveraberation
- arxiv url: http://arxiv.org/abs/2505.16911v1
- Date: Thu, 22 May 2025 17:10:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-23 17:12:48.483141
- Title: Active Speech Enhancement: Active Speech Denoising Decliping and Deveraberation
- Title(参考訳): アクティブ音声強調:アクティブ音声デノベーションの減少とデザラベレーション
- Authors: Ofir Yaish, Yehuda Mishaly, Eliya Nachmani,
- Abstract要約: 能動音声修正のための新しいパラダイム:能動音声強調(ASE)について紹介する。
干渉抑制と信号の富化を協調的に最適化するタスク固有損失関数とともに,トランスフォーマー・マンバに基づく新しいアーキテクチャを提案する。
提案手法は,複数の音声処理タスクにおいて,デノベーション,デノベーション,デクリッピングなど,既存のベースラインを上回っている。
- 参考スコア(独自算出の注目度): 13.575063025878208
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce a new paradigm for active sound modification: Active Speech Enhancement (ASE). While Active Noise Cancellation (ANC) algorithms focus on suppressing external interference, ASE goes further by actively shaping the speech signal -- both attenuating unwanted noise components and amplifying speech-relevant frequencies -- to improve intelligibility and perceptual quality. To enable this, we propose a novel Transformer-Mamba-based architecture, along with a task-specific loss function designed to jointly optimize interference suppression and signal enrichment. Our method outperforms existing baselines across multiple speech processing tasks -- including denoising, dereverberation, and declipping -- demonstrating the effectiveness of active, targeted modulation in challenging acoustic environments.
- Abstract(参考訳): 本稿では,アクティブ音声強調(ASE)という,アクティブ音声修正のための新しいパラダイムを提案する。
アクティブノイズキャンセラレーション(ANC)アルゴリズムは外部からの干渉を抑制することに重点を置いているが、ASEは、望ましくないノイズ成分を減衰させ、音声関連周波数を増幅することで音声信号を積極的に形作り、知性や知覚品質を向上させる。
これを実現するために,新しいTransformer-Mambaアーキテクチャと,干渉抑制と信号の富化を協調的に最適化するタスク固有損失関数を提案する。
提案手法は,複数の音声処理タスクにおいて既存のベースラインよりも優れており,その性能は,難聴環境におけるアクティブな目標変調の有効性を示す。
関連論文リスト
- Deep Active Speech Cancellation with Multi-Band Mamba Network [62.73250985838971]
アクティブ音声キャンセラ(ASC)のための新しい深層学習ネットワークを提案する。
提案したMulti-Band Mambaアーキテクチャは、入力音声を異なる周波数帯域にセグメントし、正確な反信号生成を可能にする。
実験の結果、ANCシナリオでは7.2dB、ASCでは6.2dBの改善が達成された。
論文 参考訳(メタデータ) (2025-02-03T09:22:26Z) - Robust Active Speaker Detection in Noisy Environments [29.785749048315616]
雑音環境下での頑健なアクティブ話者検出(rASD)問題を定式化する。
既存のASDアプローチは、音声と視覚の両モードを利用するが、周囲の環境における非音声は、性能に悪影響を及ぼす可能性がある。
雑音のない音声特徴を学習するためのガイダンスとして,音声・視覚的音声分離を利用した新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-27T20:52:30Z) - Continuous Modeling of the Denoising Process for Speech Enhancement
Based on Deep Learning [61.787485727134424]
状態変数をデノナイジングプロセスを示すために使用します。
UNetのようなニューラルネットワークは、連続的復調プロセスからサンプリングされたすべての状態変数を推定することを学ぶ。
実験結果から, クリーンターゲットに少量の雑音を保存することは, 音声強調に有効であることが示唆された。
論文 参考訳(メタデータ) (2023-09-17T13:27:11Z) - Inference and Denoise: Causal Inference-based Neural Speech Enhancement [83.4641575757706]
本研究では、雑音の存在を介入としてモデル化することにより、因果推論パラダイムにおける音声強調(SE)課題に対処する。
提案した因果推論に基づく音声強調(CISE)は,ノイズ検出器を用いて間欠雑音音声中のクリーンフレームとノイズフレームを分離し,両フレームセットを2つのマスクベース拡張モジュール(EM)に割り当て,ノイズ条件SEを実行する。
論文 参考訳(メタデータ) (2022-11-02T15:03:50Z) - Improving Noise Robustness of Contrastive Speech Representation Learning
with Speech Reconstruction [109.44933866397123]
実環境における音声認識システムの実現には,雑音の堅牢性が不可欠である。
雑音認識のための自己教師型フレームワークにより学習したノイズロスト表現を用いる。
ラベル付きデータのわずか16%で報告された最高の教師付きアプローチに匹敵するパフォーマンスを実現した。
論文 参考訳(メタデータ) (2021-10-28T20:39:02Z) - Interactive Feature Fusion for End-to-End Noise-Robust Speech
Recognition [25.84784710031567]
本稿では,ノイズロバスト音声認識のための対話型特徴融合ネットワーク(IFF-Net)を提案する。
実験の結果,提案手法は最良基準値に対して絶対単語誤り率(WER)を4.1%削減できることがわかった。
さらに分析した結果,提案したIFF-Netは,過度に抑圧された拡張機能において欠落した情報を補うことができることがわかった。
論文 参考訳(メタデータ) (2021-10-11T13:40:07Z) - PL-EESR: Perceptual Loss Based END-TO-END Robust Speaker Representation
Extraction [90.55375210094995]
音声強調は、背景雑音の抑制による音声信号の知覚品質の向上を目的としている。
本稿では,頑健な話者表現抽出のためのエンドツーエンドディープラーニングフレームワークPL-EESRを提案する。
論文 参考訳(メタデータ) (2021-10-03T07:05:29Z) - Speech Enhancement for Wake-Up-Word detection in Voice Assistants [60.103753056973815]
キースポッティング、特にWake-Up-Word(WUW)検出は音声アシスタントにとって非常に重要なタスクである。
本稿では,WUW検出に適応した音声強調モデルを提案する。
これらのノイズの存在下で、認識率を高め、誤報を減らすことを目的としている。
論文 参考訳(メタデータ) (2021-01-29T18:44:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。