論文の概要: Intermittent Speech Recovery
- arxiv url: http://arxiv.org/abs/2106.05229v1
- Date: Wed, 9 Jun 2021 17:17:34 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-10 14:50:01.451041
- Title: Intermittent Speech Recovery
- Title(参考訳): 間欠的音声回復
- Authors: Yu-Chen Lin, Tsun-An Hsieh, Kuo-Hsuan Hung, Cheng Yu, Harinath
Garudadri, Yu Tsao, Tei-Wei Kuo
- Abstract要約: この研究は、自発型IoTデバイスから間欠的な音声信号を再構成した最初の1つである。
我々のISRシステムは、ほとんどの音声信号ベースのアプリケーションの性能を維持できる。
- 参考スコア(独自算出の注目度): 24.885065562710157
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A large number of Internet of Things (IoT) devices today are powered by
batteries, which are often expensive to maintain and may cause serious
environmental pollution. To avoid these problems, researchers have begun to
consider the use of energy systems based on energy-harvesting units for such
devices. However, the power harvested from an ambient source is fundamentally
small and unstable, resulting in frequent power failures during the operation
of IoT applications involving, for example, intermittent speech signals and the
streaming of videos. This paper presents a deep-learning-based speech recovery
system that reconstructs intermittent speech signals from self-powered IoT
devices. Our intermittent speech recovery system (ISR) consists of three
stages: interpolation, recovery, and combination. The experimental results show
that our recovery system increases speech quality by up to 707.1%, while
increasing speech intelligibility by up to 92.1%. Most importantly, our ISR
system also enhances the WER scores by up to 65.6%. To the best of our
knowledge, this study is one of the first to reconstruct intermittent speech
signals from self-powered-sensing IoT devices. These promising results suggest
that even though self powered microphone devices function with weak energy
sources, our ISR system can still maintain the performance of most
speech-signal-based applications.
- Abstract(参考訳): 今日、iot(internet of things, モノのインターネット)デバイスの多くはバッテリーで駆動されており、メンテナンスにコストがかかり、深刻な環境汚染を引き起こす可能性がある。
これらの問題を避けるため、研究者はこれらの装置にエネルギーハーベッティング単位に基づくエネルギーシステムの利用を検討し始めている。
しかし、周囲のソースから得られる電力は基本的に小さく不安定であり、断続的な音声信号やビデオのストリーミングなどを含むIoTアプリケーションの動作中に頻繁に電源障害が発生する。
本稿では,自律型IoTデバイスから間欠的な音声信号を再構成するディープラーニングに基づく音声復元システムを提案する。
間欠的音声回復システム (ISR) は, 補間, 補間, 回復, 組み合わせの3段階からなる。
実験の結果,音声品質は最大707.1%向上し,音声認識能力は最大92.1%向上した。
ISRシステムでは、WERスコアも65.6%向上しています。
我々の知る限りでは、この研究は、自力でセンシングするIoTデバイスから間欠的な音声信号を再構築した最初の1つである。
これらの有望な結果は、自給式マイクロホンデバイスが弱いエネルギー源で機能するにもかかわらず、我々のisrシステムは、ほとんどの音声信号ベースのアプリケーションのパフォーマンスを維持できることを示唆している。
関連論文リスト
- DEEP-IoT: Downlink-Enhanced Efficient-Power Internet of Things [10.696740170777366]
本稿では,IoTデバイスの通信方法を再定義する,革新的な通信パラダイムであるDEEP-IoTを提案する。
先駆的なフィードバックチャネルコーディング戦略を通じて、DEEP-IoTは従来の送信機(IoTデバイス)中心の通信モデルに挑戦し、変革する。
従来のTurboとPolarのコードを52.71%まで上回る、IoTセルの運用寿命が大幅に向上したことを示す。
論文 参考訳(メタデータ) (2024-03-01T06:48:58Z) - UNIT-DSR: Dysarthric Speech Reconstruction System Using Speech Unit
Normalization [60.43992089087448]
変形性音声再構成システムは、変形性音声を正常な音声に変換することを目的としている。
本稿では,HuBERTのドメイン適応能力を活用して学習効率を向上させるユニットDSRシステムを提案する。
NEDアプローチと比較すると、ユニットDSRシステムは音声単位正規化器とユニットHiFi-GANボコーダのみで構成されている。
論文 参考訳(メタデータ) (2024-01-26T06:08:47Z) - Recent Progress in the CUHK Dysarthric Speech Recognition System [66.69024814159447]
障害音声は、現在のデータ集約型ディープニューラルネットワーク(DNN)に基づく自動音声認識技術に対して、幅広い課題を提示している。
本稿では,香港の中国大学における音声認識システムの性能向上に向けた最近の研究成果について述べる。
論文 参考訳(メタデータ) (2022-01-15T13:02:40Z) - Investigation of Data Augmentation Techniques for Disordered Speech
Recognition [69.50670302435174]
本稿では,不規則音声認識のための一連のデータ拡張手法について検討する。
正常な音声と無秩序な音声の両方が増強過程に利用された。
UASpeechコーパスを用いた最終話者適応システムと、最大2.92%の絶対単語誤り率(WER)の速度摂動に基づく最良の拡張アプローチ
論文 参考訳(メタデータ) (2022-01-14T17:09:22Z) - Learning, Computing, and Trustworthiness in Intelligent IoT
Environments: Performance-Energy Tradeoffs [62.91362897985057]
Intelligent IoT Environment(iIoTe)は、半自律IoTアプリケーションを協調実行可能な異種デバイスで構成されている。
本稿では,これらの技術の現状を概観し,その機能と性能,特にリソース,レイテンシ,プライバシ,エネルギー消費のトレードオフに注目した。
論文 参考訳(メタデータ) (2021-10-04T19:41:42Z) - Machine learning methods for modelling and analysis of time series
signals in geoinformatics [2.193013035690221]
この論文は、異なる性質の時系列データセットと異なるアプリケーションに対して、複数のディープラーニング(DL)アーキテクチャの性能を評価する。
最初の問題は、多くのリアルタイム・グローバルナビゲーション・システム・サテライト(GNSS)アプリケーションにおいて重要な問題である電離層トータル・コンテント(TEC)モデリングに関連している。
次の問題はエネルギー分散であり、エネルギー効率とエネルギー消費意識にとって重要な問題である。
論文 参考訳(メタデータ) (2021-09-16T16:18:13Z) - Dynamic Acoustic Unit Augmentation With BPE-Dropout for Low-Resource
End-to-End Speech Recognition [62.94773371761236]
我々は、OOVレートの高い低リソースセットアップで効果的なエンドツーエンドASRシステムを構築することを検討します。
本稿では,BPE-dropout法に基づく動的音響ユニット拡張法を提案する。
我々の単言語トルココンフォーマーは22.2%の文字誤り率(CER)と38.9%の単語誤り率(WER)の競争結果を確立した。
論文 参考訳(メタデータ) (2021-03-12T10:10:13Z) - Exploiting Beam Search Confidence for Energy-Efficient Speech
Recognition [0.0]
エッジデバイス用低消費電力ハードウェアを中心に、ASRシステムのエネルギー効率と性能を向上させる技術を提案します。
これにより、音響モデル評価のエネルギーと実行時間をそれぞれ25.6%と25.9%削減し、無視可能な精度の損失を伴います。
論文 参考訳(メタデータ) (2021-01-22T12:35:35Z) - Leveraging AI and Intelligent Reflecting Surface for Energy-Efficient
Communication in 6G IoT [14.027983498089084]
人工知能(AI)とインテリジェント反射面(IRS)による6G IoTのための省エネルギー通信システムを提案する。
まず、IRS対応データ伝送やAIによるネットワークリソース管理メカニズムなど、スマートで効率的な通信アーキテクチャを設計します。
第3に,提案された最適化モデルを解決するために,深層強化学習(DRL)によるネットワークリソース制御と割り当ての手法を提案する。
論文 参考訳(メタデータ) (2020-12-29T11:56:28Z) - Characterizing Speech Adversarial Examples Using Self-Attention U-Net
Enhancement [102.48582597586233]
本稿では,U-Net$_At$という,U-Netに基づくアテンションモデルを提案する。
対戦型音声アタックを用いた自動音声認識(ASR)タスクの実験を行った。
論文 参考訳(メタデータ) (2020-03-31T02:16:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。