論文の概要: On the Mutual Information between Source and Filter Contributions for
Voice Pathology Detection
- arxiv url: http://arxiv.org/abs/2001.00583v1
- Date: Thu, 2 Jan 2020 10:04:37 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-16 04:30:07.644144
- Title: On the Mutual Information between Source and Filter Contributions for
Voice Pathology Detection
- Title(参考訳): 音声病理検出のための音源とフィルタの相互情報について
- Authors: Thomas Drugman, Thomas Dubuisson, Thierry Dutoit
- Abstract要約: 本稿では,音声信号から直接音声の病状を自動的に検出する問題に対処する。
音声や声帯信号に関連があるか,韻律に関連があるかによって,3つの特徴セットが提案される。
- 参考スコア(独自算出の注目度): 11.481208551940998
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper addresses the problem of automatic detection of voice pathologies
directly from the speech signal. For this, we investigate the use of the
glottal source estimation as a means to detect voice disorders. Three sets of
features are proposed, depending on whether they are related to the speech or
the glottal signal, or to prosody. The relevancy of these features is assessed
through mutual information-based measures. This allows an intuitive
interpretation in terms of discrimation power and redundancy between the
features, independently of any subsequent classifier. It is discussed which
characteristics are interestingly informative or complementary for detecting
voice pathologies.
- Abstract(参考訳): 本稿では,音声信号から直接音声病理を自動検出する問題に対処する。
そこで本研究では,声門音源推定を音声障害検出の手段として用いた。
音声や声帯信号に関連があるか,韻律に関連があるかによって,3つの特徴セットが提案される。
これらの特徴の関連性は相互情報に基づく尺度によって評価される。
これにより、後の分類器とは独立に、識別力と特徴間の冗長性の観点から直観的な解釈が可能になる。
音声病理の検出にはどの特徴が有益か補完的かについて議論した。
関連論文リスト
- Disentangling segmental and prosodic factors to non-native speech comprehensibility [11.098498920630782]
現在のアクセント変換システムは、非ネイティブアクセントの2つの主要な源である分節的特徴と韻律的特徴を分離しない。
本稿では,アクセントから声質を分離するACシステムを提案する。
本研究では,非母語音声の知覚的理解度に係わる部分的特徴と韻律の個人的寄与を定量化するために,知覚的聴取テストを実施している。
論文 参考訳(メタデータ) (2024-08-20T16:43:55Z) - A Novel Labeled Human Voice Signal Dataset for Misbehavior Detection [0.7223352886780369]
本研究は,音声認識のための自動学習システムにおける音声トーンと配信の重要性を強調した。
これは、人間の行動が音声信号の知覚と分類に与える影響を解明することにより、音声信号解析の幅広い分野に寄与する。
論文 参考訳(メタデータ) (2024-06-28T18:55:07Z) - Improving Speaker Diarization using Semantic Information: Joint Pairwise
Constraints Propagation [53.01238689626378]
本稿では,話者ダイアリゼーションシステムにおける意味情報を活用する新しい手法を提案する。
音声言語理解モジュールを導入し、話者関連意味情報を抽出する。
本稿では,これらの制約を話者ダイアリゼーションパイプラインに統合する新しい枠組みを提案する。
論文 参考訳(メタデータ) (2023-09-19T09:13:30Z) - Deep Spectro-temporal Artifacts for Detecting Synthesized Speech [57.42110898920759]
本稿では,トラック1(低品質フェイク音声検出)とトラック2(部分フェイク音声検出)の総合評価を行う。
本稿では, 原時間信号, スペクトル特性, 深層埋没特性を用いて, 分光時相アーティファクトを検出した。
我々はそれぞれ1番線と2番線で4位と5位にランクインした。
論文 参考訳(メタデータ) (2022-10-11T08:31:30Z) - Towards Disentangled Speech Representations [65.7834494783044]
本研究では, ASR と TTS の合同モデリングに基づく表現学習タスクを構築する。
本研究は,その部分の音声信号と,その部分の音声信号とをアンタングルする音声表現を学習することを目的とする。
我々は,これらの特性をトレーニング中に強化することにより,WERを平均24.5%向上させることを示す。
論文 参考訳(メタデータ) (2022-08-28T10:03:55Z) - Integration of Text and Graph-based Features for Detecting Mental Health
Disorders from Voice [1.5469452301122175]
抑うつ検出のための音声分析に2つの方法が用いられている。
その結果,テキストに基づく音声分類と低レベルおよびグラフベースの音声信号機能からの学習の統合により,うつ病などの精神疾患の検出が向上することが示唆された。
論文 参考訳(メタデータ) (2022-05-14T08:37:19Z) - Streaming Multi-talker Speech Recognition with Joint Speaker
Identification [77.46617674133556]
SURITは、音声認識と話者識別の両方のバックボーンとして、リカレントニューラルネットワークトランスデューサ(RNN-T)を採用しています。
Librispeechから派生したマルチストーカーデータセットであるLibrispeechデータセットに関するアイデアを検証し、奨励的な結果を提示した。
論文 参考訳(メタデータ) (2021-04-05T18:37:33Z) - Discriminative Singular Spectrum Classifier with Applications on
Bioacoustic Signal Recognition [67.4171845020675]
分析や分類に有用な特徴を効率的に抽出する識別機構を備えた生体音響信号分類器を提案する。
タスク指向の現在のバイオ音響認識法とは異なり、提案モデルは入力信号をベクトル部分空間に変換することに依存する。
提案法の有効性は,アヌラン,ミツバチ,蚊の3種の生物音響データを用いて検証した。
論文 参考訳(メタデータ) (2021-03-18T11:01:21Z) - An Overview of Deep-Learning-Based Audio-Visual Speech Enhancement and
Separation [57.68765353264689]
音声強調と音声分離は関連する2つの課題である。
伝統的に、これらのタスクは信号処理と機械学習技術を使って取り組まれてきた。
ディープラーニングは強力なパフォーマンスを達成するために利用されています。
論文 参考訳(メタデータ) (2020-08-21T17:24:09Z) - Data-driven Detection and Analysis of the Patterns of Creaky Voice [13.829936505895692]
クレーキー音声はフレーズ境界マーカーとしてよく使われる品質である。
難解な音声の自動検出とモデリングは、音声技術への応用に影響を及ぼす可能性がある。
論文 参考訳(メタデータ) (2020-05-31T13:34:30Z) - Phase-based Information for Voice Pathology Detection [11.481208551940998]
本稿では,音声障害を自動的に検出するフェーズベース機能の可能性について検討する。
グループ遅延関数は、発声における不規則性を特徴付けるのに適切であることを示す。
論文 参考訳(メタデータ) (2020-01-02T09:51:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。