論文の概要: Robust Stuttering Detection via Multi-task and Adversarial Learning
- arxiv url: http://arxiv.org/abs/2204.01735v1
- Date: Mon, 4 Apr 2022 15:44:34 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-06 15:01:44.017820
- Title: Robust Stuttering Detection via Multi-task and Adversarial Learning
- Title(参考訳): マルチタスクと逆学習によるロバスト・スタッタ検出
- Authors: Shakeel Ahmad Sheikh, Md Sahidullah, Fabrice Hirsch, Slim Ouni
- Abstract要約: マルチタスク (MTL) と対向学習 (ADV) が頑健なスタッター特徴の学習に与える影響について検討した。
385ポッドキャストの20時間(近似)のデータからなるSEP-28kスタブリングデータセットを用いて,本システムの評価を行った。
最大10%,6.78%,2%の繰り返し,ブロック,インタージェクションの改善をそれぞれベースライン上で達成する。
- 参考スコア(独自算出の注目度): 7.42741711946564
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: By automatic detection and identification of stuttering, speech pathologists
can track the progression of disfluencies of persons who stutter (PWS). In this
paper, we investigate the impact of multi-task (MTL) and adversarial learning
(ADV) to learn robust stutter features. This is the first-ever preliminary
study where MTL and ADV have been employed in stuttering identification (SI).
We evaluate our system on the SEP-28k stuttering dataset consisting of 20 hours
(approx) of data from 385 podcasts. Our methods show promising results and
outperform the baseline in various disfluency classes. We achieve up to 10%,
6.78%, and 2% improvement in repetitions, blocks, and interjections
respectively over the baseline.
- Abstract(参考訳): スタブリングの自動検出と識別により、音声病理学者は、スタブリング(PWS)の進行を追跡できる。
本稿では,マルチタスク (MTL) と対向学習 (ADV) が頑健なスタッター特徴の学習に与える影響について検討する。
MTLとADVがスタブリング同定(SI)に用いられている最初の予備研究である。
385のポッドキャストから20時間(約20時間)のデータからなるsep-28kスッタリングデータセット上でシステムを評価する。
提案手法は有望な結果を示し,様々な不流動クラスでベースラインを上回っている。
ベースライン上での反復,ブロック,インタージェクションのそれぞれ10%,6.78%,2%の改善を達成しました。
関連論文リスト
- MMSD-Net: Towards Multi-modal Stuttering Detection [9.257985820122999]
MMSD-Netは、スタブリング検出のための最初のマルチモーダルニューラルネットワークフレームワークである。
我々のモデルでは、既存の最先端ユニモーダルアプローチよりもF1スコアが2-17%向上している。
論文 参考訳(メタデータ) (2024-07-16T08:26:59Z) - A New Benchmark and Reverse Validation Method for Passage-level
Hallucination Detection [63.56136319976554]
大きな言語モデル(LLM)は幻覚を発生させ、ミッションクリティカルなタスクにデプロイすると大きなダメージを与える可能性がある。
本稿では,逆検証に基づく自己チェック手法を提案し,ゼロリソース方式で事実誤りを自動的に検出する。
提案手法と既存のゼロリソース検出手法を2つのデータセット上で実証的に評価した。
論文 参考訳(メタデータ) (2023-10-10T10:14:59Z) - A New Benchmark of Aphasia Speech Recognition and Detection Based on
E-Branchformer and Multi-task Learning [29.916793641951507]
本稿では,最新の音声認識技術を用いた失語症音声認識のための新しいベンチマークを提案する。
CTC/Attentionアーキテクチャに基づく2つのマルチタスク学習手法を導入し、両方のタスクを同時に実行する。
当システムでは,中等度失語症患者に対して,最先端の話者レベル検出精度(97.3%)と相対的なWER低下率(1%)を達成している。
論文 参考訳(メタデータ) (2023-05-19T15:10:36Z) - Advancing Stuttering Detection via Data Augmentation, Class-Balanced
Loss and Multi-Contextual Deep Learning [7.42741711946564]
スタッタリング(英: Stuttering)は、制御されていない発話とコアの振る舞いを特徴とする、神経発達の音声障害である。
本稿では,データ不足に対処する多分岐学習方式におけるデータ拡張の有効性について検討する。
さらに,発声音声の異なる文脈を利用するマルチコンテキスト(MC)のStutterNetを提案する。
論文 参考訳(メタデータ) (2023-02-21T14:03:47Z) - Exploiting prompt learning with pre-trained language models for
Alzheimer's Disease detection [70.86672569101536]
アルツハイマー病(AD)の早期診断は予防ケアの促進とさらなる進行の遅らせに不可欠である。
本稿では,AD分類誤差をトレーニング対象関数として一貫して用いたPLMの高速微調整法について検討する。
論文 参考訳(メタデータ) (2022-10-29T09:18:41Z) - Deep Learning for Hate Speech Detection: A Comparative Study [54.42226495344908]
ここでは, ディープ・ヘイト・音声検出法と浅いヘイト・音声検出法を大規模に比較した。
私たちの目標は、この地域の進歩を照らし、現在の最先端の強みと弱点を特定することです。
そこで我々は,ヘイトスピーチ検出の実践的利用に関するガイダンスの提供,最先端の定量化,今後の研究方向の特定を目的としている。
論文 参考訳(メタデータ) (2022-02-19T03:48:20Z) - Investigation of Data Augmentation Techniques for Disordered Speech
Recognition [69.50670302435174]
本稿では,不規則音声認識のための一連のデータ拡張手法について検討する。
正常な音声と無秩序な音声の両方が増強過程に利用された。
UASpeechコーパスを用いた最終話者適応システムと、最大2.92%の絶対単語誤り率(WER)の速度摂動に基づく最良の拡張アプローチ
論文 参考訳(メタデータ) (2022-01-14T17:09:22Z) - NUVA: A Naming Utterance Verifier for Aphasia Treatment [49.114436579008476]
失語症(PWA)患者の治療介入に対する反応の診断とモニタリングの両立のための画像命名タスクを用いた音声性能評価
本稿では,失語症脳卒中患者の「正しい」と「正しくない」を分類する深層学習要素を組み込んだ発話検証システムであるNUVAについて述べる。
イギリス系英語8ヶ国語でのテストでは、システムの性能精度は83.6%から93.6%の範囲であり、10倍のクロスバリデーション平均は89.5%であった。
論文 参考訳(メタデータ) (2021-02-10T13:00:29Z) - Improved Robustness to Disfluencies in RNN-Transducer Based Speech
Recognition [1.8702587873591643]
RNN-T ASRの発話障害に対する堅牢性向上を目的としたデータ選択と準備選択を検討する。
学習に不均一性のある少量のデータを含むと、不均一性や混乱を伴うテストの認識精度が向上することを示す。
論文 参考訳(メタデータ) (2020-12-11T11:47:13Z) - Detecting Parkinsonian Tremor from IMU Data Collected In-The-Wild using
Deep Multiple-Instance Learning [59.74684475991192]
パーキンソン病(英: Parkinson's Disease、PD)は、60歳以上の人口の約1%に影響を与える徐々に進化する神経学的疾患である。
PD症状には、震動、剛性、ブレイキネジアがある。
本稿では,スマートフォン端末から受信したIMU信号に基づいて,PDに関連するトレモラスなエピソードを自動的に識別する手法を提案する。
論文 参考訳(メタデータ) (2020-05-06T09:02:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。