論文の概要: Unsupervised Domain Adaptation for Dysarthric Speech Detection via
Domain Adversarial Training and Mutual Information Minimization
- arxiv url: http://arxiv.org/abs/2106.10127v1
- Date: Fri, 18 Jun 2021 13:34:36 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-26 08:15:34.019030
- Title: Unsupervised Domain Adaptation for Dysarthric Speech Detection via
Domain Adversarial Training and Mutual Information Minimization
- Title(参考訳): ドメイン逆訓練と相互情報最小化による非教師なし領域適応型構音障害音声検出
- Authors: Disong Wang, Liqun Deng, Yu Ting Yeung, Xiao Chen, Xunying Liu, Helen
Meng
- Abstract要約: 本稿では,非教師付き領域適応問題として,クロスドメイン・ディザスリック音声検出(DSD)を定式化するための最初の試みを行う。
DPC, DAT, 相互情報最小化(MIM)を含むマルチタスク学習戦略を提案する。
実験の結果, 発話レベルの重み付き平均リコールと話者レベルの精度では, それぞれ22.2%, 20.0%の絶対的な増加が得られた。
- 参考スコア(独自算出の注目度): 52.82138296332476
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Dysarthric speech detection (DSD) systems aim to detect characteristics of
the neuromotor disorder from speech. Such systems are particularly susceptible
to domain mismatch where the training and testing data come from the source and
target domains respectively, but the two domains may differ in terms of speech
stimuli, disease etiology, etc. It is hard to acquire labelled data in the
target domain, due to high costs of annotating sizeable datasets. This paper
makes a first attempt to formulate cross-domain DSD as an unsupervised domain
adaptation (UDA) problem. We use labelled source-domain data and unlabelled
target-domain data, and propose a multi-task learning strategy, including
dysarthria presence classification (DPC), domain adversarial training (DAT) and
mutual information minimization (MIM), which aim to learn
dysarthria-discriminative and domain-invariant biomarker embeddings.
Specifically, DPC helps biomarker embeddings capture critical indicators of
dysarthria; DAT forces biomarker embeddings to be indistinguishable in source
and target domains; and MIM further reduces the correlation between biomarker
embeddings and domain-related cues. By treating the UASPEECH and TORGO corpora
respectively as the source and target domains, experiments show that the
incorporation of UDA attains absolute increases of 22.2% and 20.0% respectively
in utterance-level weighted average recall and speaker-level accuracy.
- Abstract(参考訳): dysarthric speech detection (dsd)システムは、音声から神経運動障害の特徴を検出することを目的としている。
このようなシステムは、トレーニングデータとテストデータがそれぞれソースドメインとターゲットドメインから来るドメインミスマッチに特に影響を受けやすいが、これら2つのドメインは、音声刺激や病因論などによって異なる場合がある。
サイズ可能なデータセットにアノテートするコストが高いため、ターゲットドメインのラベル付きデータを取得するのは難しい。
本稿では、非教師なし領域適応(UDA)問題としてクロスドメインDSDを定式化するための最初の試みを行う。
我々は,ラベル付きソースドメインデータとラベル付き対象領域データを用いて,dysarthria presence classification (dpc), domain adversarial training (dat), mutual information minimization (mim) を含む多タスク学習戦略を提案し,dysarthria-discriminative and domain-invariant biomarkerの埋め込みを学習することを目的とした。
特に、DPCは、バイオマーカーの埋め込みが変形の重要な指標を捉えるのに役立ち、DATはバイオマーカーの埋め込みをソースドメインとターゲットドメインで区別できないように強制する。
UASPEECHコーパスとTORGOコーパスをそれぞれソースドメインとターゲットドメインとして扱うことにより、発話レベルの重み付き平均リコールと話者レベルの精度において、UDAの法人化がそれぞれ22.2%と20.0%の絶対的な増加を達成することを示す。
関連論文リスト
- Unsupervised Domain Adaptation for Brain Vessel Segmentation through
Transwarp Contrastive Learning [46.248404274124546]
教師なし領域適応(Unsupervised domain adapt, UDA)は、ラベル付きソース分布とラベル付きターゲット分布との整合を目的とし、ドメイン不変な予測モデルを得る。
本稿では,ラベル付きソースと非ラベル付きターゲット分布の領域間ギャップを狭めるための,UDAのための簡易かつ強力なコントラスト学習フレームワークを提案する。
論文 参考訳(メタデータ) (2024-02-23T10:01:22Z) - Subject-Based Domain Adaptation for Facial Expression Recognition [49.87577140337738]
ディープ・ラーニング(DL)モデルを特定の対象個人に適用することは、表情認識(FER)における課題である。
FERにおける主観的ドメイン適応のための新しいMSDA手法を提案する。
複数の情報源からの情報を効率的に利用して、ディープFERモデルを単一のターゲット個人に適応させる。
論文 参考訳(メタデータ) (2023-12-09T18:40:37Z) - Weighted Joint Maximum Mean Discrepancy Enabled
Multi-Source-Multi-Target Unsupervised Domain Adaptation Fault Diagnosis [15.56929064706769]
We propose a weighted joint maximum mean discrepancy able multi-source-multi-target unsupervised domain adaptation (WJMMD-MDA)。
提案手法は,複数のラベル付きソースドメインから十分な情報を抽出し,ソースドメインとターゲットドメイン間のドメインアライメントを実現する。
提案手法の性能を3つのデータセットの総合的な比較実験で評価した。
論文 参考訳(メタデータ) (2023-10-20T16:53:31Z) - Source-Free Domain Adaptation for Medical Image Segmentation via
Prototype-Anchored Feature Alignment and Contrastive Learning [57.43322536718131]
医用画像セグメンテーションのための2段階のソースフリードメイン適応(SFDA)フレームワークを提案する。
プロトタイプアンコールされた特徴アライメントの段階では,まず,事前学習した画素ワイド分類器の重みを原プロトタイプとして利用する。
そこで,本研究では,目標となる特徴とクラスプロトタイプとの整合性を期待するコストを最小化し,双方向輸送を導入する。
論文 参考訳(メタデータ) (2023-07-19T06:07:12Z) - Joint Attention-Driven Domain Fusion and Noise-Tolerant Learning for
Multi-Source Domain Adaptation [2.734665397040629]
マルチソースUnsupervised Domain Adaptationはラベル付きデータを持つ複数のソースドメインからラベル付きターゲットドメインに知識を転送する。
異なるドメインとターゲットドメイン内のノイズの多い擬似ラベル間の分散の相違は、どちらもパフォーマンスのボトルネックにつながる。
本稿では,意識駆動型ドメイン融合(ADNT)と雑音耐性学習(ADNT)を統合し,上記の2つの問題に対処するアプローチを提案する。
論文 参考訳(メタデータ) (2022-08-05T01:08:41Z) - ACT: Semi-supervised Domain-adaptive Medical Image Segmentation with
Asymmetric Co-training [34.017031149886556]
非教師なしドメイン適応(UDA)は、ソースとターゲットドメイン間のドメインシフトを軽減するために大いに研究されてきた。
本稿では,ラベル付けされていないターゲットデータに加えて,ラベル付きソースデータとターゲットドメインデータの両方を統一的に活用することを提案する。
本稿では、これらのサブセットを統合し、ソースドメインデータの支配を回避するための、新しい非対称コトレーニング(ACT)フレームワークを提案する。
論文 参考訳(メタデータ) (2022-06-05T23:48:00Z) - IDM: An Intermediate Domain Module for Domain Adaptive Person Re-ID [58.46907388691056]
ソースとターゲットドメイン間のブリッジは、UDA re-IDタスクに対処するために有効である、と我々は主張する。
中間ドメインの表現をオンザフライで生成するための中間ドメインモジュール(IDM)を提案する。
提案手法は,UDAのre-IDタスクに共通するタスクにおいて,最先端のタスクよりも大きなマージンで性能を向上する。
論文 参考訳(メタデータ) (2021-08-05T07:19:46Z) - Effective Label Propagation for Discriminative Semi-Supervised Domain
Adaptation [76.41664929948607]
半教師付き領域適応(SSDA)法は,大規模な画像分類タスクにおいて大きな可能性を示している。
本稿では、ドメイン間およびドメイン内セマンティック情報を効果的に伝達することにより、この問題に対処する新しい効果的な方法を提案する。
ソースコードと事前訓練されたモデルも間もなくリリースされる予定です。
論文 参考訳(メタデータ) (2020-12-04T14:28:19Z) - Adversarial Dual Distinct Classifiers for Unsupervised Domain Adaptation [67.83872616307008]
Unversarial Domain adaptation (UDA)は、異なる分散されたラベル付きソースドメインから学習モデルを構築することで、ラベルなしのターゲットサンプルを認識しようとする。
本稿では,タスク固有のカテゴリ境界に一致するソースとターゲット領域のデータ分布を同時に整合させる新しいアドリラルデュアル・ディスタンス・ネットワーク(AD$2$CN)を提案する。
具体的には、ドメイン不変の特徴発生器を利用して、識別的クロスドメインアライメントのガイダンスにより、ソースとターゲットデータを潜在共通空間に埋め込む。
論文 参考訳(メタデータ) (2020-08-27T01:29:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。