論文の概要: Unsupervised Domain Adaptation for Dysarthric Speech Detection via
Domain Adversarial Training and Mutual Information Minimization
- arxiv url: http://arxiv.org/abs/2106.10127v1
- Date: Fri, 18 Jun 2021 13:34:36 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-26 08:15:34.019030
- Title: Unsupervised Domain Adaptation for Dysarthric Speech Detection via
Domain Adversarial Training and Mutual Information Minimization
- Title(参考訳): ドメイン逆訓練と相互情報最小化による非教師なし領域適応型構音障害音声検出
- Authors: Disong Wang, Liqun Deng, Yu Ting Yeung, Xiao Chen, Xunying Liu, Helen
Meng
- Abstract要約: 本稿では,非教師付き領域適応問題として,クロスドメイン・ディザスリック音声検出(DSD)を定式化するための最初の試みを行う。
DPC, DAT, 相互情報最小化(MIM)を含むマルチタスク学習戦略を提案する。
実験の結果, 発話レベルの重み付き平均リコールと話者レベルの精度では, それぞれ22.2%, 20.0%の絶対的な増加が得られた。
- 参考スコア(独自算出の注目度): 52.82138296332476
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Dysarthric speech detection (DSD) systems aim to detect characteristics of
the neuromotor disorder from speech. Such systems are particularly susceptible
to domain mismatch where the training and testing data come from the source and
target domains respectively, but the two domains may differ in terms of speech
stimuli, disease etiology, etc. It is hard to acquire labelled data in the
target domain, due to high costs of annotating sizeable datasets. This paper
makes a first attempt to formulate cross-domain DSD as an unsupervised domain
adaptation (UDA) problem. We use labelled source-domain data and unlabelled
target-domain data, and propose a multi-task learning strategy, including
dysarthria presence classification (DPC), domain adversarial training (DAT) and
mutual information minimization (MIM), which aim to learn
dysarthria-discriminative and domain-invariant biomarker embeddings.
Specifically, DPC helps biomarker embeddings capture critical indicators of
dysarthria; DAT forces biomarker embeddings to be indistinguishable in source
and target domains; and MIM further reduces the correlation between biomarker
embeddings and domain-related cues. By treating the UASPEECH and TORGO corpora
respectively as the source and target domains, experiments show that the
incorporation of UDA attains absolute increases of 22.2% and 20.0% respectively
in utterance-level weighted average recall and speaker-level accuracy.
- Abstract(参考訳): dysarthric speech detection (dsd)システムは、音声から神経運動障害の特徴を検出することを目的としている。
このようなシステムは、トレーニングデータとテストデータがそれぞれソースドメインとターゲットドメインから来るドメインミスマッチに特に影響を受けやすいが、これら2つのドメインは、音声刺激や病因論などによって異なる場合がある。
サイズ可能なデータセットにアノテートするコストが高いため、ターゲットドメインのラベル付きデータを取得するのは難しい。
本稿では、非教師なし領域適応(UDA)問題としてクロスドメインDSDを定式化するための最初の試みを行う。
我々は,ラベル付きソースドメインデータとラベル付き対象領域データを用いて,dysarthria presence classification (dpc), domain adversarial training (dat), mutual information minimization (mim) を含む多タスク学習戦略を提案し,dysarthria-discriminative and domain-invariant biomarkerの埋め込みを学習することを目的とした。
特に、DPCは、バイオマーカーの埋め込みが変形の重要な指標を捉えるのに役立ち、DATはバイオマーカーの埋め込みをソースドメインとターゲットドメインで区別できないように強制する。
UASPEECHコーパスとTORGOコーパスをそれぞれソースドメインとターゲットドメインとして扱うことにより、発話レベルの重み付き平均リコールと話者レベルの精度において、UDAの法人化がそれぞれ22.2%と20.0%の絶対的な増加を達成することを示す。
関連論文リスト
- Diffuse-UDA: Addressing Unsupervised Domain Adaptation in Medical Image Segmentation with Appearance and Structure Aligned Diffusion Models [31.006056670998852]
3次元医用画像におけるvoxelレベルのアノテーションの欠如と複雑さは重要な課題である。
この格差は、医療における人工知能アルゴリズムの公平性に影響を与える。
医用画像セグメンテーションにおけるUnsupervised Domain Adaptation(UDA)に取り組むために拡散モデルを利用した新しい手法であるDiffuse-UDAを紹介する。
論文 参考訳(メタデータ) (2024-08-12T08:21:04Z) - Unsupervised Domain Adaptation for Brain Vessel Segmentation through
Transwarp Contrastive Learning [46.248404274124546]
教師なし領域適応(Unsupervised domain adapt, UDA)は、ラベル付きソース分布とラベル付きターゲット分布との整合を目的とし、ドメイン不変な予測モデルを得る。
本稿では,ラベル付きソースと非ラベル付きターゲット分布の領域間ギャップを狭めるための,UDAのための簡易かつ強力なコントラスト学習フレームワークを提案する。
論文 参考訳(メタデータ) (2024-02-23T10:01:22Z) - Subject-Based Domain Adaptation for Facial Expression Recognition [51.10374151948157]
ディープラーニングモデルを特定の対象個人に適用することは、難しい表情認識タスクである。
本稿では、FERにおける主観的ドメイン適応のための新しいMSDA手法を提案する。
複数の情報源からの情報を効率的に利用して、ディープFERモデルを単一のターゲット個人に適応させる。
論文 参考訳(メタデータ) (2023-12-09T18:40:37Z) - IIDM: Inter and Intra-domain Mixing for Semi-supervised Domain Adaptation in Semantic Segmentation [46.6002506426648]
教師なし領域適応(Unsupervised domain adapt, UDA)は、この問題を解決する主要なアプローチである。
この制限を克服するための半教師付きドメイン適応(SSDA)を提案する。
我々は、ドメイン間混合がソース・ターゲット領域ギャップを緩和し、ドメイン内混合が利用可能なターゲットドメイン情報を豊かにする、インター・ドメイン・ミキシング(IIDM)とイントラ・ドメイン・ミキシング(IIDM)の両方を組み込んだ新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2023-08-30T08:44:21Z) - Source-Free Domain Adaptation for Medical Image Segmentation via
Prototype-Anchored Feature Alignment and Contrastive Learning [57.43322536718131]
医用画像セグメンテーションのための2段階のソースフリードメイン適応(SFDA)フレームワークを提案する。
プロトタイプアンコールされた特徴アライメントの段階では,まず,事前学習した画素ワイド分類器の重みを原プロトタイプとして利用する。
そこで,本研究では,目標となる特徴とクラスプロトタイプとの整合性を期待するコストを最小化し,双方向輸送を導入する。
論文 参考訳(メタデータ) (2023-07-19T06:07:12Z) - ACT: Semi-supervised Domain-adaptive Medical Image Segmentation with
Asymmetric Co-training [34.017031149886556]
非教師なしドメイン適応(UDA)は、ソースとターゲットドメイン間のドメインシフトを軽減するために大いに研究されてきた。
本稿では,ラベル付けされていないターゲットデータに加えて,ラベル付きソースデータとターゲットドメインデータの両方を統一的に活用することを提案する。
本稿では、これらのサブセットを統合し、ソースドメインデータの支配を回避するための、新しい非対称コトレーニング(ACT)フレームワークを提案する。
論文 参考訳(メタデータ) (2022-06-05T23:48:00Z) - IDM: An Intermediate Domain Module for Domain Adaptive Person Re-ID [58.46907388691056]
ソースとターゲットドメイン間のブリッジは、UDA re-IDタスクに対処するために有効である、と我々は主張する。
中間ドメインの表現をオンザフライで生成するための中間ドメインモジュール(IDM)を提案する。
提案手法は,UDAのre-IDタスクに共通するタスクにおいて,最先端のタスクよりも大きなマージンで性能を向上する。
論文 参考訳(メタデータ) (2021-08-05T07:19:46Z) - Effective Label Propagation for Discriminative Semi-Supervised Domain
Adaptation [76.41664929948607]
半教師付き領域適応(SSDA)法は,大規模な画像分類タスクにおいて大きな可能性を示している。
本稿では、ドメイン間およびドメイン内セマンティック情報を効果的に伝達することにより、この問題に対処する新しい効果的な方法を提案する。
ソースコードと事前訓練されたモデルも間もなくリリースされる予定です。
論文 参考訳(メタデータ) (2020-12-04T14:28:19Z) - Adversarial Dual Distinct Classifiers for Unsupervised Domain Adaptation [67.83872616307008]
Unversarial Domain adaptation (UDA)は、異なる分散されたラベル付きソースドメインから学習モデルを構築することで、ラベルなしのターゲットサンプルを認識しようとする。
本稿では,タスク固有のカテゴリ境界に一致するソースとターゲット領域のデータ分布を同時に整合させる新しいアドリラルデュアル・ディスタンス・ネットワーク(AD$2$CN)を提案する。
具体的には、ドメイン不変の特徴発生器を利用して、識別的クロスドメインアライメントのガイダンスにより、ソースとターゲットデータを潜在共通空間に埋め込む。
論文 参考訳(メタデータ) (2020-08-27T01:29:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。