論文の概要: Source -Free Domain Adaptation for Speaker Verification in Data-Scarce Languages and Noisy Channels
- arxiv url: http://arxiv.org/abs/2406.05863v1
- Date: Sun, 9 Jun 2024 17:27:20 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-11 17:38:03.692736
- Title: Source -Free Domain Adaptation for Speaker Verification in Data-Scarce Languages and Noisy Channels
- Title(参考訳): データスカース言語と雑音チャネルにおける話者検証のための音源自由領域適応
- Authors: Shlomo Salo Elia, Aviad Malachi, Vered Aharonson, Gadi Pinkas,
- Abstract要約: ドメイン適応はしばしば、非常に小さなターゲットデータセットとアクセス不能なソースデータによって妨げられる。
本稿では,データスカース言語における話者検証のための限られたターゲット音声データセットへのソースフリー領域適応手法について検討する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Domain adaptation is often hampered by exceedingly small target datasets and inaccessible source data. These conditions are prevalent in speech verification, where privacy policies and/or languages with scarce speech resources limit the availability of sufficient data. This paper explored techniques of sourcefree domain adaptation unto a limited target speech dataset for speaker verificationin data-scarce languages. Both language and channel mis-match between source and target were investigated. Fine-tuning methods were evaluated and compared across different sizes of labeled target data. A novel iterative cluster-learn algorithm was studied for unlabeled target datasets.
- Abstract(参考訳): ドメイン適応はしばしば、非常に小さなターゲットデータセットとアクセス不能なソースデータによって妨げられる。
これらの条件は、プライバシーポリシーや音声リソースが乏しい言語が十分なデータの入手を制限しているような、音声検証において一般的である。
本稿では,データスカース言語における話者検証のための限られたターゲット音声データセットへのソースフリー領域適応手法について検討する。
ソースとターゲット間の言語的ミスマッチとチャネル的ミスマッチについて検討した。
ラベル付き対象データの異なるサイズでファインチューニング法を評価し,比較した。
未ラベルのターゲットデータセットに対して,新しい反復的クラスタラーンアルゴリズムについて検討した。
関連論文リスト
- Employing Sentence Space Embedding for Classification of Data Stream from Fake News Domain [0.24999074238880487]
本稿では,文空間法を用いた自然言語データストリーム分類手法を提案する。
画像分類専用の畳み込みディープネットワークを使用することで、テキストデータに基づいてフェイクニュースを認識できる。
実生活のFakedditデータセットに基づいて,提案手法をデータストリーム分類のための最先端アルゴリズムと比較した。
論文 参考訳(メタデータ) (2024-07-15T15:23:21Z) - Hate Speech Detection in Limited Data Contexts using Synthetic Data
Generation [1.9506923346234724]
本稿では,限られたデータコンテキストにおいて,オンラインヘイトスピーチ検出のためのデータ不足の問題に対処するデータ拡張手法を提案する。
対象言語におけるヘイトスピーチデータの新しい例を合成する3つの方法を提案する。
以上の結果から, 合成データを用いたモデルでは, 対象領域で利用可能なサンプルに対してのみ学習したモデルが比較可能であり, 性能が良好である場合も見いだされた。
論文 参考訳(メタデータ) (2023-10-04T15:10:06Z) - Evaluating the Effectiveness of Natural Language Inference for Hate
Speech Detection in Languages with Limited Labeled Data [2.064612766965483]
ゼロおよび少数ショット設定で良好に機能する自然言語推論(NLI)モデルは、ヘイトスピーチ検出性能の恩恵を受ける。
対象言語における直接微調整よりも,NLI微調整の性能が向上したことを示す。
論文 参考訳(メタデータ) (2023-06-06T14:40:41Z) - Automatic Data Augmentation for Domain Adapted Fine-Tuning of
Self-Supervised Speech Representations [21.423349835589793]
SSL(Self-Supervised Learning)は、大量のラベルのない音声データを活用して音声認識モデルの性能を向上させる。
これにもかかわらず、プレトレーニングとターゲットデータセットの音響ミスマッチに直面しながら、音声SSL表現が失敗する可能性がある。
音響領域におけるそのようなミスマッチを示すケースを対象とした,新しい教師付きドメイン適応手法を提案する。
論文 参考訳(メタデータ) (2023-06-01T09:30:49Z) - Spatio-Temporal Pixel-Level Contrastive Learning-based Source-Free
Domain Adaptation for Video Semantic Segmentation [117.39092621796753]
Source Domain Adaptation(SFDA)セットアップは、ソースデータにアクセスすることなく、ターゲットドメインにソーストレーニングされたモデルを適用することを目的としている。
情報源データの欠如に対処するために,時間情報の相関を最大限に活用する新しい手法を提案する。
実験によると、PixelLは現在のUDAやFDAのアプローチと比較して、ベンチマークの非最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2023-03-25T05:06:23Z) - Divide and Contrast: Source-free Domain Adaptation via Adaptive
Contrastive Learning [122.62311703151215]
Divide and Contrast (DaC) は、それぞれの制限を回避しつつ、両方の世界の善良な端を接続することを目的としている。
DaCは、ターゲットデータをソースライクなサンプルとターゲット固有なサンプルに分割する。
さらに、ソースライクなドメインと、メモリバンクベースの最大平均離散性(MMD)損失を用いて、ターゲット固有のサンプルとを整合させて、分散ミスマッチを低減する。
論文 参考訳(メタデータ) (2022-11-12T09:21:49Z) - Contextual information integration for stance detection via
cross-attention [59.662413798388485]
スタンス検出は、著者の目標に対する姿勢を特定することを扱う。
既存のスタンス検出モデルの多くは、関連するコンテキスト情報を考慮していないため、制限されている。
文脈情報をテキストとして統合する手法を提案する。
論文 参考訳(メタデータ) (2022-11-03T15:04:29Z) - Addressing the Challenges of Cross-Lingual Hate Speech Detection [115.1352779982269]
本稿では,低リソース言語におけるヘイトスピーチ検出を支援するために,言語間移動学習に着目した。
言語間単語の埋め込みを利用して、ソース言語上でニューラルネットワークシステムをトレーニングし、ターゲット言語に適用します。
本研究では,ヘイトスピーチデータセットのラベル不均衡の問題について検討する。なぜなら,ヘイトサンプルと比較して非ヘイトサンプルの比率が高いことがモデル性能の低下につながることが多いからだ。
論文 参考訳(メタデータ) (2022-01-15T20:48:14Z) - Conditional Extreme Value Theory for Open Set Video Domain Adaptation [17.474956295874797]
本稿では,ソースとターゲットデータ間の領域差を軽減するために,オープンセットの映像領域適応手法を提案する。
負の伝達問題を緩和するために、サンプルエントロピーからしきい値までの距離によって計算された重みを、対向学習に活用する。
提案手法は,小規模と大規模の両方のクロスドメインビデオデータセットに対して徹底的に評価されている。
論文 参考訳(メタデータ) (2021-09-01T10:51:50Z) - OVANet: One-vs-All Network for Universal Domain Adaptation [78.86047802107025]
既存のメソッドは、検証または未知のサンプルの事前定義された比率に基づいて未知のサンプルを拒否するしきい値を手動で設定します。
本稿では,ソースサンプルを用いて閾値を学習し,対象領域に適応する手法を提案する。
私たちの考えは、ソースドメインの最小クラス間距離は、ターゲットの既知のか未知かを決定するための良いしきい値であるべきです。
論文 参考訳(メタデータ) (2021-04-07T18:36:31Z) - Source Data-absent Unsupervised Domain Adaptation through Hypothesis
Transfer and Labeling Transfer [137.36099660616975]
Unsupervised Adapt Adaptation (UDA) は、関連性のある異なるラベル付きソースドメインから新しいラベルなしターゲットドメインへの知識の転送を目標としている。
既存のudaメソッドの多くはソースデータへのアクセスを必要としており、プライバシ上の懸念からデータが機密で共有できない場合は適用できない。
本稿では、ソースデータにアクセスする代わりに、トレーニング済みの分類モデルのみを用いて現実的な設定に取り組むことを目的とする。
論文 参考訳(メタデータ) (2020-12-14T07:28:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。