論文の概要: Unsupervised Out-of-Distribution Dialect Detection with Mahalanobis
Distance
- arxiv url: http://arxiv.org/abs/2308.04886v1
- Date: Wed, 9 Aug 2023 11:33:53 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-10 14:03:29.786627
- Title: Unsupervised Out-of-Distribution Dialect Detection with Mahalanobis
Distance
- Title(参考訳): マハラノビス距離を用いた非教師なし分布弁別検出
- Authors: Sourya Dipta Das, Yash Vadi, Abhishek Unnam, Kuldeep Yadav
- Abstract要約: 展開された方言分類モデルは、トレーニングデータ分布とは異なる異常な入力に遭遇することができる。
アウト・オブ・ディストリビューション検出は、方言分類の文脈においてほとんど注目されていない新しい研究領域である。
本稿では, 分布外サンプルを検出するために, 単純かつ効果的なマハラノビス距離特徴量に基づく手法を提案する。
- 参考スコア(独自算出の注目度): 6.358196724648596
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Dialect classification is used in a variety of applications, such as machine
translation and speech recognition, to improve the overall performance of the
system. In a real-world scenario, a deployed dialect classification model can
encounter anomalous inputs that differ from the training data distribution,
also called out-of-distribution (OOD) samples. Those OOD samples can lead to
unexpected outputs, as dialects of those samples are unseen during model
training. Out-of-distribution detection is a new research area that has
received little attention in the context of dialect classification. Towards
this, we proposed a simple yet effective unsupervised Mahalanobis distance
feature-based method to detect out-of-distribution samples. We utilize the
latent embeddings from all intermediate layers of a wav2vec 2.0
transformer-based dialect classifier model for multi-task learning. Our
proposed approach outperforms other state-of-the-art OOD detection methods
significantly.
- Abstract(参考訳): ダイアレクト分類は、機械翻訳や音声認識などの様々な応用において、システム全体の性能を改善するために用いられる。
実世界のシナリオでは、デプロイされた方言分類モデルは、トレーニングデータ分布とは異なる異常な入力に遭遇する可能性がある。
これらのOODサンプルは、モデルトレーニング中にそのサンプルの方言が見えないため、予期せぬ出力につながる可能性がある。
アウト・オブ・ディストリビューション検出は、方言分類の文脈においてほとんど注目されていない新しい研究領域である。
そこで本研究では,非教師なしマハラノビス距離特徴量に基づく簡易な分布外サンプル検出法を提案する。
マルチタスク学習には,wav2vec 2.0トランスフォーマタを用いた方言分類モデルのすべての中間層からの潜在埋め込みを利用する。
提案手法は、他の最先端のOOD検出方法よりも優れている。
関連論文リスト
- DPU: Dynamic Prototype Updating for Multimodal Out-of-Distribution Detection [10.834698906236405]
機械学習モデルの堅牢性を保証するためには、アウト・オブ・ディストリビューション(OOD)検出が不可欠である。
マルチモーダルモデルの最近の進歩は、検出性能を高めるために複数のモダリティを活用する可能性を示している。
マルチモーダルOOD検出のための新しいプラグイン・アンド・プレイフレームワークであるDynamic Prototype Updating (DPU)を提案する。
論文 参考訳(メタデータ) (2024-11-12T22:43:16Z) - Downstream-Pretext Domain Knowledge Traceback for Active Learning [138.02530777915362]
本稿では、下流知識と事前学習指導のデータ相互作用をトレースするダウンストリーム・プレテキスト・ドメイン知識トレース(DOKT)手法を提案する。
DOKTは、トレースバックの多様性指標とドメインベースの不確実性推定器から構成される。
10のデータセットで行った実験は、我々のモデルが他の最先端の手法よりも優れていることを示している。
論文 参考訳(メタデータ) (2024-07-20T01:34:13Z) - Out-of-Distribution Detection with a Single Unconditional Diffusion Model [54.15132801131365]
アウト・オブ・ディストリビューション(OOD)検出は、異常サンプルを特定しようとする機械学習において重要なタスクである。
従来、教師なし手法はOOD検出に深い生成モデルを用いていた。
本稿では,単一モデルが多様なタスクに対してOOD検出を行うことができるかどうかを考察する。
論文 参考訳(メタデータ) (2024-05-20T08:54:03Z) - Out-of-Distribution Detection Using Peer-Class Generated by Large Language Model [0.0]
アウト・オブ・ディストリビューション(OOD)検出は、マシンラーニングモデルの信頼性とセキュリティを確保するための重要なタスクである。
本稿では,ODPCと呼ばれる新しい手法を提案し,大規模言語モデルを用いてOODピア・セマンティクスのクラスを生成する。
5つのベンチマークデータセットの実験により,提案手法は最先端の結果が得られることが示された。
論文 参考訳(メタデータ) (2024-03-20T06:04:05Z) - Learning to Adapt to Domain Shifts with Few-shot Samples in Anomalous
Sound Detection [7.631596468553607]
異常検出は、産業機器の監視など、多くの重要な応用がある。
サンプルの少ない新しい条件に適応するフレームワークを提案する。
提案手法は,最近リリースされた各種機械の音響測定データセットを用いて評価する。
論文 参考訳(メタデータ) (2022-04-05T00:22:25Z) - WOOD: Wasserstein-based Out-of-Distribution Detection [6.163329453024915]
ディープ・ニューラル・ネットワークに基づく分類器のトレーニングデータは、通常同じ分布からサンプリングされる。
トレーニングサンプルから遠く離れた分布からテストサンプルの一部を引き出すと、トレーニングされたニューラルネットワークはこれらのOODサンプルに対して高い信頼性の予測を行う傾向にある。
本稿では,これらの課題を克服するため,Wasserstein を用いたアウト・オブ・ディストリビューション検出(WOOD)手法を提案する。
論文 参考訳(メタデータ) (2021-12-13T02:35:15Z) - Distributionally Robust Recurrent Decoders with Random Network
Distillation [93.10261573696788]
本稿では,自動回帰言語モデルが推論中にOODコンテキストを無視できるように,ランダムネットワーク蒸留を用いたOOD検出に基づく手法を提案する。
提案手法をGRUアーキテクチャに適用し,複数の言語モデリング(LM)データセットの改善を実証する。
論文 参考訳(メタデータ) (2021-10-25T19:26:29Z) - Types of Out-of-Distribution Texts and How to Detect Them [4.854346360117765]
OODの例は背景変化か意味変化かによって分類する。
モデルキャリブレーションと密度推定という2つの主要なOOD検出手法が,これらのOODデータに対して異なる挙動を示すことがわかった。
本研究の結果は,OODのサンプルを,異なる検出方法を評価する際に明確な定義を求めるものである。
論文 参考訳(メタデータ) (2021-09-14T17:12:38Z) - Visualizing Classifier Adjacency Relations: A Case Study in Speaker
Verification and Voice Anti-Spoofing [72.4445825335561]
任意のバイナリ分類器によって生成される検出スコアから2次元表現を導出する簡単な方法を提案する。
ランク相関に基づいて,任意のスコアを用いた分類器の視覚的比較を容易にする。
提案手法は完全に汎用的であり,任意の検出タスクに適用可能だが,自動話者検証と音声アンチスプーフィングシステムによるスコアを用いた手法を実証する。
論文 参考訳(メタデータ) (2021-06-11T13:03:33Z) - On Sampling-Based Training Criteria for Neural Language Modeling [97.35284042981675]
我々はモンテカルロサンプリング、重要サンプリング、補償部分和と呼ばれる新しい方法、およびノイズコントラスト推定を検討する。
対象のクラス後部確率を補正しさえすれば,これらすべてのサンプリング手法が同等に動作可能であることを示す。
Switchboard と LibriSpeech における言語モデリングと音声認識の実験結果が,我々の主張を支持した。
論文 参考訳(メタデータ) (2021-04-21T12:55:52Z) - Unsupervised Anomaly Detection with Adversarial Mirrored AutoEncoders [51.691585766702744]
本稿では,識別器のミラー化ワッサースタイン損失を利用して,よりセマンティックレベルの再構築を行う逆自動エンコーダの変種を提案する。
我々は,再建基準の代替として,異常スコアの代替尺度を提案した。
提案手法は,OOD検出ベンチマークにおける異常検出の最先端手法よりも優れている。
論文 参考訳(メタデータ) (2020-03-24T08:26:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。