論文の概要: Estimating Soft Labels for Out-of-Domain Intent Detection
- arxiv url: http://arxiv.org/abs/2211.05561v1
- Date: Thu, 10 Nov 2022 13:31:13 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-11 14:13:43.394912
- Title: Estimating Soft Labels for Out-of-Domain Intent Detection
- Title(参考訳): ドメイン外インテント検出のためのソフトラベル推定
- Authors: Hao Lang, Yinhe Zheng, Jian Sun, Fei Huang, Luo Si, Yongbin Li
- Abstract要約: Out-of-Domain (OOD)インテント検出は,実際の対話システムにおいて重要である。
擬似OODサンプルに対するソフトラベルを推定できる適応型ソフト擬似ラベル法(ASoul)を提案する。
- 参考スコア(独自算出の注目度): 122.68266151023676
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Out-of-Domain (OOD) intent detection is important for practical dialog
systems. To alleviate the issue of lacking OOD training samples, some works
propose synthesizing pseudo OOD samples and directly assigning one-hot OOD
labels to these pseudo samples. However, these one-hot labels introduce noises
to the training process because some hard pseudo OOD samples may coincide with
In-Domain (IND) intents. In this paper, we propose an adaptive soft pseudo
labeling (ASoul) method that can estimate soft labels for pseudo OOD samples
when training OOD detectors. Semantic connections between pseudo OOD samples
and IND intents are captured using an embedding graph. A co-training framework
is further introduced to produce resulting soft labels following the smoothness
assumption, i.e., close samples are likely to have similar labels. Extensive
experiments on three benchmark datasets show that ASoul consistently improves
the OOD detection performance and outperforms various competitive baselines.
- Abstract(参考訳): Out-of-Domain (OOD)インテント検出は,実際の対話システムにおいて重要である。
OODトレーニングサンプルの欠如を緩和するために、擬似OODサンプルを合成し、これらの擬似サンプルにワンホットOODラベルを直接割り当てることを提案する研究もある。
しかし、これらのシングルホットラベルは、ハード擬似OODサンプルがIn-Domain(IND)インテントと一致する可能性があるため、トレーニングプロセスにノイズをもたらす。
本稿では,OOD検出器のトレーニングにおいて,擬似OODサンプルのソフトラベルを推定できる適応型ソフト擬似ラベル法を提案する。
擬似OODサンプルとINDインテント間の意味的接続を埋め込みグラフを用いてキャプチャする。
さらに、滑らかさの仮定に従い、結果として生じるソフトラベルを生成するためのコトレーニングフレームワーク、すなわち、近接サンプルは類似のラベルを持つ可能性が高い。
3つのベンチマークデータセットの大規模な実験によると、ASoulはOOD検出性能を一貫して改善し、さまざまな競合ベースラインを上回っている。
関連論文リスト
- APP: Adaptive Prototypical Pseudo-Labeling for Few-shot OOD Detection [40.846633965439956]
本稿では、少数のラベル付きINDデータと大量のラベル付き混合データしか存在しない、数ショットのOOD設定に焦点を当てる。
数発のOOD検出のためのアダプティブ擬似ラベル法(APP)を提案する。
論文 参考訳(メタデータ) (2023-10-20T09:48:52Z) - Pseudo Outlier Exposure for Out-of-Distribution Detection using
Pretrained Transformers [3.8839179829686126]
拒否ネットワークは、テストOODサンプルを検出するために、IDと多様な外れ値サンプルで訓練することができる。
本稿では,Pseudo Outlier Exposure (POE) と呼ばれる手法を提案する。
本手法は外部OODデータを一切必要とせず,既製のトランスフォーマーで容易に実装できる。
論文 参考訳(メタデータ) (2023-07-18T17:29:23Z) - Out-of-Domain Intent Detection Considering Multi-Turn Dialogue Contexts [91.43701971416213]
我々は,OODインテント検出タスクにおけるマルチターンコンテキストをモデル化するためのコンテキスト認識型OODインテント検出(Caro)フレームワークを提案する。
CaroはF1-OODスコアを29%以上改善することで、マルチターンOOD検出タスクの最先端性能を確立している。
論文 参考訳(メタデータ) (2023-05-05T01:39:21Z) - Unsupervised Evaluation of Out-of-distribution Detection: A Data-centric
Perspective [55.45202687256175]
アウト・オブ・ディストリビューション(OOD)検出法は、個々のテストサンプルがイン・ディストリビューション(IND)なのかOODなのかという、試験対象の真実を持っていると仮定する。
本稿では,OOD検出における教師なし評価問題を初めて紹介する。
我々は,OOD検出性能の教師なし指標としてGscoreを計算する3つの方法を提案する。
論文 参考訳(メタデータ) (2023-02-16T13:34:35Z) - Exploiting Mixed Unlabeled Data for Detecting Samples of Seen and Unseen
Out-of-Distribution Classes [5.623232537411766]
現実世界のアプリケーションでは、アウト・オブ・ディストリビューション(OOD)検出が不可欠であり、近年注目を集めている。
既存のOOD検出方法は、多くのラベル付きIn-Distribution(ID)データを必要とするため、大量のラベル付けコストが発生する。
本稿では,限られたラベル付きデータと豊富なラベル付きデータが利用可能な,より現実的なシナリオに焦点を当てる。
混合ラベル付きデータから潜在的なIDとOODサンプルを適応的に選択する適応型In-Out-Aware Learning(AIOL)法を提案する。
論文 参考訳(メタデータ) (2022-10-13T08:34:25Z) - Label Smoothed Embedding Hypothesis for Out-of-Distribution Detection [72.35532598131176]
我々は,$k$-NN 密度推定値を用いて OOD サンプルを検出する教師なし手法を提案する。
emphLabel Smoothed Embedding hypothesis と呼ばれるラベル平滑化に関する最近の知見を活用する。
提案手法は,多くのOODベースラインを上回り,新しい有限サンプル高確率統計結果を提供することを示す。
論文 参考訳(メタデータ) (2021-02-09T21:04:44Z) - On The Consistency Training for Open-Set Semi-Supervised Learning [44.046578996049654]
我々は,OODサンプルが低次元空間と高次元空間のトレーニングに与える影響について検討した。
提案手法はOODサンプルをよりよく利用し,最先端の結果を得る。
論文 参考訳(メタデータ) (2021-01-19T12:38:17Z) - Learn what you can't learn: Regularized Ensembles for Transductive
Out-of-distribution Detection [76.39067237772286]
ニューラルネットワークの現在のアウト・オブ・ディストリビューション(OOD)検出アルゴリズムは,様々なOOD検出シナリオにおいて不満足な結果をもたらすことを示す。
本稿では,テストデータのバッチを観察した後に検出方法を調整することで,このような「ハード」なOODシナリオがいかに有用かを検討する。
本稿では,テストデータと正規化に人工ラベリング手法を用いて,テストバッチ内のOODサンプルに対してのみ矛盾予測を生成するモデルのアンサンブルを求める手法を提案する。
論文 参考訳(メタデータ) (2020-12-10T16:55:13Z) - Multi-Task Curriculum Framework for Open-Set Semi-Supervised Learning [54.85397562961903]
ラベル付きデータに制限がある場合に、ラベルなしデータを利用して強力なモデルをトレーニングする半教師付き学習(SSL)が提案されている。
我々は、Open-set SSLと呼ばれるより複雑な新しいシナリオに対処する。
提案手法は,OOD試料の効果を除去し,最先端の結果を得る。
論文 参考訳(メタデータ) (2020-07-22T10:33:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。