論文の概要: Estimating Soft Labels for Out-of-Domain Intent Detection
- arxiv url: http://arxiv.org/abs/2211.05561v1
- Date: Thu, 10 Nov 2022 13:31:13 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-11 14:13:43.394912
- Title: Estimating Soft Labels for Out-of-Domain Intent Detection
- Title(参考訳): ドメイン外インテント検出のためのソフトラベル推定
- Authors: Hao Lang, Yinhe Zheng, Jian Sun, Fei Huang, Luo Si, Yongbin Li
- Abstract要約: Out-of-Domain (OOD)インテント検出は,実際の対話システムにおいて重要である。
擬似OODサンプルに対するソフトラベルを推定できる適応型ソフト擬似ラベル法(ASoul)を提案する。
- 参考スコア(独自算出の注目度): 122.68266151023676
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Out-of-Domain (OOD) intent detection is important for practical dialog
systems. To alleviate the issue of lacking OOD training samples, some works
propose synthesizing pseudo OOD samples and directly assigning one-hot OOD
labels to these pseudo samples. However, these one-hot labels introduce noises
to the training process because some hard pseudo OOD samples may coincide with
In-Domain (IND) intents. In this paper, we propose an adaptive soft pseudo
labeling (ASoul) method that can estimate soft labels for pseudo OOD samples
when training OOD detectors. Semantic connections between pseudo OOD samples
and IND intents are captured using an embedding graph. A co-training framework
is further introduced to produce resulting soft labels following the smoothness
assumption, i.e., close samples are likely to have similar labels. Extensive
experiments on three benchmark datasets show that ASoul consistently improves
the OOD detection performance and outperforms various competitive baselines.
- Abstract(参考訳): Out-of-Domain (OOD)インテント検出は,実際の対話システムにおいて重要である。
OODトレーニングサンプルの欠如を緩和するために、擬似OODサンプルを合成し、これらの擬似サンプルにワンホットOODラベルを直接割り当てることを提案する研究もある。
しかし、これらのシングルホットラベルは、ハード擬似OODサンプルがIn-Domain(IND)インテントと一致する可能性があるため、トレーニングプロセスにノイズをもたらす。
本稿では,OOD検出器のトレーニングにおいて,擬似OODサンプルのソフトラベルを推定できる適応型ソフト擬似ラベル法を提案する。
擬似OODサンプルとINDインテント間の意味的接続を埋め込みグラフを用いてキャプチャする。
さらに、滑らかさの仮定に従い、結果として生じるソフトラベルを生成するためのコトレーニングフレームワーク、すなわち、近接サンプルは類似のラベルを持つ可能性が高い。
3つのベンチマークデータセットの大規模な実験によると、ASoulはOOD検出性能を一貫して改善し、さまざまな競合ベースラインを上回っている。
関連論文リスト
- COOD: Concept-based Zero-shot OOD Detection [12.361461338978732]
ゼロショットマルチラベルOOD検出フレームワークであるCOODを紹介する。
ラベルごとに肯定的概念と否定的概念の両方で意味空間を豊かにすることにより、我々のアプローチは複雑なラベル依存をモデル化する。
提案手法は既存のアプローチよりも優れており,VOCとデータセットの両方で平均95%のAUROCを実現している。
論文 参考訳(メタデータ) (2024-11-15T08:15:48Z) - Rethinking the Evaluation of Out-of-Distribution Detection: A Sorites Paradox [70.57120710151105]
既存のアウト・オブ・ディストリビューション(OOD)検出ベンチマークは、サンプルを新しいラベルでOODデータとして分類する。
いくつかの限界OODサンプルは、実際には分布内(ID)サンプルに密接なセマンティック内容を持ち、OODサンプルをソリテスパラドックス(英語版)と判定する。
この問題に対処するため,Incremental Shift OOD (IS-OOD) というベンチマークを構築した。
論文 参考訳(メタデータ) (2024-06-14T09:27:56Z) - Negative Label Guided OOD Detection with Pretrained Vision-Language Models [96.67087734472912]
Out-of-distriion (OOD) は未知のクラスからサンプルを識別することを目的としている。
我々は,大規模なコーパスデータベースから大量の負のラベルを抽出する,NegLabelと呼ばれる新しいポストホックOOD検出手法を提案する。
論文 参考訳(メタデータ) (2024-03-29T09:19:52Z) - APP: Adaptive Prototypical Pseudo-Labeling for Few-shot OOD Detection [40.846633965439956]
本稿では、少数のラベル付きINDデータと大量のラベル付き混合データしか存在しない、数ショットのOOD設定に焦点を当てる。
数発のOOD検出のためのアダプティブ擬似ラベル法(APP)を提案する。
論文 参考訳(メタデータ) (2023-10-20T09:48:52Z) - Pseudo Outlier Exposure for Out-of-Distribution Detection using
Pretrained Transformers [3.8839179829686126]
拒否ネットワークは、テストOODサンプルを検出するために、IDと多様な外れ値サンプルで訓練することができる。
本稿では,Pseudo Outlier Exposure (POE) と呼ばれる手法を提案する。
本手法は外部OODデータを一切必要とせず,既製のトランスフォーマーで容易に実装できる。
論文 参考訳(メタデータ) (2023-07-18T17:29:23Z) - Label Smoothed Embedding Hypothesis for Out-of-Distribution Detection [72.35532598131176]
我々は,$k$-NN 密度推定値を用いて OOD サンプルを検出する教師なし手法を提案する。
emphLabel Smoothed Embedding hypothesis と呼ばれるラベル平滑化に関する最近の知見を活用する。
提案手法は,多くのOODベースラインを上回り,新しい有限サンプル高確率統計結果を提供することを示す。
論文 参考訳(メタデータ) (2021-02-09T21:04:44Z) - On The Consistency Training for Open-Set Semi-Supervised Learning [44.046578996049654]
我々は,OODサンプルが低次元空間と高次元空間のトレーニングに与える影響について検討した。
提案手法はOODサンプルをよりよく利用し,最先端の結果を得る。
論文 参考訳(メタデータ) (2021-01-19T12:38:17Z) - Learn what you can't learn: Regularized Ensembles for Transductive
Out-of-distribution Detection [76.39067237772286]
ニューラルネットワークの現在のアウト・オブ・ディストリビューション(OOD)検出アルゴリズムは,様々なOOD検出シナリオにおいて不満足な結果をもたらすことを示す。
本稿では,テストデータのバッチを観察した後に検出方法を調整することで,このような「ハード」なOODシナリオがいかに有用かを検討する。
本稿では,テストデータと正規化に人工ラベリング手法を用いて,テストバッチ内のOODサンプルに対してのみ矛盾予測を生成するモデルのアンサンブルを求める手法を提案する。
論文 参考訳(メタデータ) (2020-12-10T16:55:13Z) - Multi-Task Curriculum Framework for Open-Set Semi-Supervised Learning [54.85397562961903]
ラベル付きデータに制限がある場合に、ラベルなしデータを利用して強力なモデルをトレーニングする半教師付き学習(SSL)が提案されている。
我々は、Open-set SSLと呼ばれるより複雑な新しいシナリオに対処する。
提案手法は,OOD試料の効果を除去し,最先端の結果を得る。
論文 参考訳(メタデータ) (2020-07-22T10:33:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。