論文の概要: Towards Textual Out-of-Domain Detection without In-Domain Labels
- arxiv url: http://arxiv.org/abs/2203.11396v1
- Date: Tue, 22 Mar 2022 00:11:46 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-23 12:44:39.245004
- Title: Towards Textual Out-of-Domain Detection without In-Domain Labels
- Title(参考訳): ドメイン内ラベルを使わずにテキストによるドメイン外検出をめざして
- Authors: Di Jin, Shuyang Gao, Seokhwan Kim, Yang Liu, and Dilek Hakkani-Tur
- Abstract要約: この研究は、ドメイン内のデータのラベルにアクセスできないOOD検出の難しいケースに焦点を当てている。
まず、トークン列の確率を予測する異なる言語モデルに基づくアプローチを評価する。
教師なしクラスタリングとコントラスト学習を組み合わせた表現学習手法を提案する。
- 参考スコア(独自算出の注目度): 41.23096594140221
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: In many real-world settings, machine learning models need to identify user
inputs that are out-of-domain (OOD) so as to avoid performing wrong actions.
This work focuses on a challenging case of OOD detection, where no labels for
in-domain data are accessible (e.g., no intent labels for the intent
classification task). To this end, we first evaluate different language model
based approaches that predict likelihood for a sequence of tokens. Furthermore,
we propose a novel representation learning based method by combining
unsupervised clustering and contrastive learning so that better data
representations for OOD detection can be learned. Through extensive
experiments, we demonstrate that this method can significantly outperform
likelihood-based methods and can be even competitive to the state-of-the-art
supervised approaches with label information.
- Abstract(参考訳): 多くの実世界の環境では、機械学習モデルは間違ったアクションの実行を避けるために、ドメイン外(OOD)のユーザ入力を特定する必要がある。
本研究は、ドメイン内データのラベルにアクセスできない(例えば、インテント分類タスクのインテントラベルがない)ood検出の難しいケースに焦点を当てている。
そこで我々はまず,トークン列の確率を予測する異なる言語モデルに基づくアプローチを評価する。
さらに,教師なしクラスタリングとコントラスト学習を組み合わせた新しい表現学習手法を提案し,OOD検出のためのより良いデータ表現を学習できるようにした。
広範な実験を通じて,この手法は確率に基づく手法を著しく上回ることができ,ラベル情報を用いた最先端の教師付きアプローチにも対抗できることを実証する。
関連論文リスト
- Collaborative Feature-Logits Contrastive Learning for Open-Set Semi-Supervised Object Detection [75.02249869573994]
オープンセットのシナリオでは、ラベルなしデータセットには、イン・ディストリビューション(ID)クラスとアウト・オブ・ディストリビューション(OOD)クラスの両方が含まれている。
このような設定で半教師付き検出器を適用すると、OODクラスをIDクラスとして誤分類する可能性がある。
我々は、CFL-Detector(Collaborative Feature-Logits Detector)と呼ばれるシンプルで効果的な方法を提案する。
論文 参考訳(メタデータ) (2024-11-20T02:57:35Z) - Pseudo-Label Enhanced Prototypical Contrastive Learning for Uniformed Intent Discovery [27.18799732585361]
Pseudo-Label enhanced Prototypeal Contrastive Learning (PLPCL) モデルを提案する。
擬似ラベルを用いて、表現とクラスタリングのギャップを埋めるコントラスト学習のための潜在的正・負のサンプルを探索する。
提案手法は,新たな意図を発見するための2つの異なる設定において有効であることが証明されている。
論文 参考訳(メタデータ) (2024-10-26T16:22:45Z) - Envisioning Outlier Exposure by Large Language Models for Out-of-Distribution Detection [71.93411099797308]
オープンワールドシナリオに機械学習モデルをデプロイする場合、アウト・オブ・ディストリビューション(OOD)サンプルは不可欠である。
本稿では,大規模言語モデル(LLM)の専門知識と推論能力を活用して,この制約に対処することを提案する。
EOEは、遠、近、きめ細かいOOD検出など、さまざまなタスクに一般化することができる。
EOEは様々なOODタスクで最先端のパフォーマンスを実現し、ImageNet-1Kデータセットに効果的にスケールできる。
論文 参考訳(メタデータ) (2024-06-02T17:09:48Z) - Finding Dino: A plug-and-play framework for unsupervised detection of out-of-distribution objects using prototypes [12.82756672393553]
ラベルを含まないPRototype-based zero-shot OOD Detection (PROWL)
ラベルなしのPROWL(PRototype-based zero-shot OOD Detection Without Labels)を提案する。
ドメインデータセットのトレーニングを必要としない推論ベースのメソッドである。
また、鉄道や海上のシーンなど他の領域にも適合することを示す。
論文 参考訳(メタデータ) (2024-04-11T11:55:42Z) - Out-of-Distribution Detection Using Peer-Class Generated by Large Language Model [0.0]
アウト・オブ・ディストリビューション(OOD)検出は、マシンラーニングモデルの信頼性とセキュリティを確保するための重要なタスクである。
本稿では,ODPCと呼ばれる新しい手法を提案し,大規模言語モデルを用いてOODピア・セマンティクスのクラスを生成する。
5つのベンチマークデータセットの実験により,提案手法は最先端の結果が得られることが示された。
論文 参考訳(メタデータ) (2024-03-20T06:04:05Z) - Enhancing the Generalization for Intent Classification and Out-of-Domain
Detection in SLU [70.44344060176952]
インテント分類は、音声言語理解(SLU)における主要な課題である
近年の研究では、余分なデータやラベルを使用することで、OOD検出性能が向上することが示されている。
本稿では、IND意図分類とOOD検出の両方をサポートしながら、INDデータのみを用いてモデルを訓練することを提案する。
論文 参考訳(メタデータ) (2021-06-28T08:27:38Z) - Just Label What You Need: Fine-Grained Active Selection for Perception
and Prediction through Partially Labeled Scenes [78.23907801786827]
提案手法は,コストに配慮した手法と,部分的にラベル付けされたシーンを通じて詳細なサンプル選択を可能にする一般化を導入している。
実世界の大規模自動運転データセットに関する我々の実験は、微粒な選択が知覚、予測、下流計画タスクのパフォーマンスを向上させることを示唆している。
論文 参考訳(メタデータ) (2021-04-08T17:57:41Z) - Adversarial Knowledge Transfer from Unlabeled Data [62.97253639100014]
本稿では,インターネット規模の未ラベルデータから知識を伝達し,分類器の性能を向上させるための新しいAdversarial Knowledge Transferフレームワークを提案する。
我々の手法の重要な新しい側面は、ラベル付けされていないソースデータは、ラベル付けされたターゲットデータと異なるクラスであることができ、個別のプリテキストタスクを定義する必要がないことである。
論文 参考訳(メタデータ) (2020-08-13T08:04:27Z) - Likelihood Ratios and Generative Classifiers for Unsupervised
Out-of-Domain Detection In Task Oriented Dialog [24.653367921046442]
タスクベース対話システムに対する自然言語文入力のためのOOD検出に着目する。
公開データセットの4K OODサンプルのデータセットをSchusterらからリリースしています。
論文 参考訳(メタデータ) (2019-12-30T03:31:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。