論文の概要: Towards Textual Out-of-Domain Detection without In-Domain Labels
- arxiv url: http://arxiv.org/abs/2203.11396v1
- Date: Tue, 22 Mar 2022 00:11:46 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-23 12:44:39.245004
- Title: Towards Textual Out-of-Domain Detection without In-Domain Labels
- Title(参考訳): ドメイン内ラベルを使わずにテキストによるドメイン外検出をめざして
- Authors: Di Jin, Shuyang Gao, Seokhwan Kim, Yang Liu, and Dilek Hakkani-Tur
- Abstract要約: この研究は、ドメイン内のデータのラベルにアクセスできないOOD検出の難しいケースに焦点を当てている。
まず、トークン列の確率を予測する異なる言語モデルに基づくアプローチを評価する。
教師なしクラスタリングとコントラスト学習を組み合わせた表現学習手法を提案する。
- 参考スコア(独自算出の注目度): 41.23096594140221
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: In many real-world settings, machine learning models need to identify user
inputs that are out-of-domain (OOD) so as to avoid performing wrong actions.
This work focuses on a challenging case of OOD detection, where no labels for
in-domain data are accessible (e.g., no intent labels for the intent
classification task). To this end, we first evaluate different language model
based approaches that predict likelihood for a sequence of tokens. Furthermore,
we propose a novel representation learning based method by combining
unsupervised clustering and contrastive learning so that better data
representations for OOD detection can be learned. Through extensive
experiments, we demonstrate that this method can significantly outperform
likelihood-based methods and can be even competitive to the state-of-the-art
supervised approaches with label information.
- Abstract(参考訳): 多くの実世界の環境では、機械学習モデルは間違ったアクションの実行を避けるために、ドメイン外(OOD)のユーザ入力を特定する必要がある。
本研究は、ドメイン内データのラベルにアクセスできない(例えば、インテント分類タスクのインテントラベルがない)ood検出の難しいケースに焦点を当てている。
そこで我々はまず,トークン列の確率を予測する異なる言語モデルに基づくアプローチを評価する。
さらに,教師なしクラスタリングとコントラスト学習を組み合わせた新しい表現学習手法を提案し,OOD検出のためのより良いデータ表現を学習できるようにした。
広範な実験を通じて,この手法は確率に基づく手法を著しく上回ることができ,ラベル情報を用いた最先端の教師付きアプローチにも対抗できることを実証する。
関連論文リスト
- Envisioning Outlier Exposure by Large Language Models for Out-of-Distribution Detection [71.93411099797308]
オープンワールドシナリオに機械学習モデルをデプロイする場合、アウト・オブ・ディストリビューション(OOD)サンプルは不可欠である。
本稿では,大規模言語モデル(LLM)の専門知識と推論能力を活用して,この制約に対処することを提案する。
EOEは、遠、近、きめ細かいOOD検出など、さまざまなタスクに一般化することができる。
EOEは様々なOODタスクで最先端のパフォーマンスを実現し、ImageNet-1Kデータセットに効果的にスケールできる。
論文 参考訳(メタデータ) (2024-06-02T17:09:48Z) - Finding Dino: A plug-and-play framework for unsupervised detection of out-of-distribution objects using prototypes [12.82756672393553]
ラベルを含まないPRototype-based zero-shot OOD Detection (PROWL)
ラベルなしのPROWL(PRototype-based zero-shot OOD Detection Without Labels)を提案する。
ドメインデータセットのトレーニングを必要としない推論ベースのメソッドである。
また、鉄道や海上のシーンなど他の領域にも適合することを示す。
論文 参考訳(メタデータ) (2024-04-11T11:55:42Z) - Out-of-Distribution Detection Using Peer-Class Generated by Large Language Model [0.0]
アウト・オブ・ディストリビューション(OOD)検出は、マシンラーニングモデルの信頼性とセキュリティを確保するための重要なタスクである。
本稿では,ODPCと呼ばれる新しい手法を提案し,大規模言語モデルを用いてOODピア・セマンティクスのクラスを生成する。
5つのベンチマークデータセットの実験により,提案手法は最先端の結果が得られることが示された。
論文 参考訳(メタデータ) (2024-03-20T06:04:05Z) - Semi-Supervised Object Detection in the Open World [16.274397329511192]
我々は、IDデータのみに基づいて訓練された軽量自動エンコーダネットワークからなるアンサンブルベースのOOD検出器を提案する。
提案手法は最先端のOOD検出アルゴリズムと競合し,オープンワールドシナリオにおける半教師付き学習性能を大幅に向上させる。
論文 参考訳(メタデータ) (2023-07-28T17:59:03Z) - Unsupervised Domain Adaptive Salient Object Detection Through
Uncertainty-Aware Pseudo-Label Learning [104.00026716576546]
そこで本研究では,手動のアノテーションを使わずに,自然に高いピクセルラベル品質を有する合成・クリーンなラベルから,サリエンスを学習することを提案する。
提案手法は,複数のベンチマークデータセット上で,既存の最先端の深層教師なしSOD法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-02-26T16:03:55Z) - Enhancing the Generalization for Intent Classification and Out-of-Domain
Detection in SLU [70.44344060176952]
インテント分類は、音声言語理解(SLU)における主要な課題である
近年の研究では、余分なデータやラベルを使用することで、OOD検出性能が向上することが示されている。
本稿では、IND意図分類とOOD検出の両方をサポートしながら、INDデータのみを用いてモデルを訓練することを提案する。
論文 参考訳(メタデータ) (2021-06-28T08:27:38Z) - Just Label What You Need: Fine-Grained Active Selection for Perception
and Prediction through Partially Labeled Scenes [78.23907801786827]
提案手法は,コストに配慮した手法と,部分的にラベル付けされたシーンを通じて詳細なサンプル選択を可能にする一般化を導入している。
実世界の大規模自動運転データセットに関する我々の実験は、微粒な選択が知覚、予測、下流計画タスクのパフォーマンスを向上させることを示唆している。
論文 参考訳(メタデータ) (2021-04-08T17:57:41Z) - Adversarial Knowledge Transfer from Unlabeled Data [62.97253639100014]
本稿では,インターネット規模の未ラベルデータから知識を伝達し,分類器の性能を向上させるための新しいAdversarial Knowledge Transferフレームワークを提案する。
我々の手法の重要な新しい側面は、ラベル付けされていないソースデータは、ラベル付けされたターゲットデータと異なるクラスであることができ、個別のプリテキストタスクを定義する必要がないことである。
論文 参考訳(メタデータ) (2020-08-13T08:04:27Z) - Likelihood Ratios and Generative Classifiers for Unsupervised
Out-of-Domain Detection In Task Oriented Dialog [24.653367921046442]
タスクベース対話システムに対する自然言語文入力のためのOOD検出に着目する。
公開データセットの4K OODサンプルのデータセットをSchusterらからリリースしています。
論文 参考訳(メタデータ) (2019-12-30T03:31:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。