論文の概要: OodGAN: Generative Adversarial Network for Out-of-Domain Data Generation
- arxiv url: http://arxiv.org/abs/2104.02484v1
- Date: Tue, 6 Apr 2021 13:08:39 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-07 18:11:07.610703
- Title: OodGAN: Generative Adversarial Network for Out-of-Domain Data Generation
- Title(参考訳): OodGAN: ドメイン外データ生成のためのジェネレータネットワーク
- Authors: Petr Marek, Vishal Ishwar Naik, Vincent Auvray, Anuj Goyal
- Abstract要約: OodGANは、OODデータ生成のためのシーケンシャルジェネレーティブ・アドバーサリ・ネットワーク(SeqGAN)ベースのモデルである。
提案するモデルはテキスト上で直接動作するので,自動エンコーダを組み込む必要がなくなる。
- 参考スコア(独自算出の注目度): 1.0323063834827415
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Detecting an Out-of-Domain (OOD) utterance is crucial for a robust dialog
system. Most dialog systems are trained on a pool of annotated OOD data to
achieve this goal. However, collecting the annotated OOD data for a given
domain is an expensive process. To mitigate this issue, previous works have
proposed generative adversarial networks (GAN) based models to generate OOD
data for a given domain automatically. However, these proposed models do not
work directly with the text. They work with the text's latent space instead,
enforcing these models to include components responsible for encoding text into
latent space and decoding it back, such as auto-encoder. These components
increase the model complexity, making it difficult to train. We propose OodGAN,
a sequential generative adversarial network (SeqGAN) based model for OOD data
generation. Our proposed model works directly on the text and hence eliminates
the need to include an auto-encoder. OOD data generated using OodGAN model
outperforms state-of-the-art in OOD detection metrics for ROSTD (67% relative
improvement in FPR 0.95) and OSQ datasets (28% relative improvement in FPR
0.95) (Zheng et al., 2020).
- Abstract(参考訳): 堅牢なダイアログシステムでは,OOD(Out-of-Domain)発話の検出が重要である。
ほとんどのダイアログシステムは、この目標を達成するために注釈付きOODデータのプールで訓練されている。
しかし、あるドメインに対して注釈付きOODデータを収集するのは、高価なプロセスである。
この問題を軽減するため、従来の研究では、任意のドメインに対してOODデータを自動的に生成するGANベースのモデルが提案されている。
しかし、これらのモデルはテキストと直接的に連携しない。
代わりに、テキストの潜在空間で動作し、これらのモデルに潜在空間にテキストをエンコードし、オートエンコーダのようなデコードするコンポーネントを含むよう強制する。
これらのコンポーネントはモデルの複雑さを高め、トレーニングが困難になる。
我々は,OODデータ生成のための逐次生成逆数ネットワーク(SeqGAN)モデルであるOodGANを提案する。
提案するモデルはテキスト上で直接動作するので,自動エンコーダを組み込む必要がなくなる。
OodGANモデルを用いて生成されたOODデータは、ROSTD(FPR 0.95の67%の相対的な改善)とOSQデータセット(FPR 0.95の28%の相対的な改善)のOOD検出指標における最先端のOOD検出指標よりも優れています(Zheng et al., 2020)。
関連論文リスト
- Failing Forward: Improving Generative Error Correction for ASR with Synthetic Data and Retrieval Augmentation [73.9145653659403]
生成誤差補正モデルは、トレーニング中に発生する特定の種類のエラーを超えて一般化することが困難であることを示す。
DARAGは、ドメイン内(ID)およびOODシナリオにおけるASRのためのGCCを改善するために設計された新しいアプローチである。
私たちのアプローチはシンプルでスケーラブルで、ドメインと言語に依存しません。
論文 参考訳(メタデータ) (2024-10-17T04:00:29Z) - Can OOD Object Detectors Learn from Foundation Models? [56.03404530594071]
アウト・オブ・ディストリビューション(OOD)オブジェクト検出は、オープンセットのOODデータがないため、難しい課題である。
テキストから画像への生成モデルの最近の進歩に触発されて,大規模オープンセットデータを用いて訓練された生成モデルがOODサンプルを合成する可能性について検討した。
SyncOODは,大規模基盤モデルの能力を活用するシンプルなデータキュレーション手法である。
論文 参考訳(メタデータ) (2024-09-08T17:28:22Z) - AUTO: Adaptive Outlier Optimization for Online Test-Time OOD Detection [81.49353397201887]
オープンソースアプリケーションに機械学習モデルをデプロイするには、アウト・オブ・ディストリビューション(OOD)検出が不可欠だ。
我々は、未ラベルのオンラインデータをテスト時に直接利用してOOD検出性能を向上させる、テスト時OOD検出と呼ばれる新しいパラダイムを導入する。
本稿では,入出力フィルタ,IDメモリバンク,意味的に一貫性のある目的からなる適応外乱最適化(AUTO)を提案する。
論文 参考訳(メタデータ) (2023-03-22T02:28:54Z) - Out-of-distribution Detection with Implicit Outlier Transformation [72.73711947366377]
外周露光(OE)は、オフ・オブ・ディストリビューション(OOD)検出において強力である。
我々は,未確認のOOD状況に対してモデルの性能を良くする,新しいOEベースのアプローチを提案する。
論文 参考訳(メタデータ) (2023-03-09T04:36:38Z) - Self-augmented Data Selection for Few-shot Dialogue Generation [18.794770678708637]
我々は,MR-to-Text生成問題に対処するために,自己学習フレームワークを採用する。
我々は,我々の生成モデルが最も不確実なデータを選択するための新しいデータ選択戦略を提案する。
論文 参考訳(メタデータ) (2022-05-19T16:25:50Z) - Distributionally Robust Recurrent Decoders with Random Network
Distillation [93.10261573696788]
本稿では,自動回帰言語モデルが推論中にOODコンテキストを無視できるように,ランダムネットワーク蒸留を用いたOOD検出に基づく手法を提案する。
提案手法をGRUアーキテクチャに適用し,複数の言語モデリング(LM)データセットの改善を実証する。
論文 参考訳(メタデータ) (2021-10-25T19:26:29Z) - OODformer: Out-Of-Distribution Detection Transformer [15.17006322500865]
現実世界の安全クリティカルなアプリケーションでは、新しいデータポイントがOODであるかどうかを認識することが重要です。
本稿では,OODformer というファースト・オブ・ザ・キンドな OOD 検出アーキテクチャを提案する。
論文 参考訳(メタデータ) (2021-07-19T15:46:38Z) - Enhancing the Generalization for Intent Classification and Out-of-Domain
Detection in SLU [70.44344060176952]
インテント分類は、音声言語理解(SLU)における主要な課題である
近年の研究では、余分なデータやラベルを使用することで、OOD検出性能が向上することが示されている。
本稿では、IND意図分類とOOD検出の両方をサポートしながら、INDデータのみを用いてモデルを訓練することを提案する。
論文 参考訳(メタデータ) (2021-06-28T08:27:38Z) - EARLIN: Early Out-of-Distribution Detection for Resource-efficient
Collaborative Inference [4.826988182025783]
協調推論により、リソース制約のあるエッジデバイスは、入力をサーバにアップロードすることで推論を行うことができる。
このセットアップは、成功した推論のためにコスト効率よく機能するが、モデルがトレーニングされていない入力サンプルに直面すると、非常にパフォーマンスが低下する。
我々は,事前訓練されたCNNモデルの浅い層から重要な特徴を抽出する,新しい軽量OOD検出手法を提案する。
論文 参考訳(メタデータ) (2021-06-25T18:43:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。