論文の概要: Automatic Discovery of Novel Intents & Domains from Text Utterances
- arxiv url: http://arxiv.org/abs/2006.01208v1
- Date: Fri, 22 May 2020 00:47:10 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-30 09:33:23.545916
- Title: Automatic Discovery of Novel Intents & Domains from Text Utterances
- Title(参考訳): テキスト発話からの新たな意図とドメインの自動発見
- Authors: Nikhita Vedula, Rahul Gupta, Aman Alok, Mukund Sridhar
- Abstract要約: 本稿では,ラベルのない大量のデータから新しいドメインや意図を自動的に発見する新しいフレームワークADVINを提案する。
ADVINは3つのベンチマークデータセットのベースラインと、商用音声処理エージェントからの実際のユーザ発話を大きく上回る。
- 参考スコア(独自算出の注目度): 18.39942131996558
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: One of the primary tasks in Natural Language Understanding (NLU) is to
recognize the intents as well as domains of users' spoken and written language
utterances. Most existing research formulates this as a supervised
classification problem with a closed-world assumption, i.e. the domains or
intents to be identified are pre-defined or known beforehand. Real-world
applications however increasingly encounter dynamic, rapidly evolving
environments with newly emerging intents and domains, about which no
information is known during model training. We propose a novel framework,
ADVIN, to automatically discover novel domains and intents from large volumes
of unlabeled data. We first employ an open classification model to identify all
utterances potentially consisting of a novel intent. Next, we build a knowledge
transfer component with a pairwise margin loss function. It learns
discriminative deep features to group together utterances and discover multiple
latent intent categories within them in an unsupervised manner. We finally
hierarchically link mutually related intents into domains, forming an
intent-domain taxonomy. ADVIN significantly outperforms baselines on three
benchmark datasets, and real user utterances from a commercial voice-powered
agent.
- Abstract(参考訳): 自然言語理解(NLU)の主要な課題の1つは、ユーザの話し言葉と書かれた言語発話のドメインと同様に意図を認識することである。
既存の研究の多くは、これを閉世界仮定による教師付き分類問題として定式化している。
しかし、実世界のアプリケーションはますます動的で急速に発展する環境に遭遇し、新たな意図やドメインが出現し、モデルトレーニング中に情報が知られていない。
本稿では,ラベルのない大量のデータから新しいドメインや意図を自動的に発見する新しいフレームワークADVINを提案する。
まずオープンな分類モデルを用いて、新しい意図からなる可能性のある全ての発話を識別する。
次に,ペアリーズマージン損失関数を用いた知識伝達コンポーネントを構築する。
識別的な深い特徴を学習し、発話をグループ化し、教師なしの方法で複数の潜在意図カテゴリーを発見する。
最後に、相互に関連づけられたインテントをドメインに階層的にリンクし、インテント-ドメイン分類を形成する。
ADVINは3つのベンチマークデータセットのベースラインと、商用音声処理エージェントからの実際のユーザ発話を大きく上回る。
関連論文リスト
- Towards Open-Domain Topic Classification [69.21234350688098]
ユーザが定義した分類をリアルタイムで受け入れるオープンドメイントピック分類システムを導入する。
ユーザは、任意の候補ラベルに対してテキストスニペットを分類し、Webインターフェースから即座にレスポンスを受け取ることができます。
論文 参考訳(メタデータ) (2023-06-29T20:25:28Z) - Tri-level Joint Natural Language Understanding for Multi-turn
Conversational Datasets [5.3361357265365035]
本稿では,新しい三段階共同自然言語理解手法,ドメインの追加,意味情報をすべてのレベル間で明示的に交換する手法を提案する。
我々は,2つのマルチターンデータセットを用いて,共同スロット充填とインテント検出を行った最初のモデルとして評価を行った。
論文 参考訳(メタデータ) (2023-05-28T13:59:58Z) - Few-Shot Object Detection in Unseen Domains [4.36080478413575]
Few-shot Object Detection (FSOD)は、データ制限のある新しいオブジェクトクラスを学ぶために近年発展している。
そこで本稿では,ドメイン固有の情報をすべて考慮し,新しいクラスを数枚追加する手法を提案する。
T-LESSデータセットを用いた実験により,提案手法はドメインギャップを著しく緩和することに成功した。
論文 参考訳(メタデータ) (2022-04-11T13:16:41Z) - Open Domain Question Answering over Virtual Documents: A Unified
Approach for Data and Text [62.489652395307914]
我々は、知識集約型アプリケーションのための構造化知識を符号化する手段として、Data-to-text法、すなわち、オープンドメイン質問応答(QA)を用いる。
具体的には、ウィキペディアとウィキソースの3つのテーブルを付加知識源として使用する、データとテキスト上でのオープンドメインQAのための冗長化-レトリバー・リーダー・フレームワークを提案する。
UDT-QA(Unified Data and Text QA)は,知識インデックスの拡大を効果的に活用できることを示す。
論文 参考訳(メタデータ) (2021-10-16T00:11:21Z) - Discover, Hallucinate, and Adapt: Open Compound Domain Adaptation for
Semantic Segmentation [91.30558794056056]
意味的セグメンテーションのための教師なしドメイン適応(UDA)が近年注目を集めている。
我々は,発見,幻覚,適応の3つの主要な設計原則に基づく新しいフレームワークを提案する。
我々は、標準ベンチマークGTAからC自動運転へのソリューションの評価を行い、新しい最先端の結果を得た。
論文 参考訳(メタデータ) (2021-10-08T13:20:09Z) - Structured Latent Embeddings for Recognizing Unseen Classes in Unseen
Domains [108.11746235308046]
本稿では,異なる領域からの画像を投影することで,ドメインに依存しない遅延埋め込みを学習する手法を提案する。
挑戦的なDomainNetとDomainNet-LSベンチマークの実験は、既存のメソッドよりもアプローチの方が優れていることを示している。
論文 参考訳(メタデータ) (2021-07-12T17:57:46Z) - Enhancing the Generalization for Intent Classification and Out-of-Domain
Detection in SLU [70.44344060176952]
インテント分類は、音声言語理解(SLU)における主要な課題である
近年の研究では、余分なデータやラベルを使用することで、OOD検出性能が向上することが示されている。
本稿では、IND意図分類とOOD検出の両方をサポートしながら、INDデータのみを用いてモデルを訓練することを提案する。
論文 参考訳(メタデータ) (2021-06-28T08:27:38Z) - Inferring Latent Domains for Unsupervised Deep Domain Adaptation [54.963823285456925]
Unsupervised Domain Adaptation (UDA)は、ラベル付きデータが利用できないターゲットドメインでモデルを学習する問題を指す。
本稿では,視覚データセット中の潜在ドメインを自動的に発見することにより,udaの問題に対処する新しい深層アーキテクチャを提案する。
提案手法を公開ベンチマークで評価し,最先端のドメイン適応手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-03-25T14:33:33Z) - Learning to Select Context in a Hierarchical and Global Perspective for
Open-domain Dialogue Generation [15.01710843286394]
階層的自己保持機構と遠隔監視を備えた新しいモデルを提案し、関連する単語と発話を短距離および長距離で検出する。
私たちのモデルは、流速、コヒーレンス、および情報性の観点から他のベースラインを大幅に上回ります。
論文 参考訳(メタデータ) (2021-02-18T11:56:42Z) - Linguistically-Enriched and Context-Aware Zero-shot Slot Filling [6.06746295810681]
スロット充填は、現代のタスク指向ダイアログシステムの最も重要な課題の1つです。
新たなドメイン(すなわち、トレーニングの見当たらない)がデプロイ後に出現する可能性がある。
モデルがシームレスに適応し、見えないドメインと見えないドメインの両方からスロットを埋めることは必須である。
論文 参考訳(メタデータ) (2021-01-16T20:18:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。