論文の概要: DialogVCS: Robust Natural Language Understanding in Dialogue System
Upgrade
- arxiv url: http://arxiv.org/abs/2305.14751v1
- Date: Wed, 24 May 2023 05:53:38 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-25 19:19:49.085604
- Title: DialogVCS: Robust Natural Language Understanding in Dialogue System
Upgrade
- Title(参考訳): DialogVCS:対話システムアップグレードにおける頑健な自然言語理解
- Authors: Zefan Cai, Xin Zheng, Tianyu Liu, Xu Wang, Haoran Meng, Jiaqi Han,
Gang Yuan, Binghuai Lin, Baobao Chang and Yunbo Cao
- Abstract要約: 製品対話システムの定期的な更新では、実際のユーザからの新たなデータが既存のデータにマージされる。
新しい意図が出現し、既存の意図と意味的な絡み合いを持つかもしれない。
4つの対話バージョン管理データセット(VCS)からなる新しいベンチマークをセットアップする。
システム更新における不完全なデータによる意図検出を,肯定的かつ未定な意図を持つ多ラベル分類タスクとして定式化する。
- 参考スコア(独自算出の注目度): 36.433020605744986
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In the constant updates of the product dialogue systems, we need to retrain
the natural language understanding (NLU) model as new data from the real users
would be merged into the existent data accumulated in the last updates. Within
the newly added data, new intents would emerge and might have semantic
entanglement with the existing intents, e.g. new intents that are semantically
too specific or generic are actually subset or superset of some existing
intents in the semantic space, thus impairing the robustness of the NLU model.
As the first attempt to solve this problem, we setup a new benchmark consisting
of 4 Dialogue Version Control dataSets (DialogVCS). We formulate the intent
detection with imperfect data in the system update as a multi-label
classification task with positive but unlabeled intents, which asks the models
to recognize all the proper intents, including the ones with semantic
entanglement, in the inference. We also propose comprehensive baseline models
and conduct in-depth analyses for the benchmark, showing that the semantically
entangled intents can be effectively recognized with an automatic workflow.
- Abstract(参考訳): 製品対話システムの定期的な更新では、実際のユーザからの新たなデータが前回の更新で蓄積された既存のデータにマージされるため、自然言語理解(NLU)モデルを再訓練する必要があります。
新たに追加されたデータの中では、新しいインテントが出現し、既存のインテントとのセマンティックな絡み合いが生じ、例えば、意味的すぎるインテントやジェネリックなインテントは、実際にはセマンティック空間における既存のインテントのサブセットまたはスーパーセットであり、それによってNLUモデルの堅牢性を損なう可能性がある。
この問題を解決する最初の試みとして、4つの対話バージョン制御データセット(DialogVCS)からなる新しいベンチマークをセットアップする。
我々は,システム更新における不完全なデータによる意図検出を,肯定的ではあるがラベルのない意図を持った多ラベル分類タスクとして定式化し,推論において意味的絡み合いのあるものを含むすべての適切な意図を認識するようモデルに求める。
また,総合的なベースラインモデルを提案し,ベンチマークの詳細な分析を行い,意味的に絡み合った意図を自動ワークフローで効果的に認識できることを示した。
関連論文リスト
- IntentGPT: Few-shot Intent Discovery with Large Language Models [9.245106106117317]
我々は、新たな意図が現れると識別できるモデルを開発する。
IntentGPTは、Large Language Models (LLM) を効果的に促し、最小限のラベル付きデータで新しいインテントを発見する、トレーニング不要の手法である。
実験の結果,IntentGPTはドメイン固有データと微調整を必要とする従来の手法よりも優れていることがわかった。
論文 参考訳(メタデータ) (2024-11-16T02:16:59Z) - Can Your Model Tell a Negation from an Implicature? Unravelling
Challenges With Intent Encoders [24.42199777529863]
大きな言語モデル(LLM)は、プロンプトを使って埋め込み空間のセマンティクスを調整できる埋め込みを可能にする。
従来の評価ベンチマークは、セマンティック理解に関連するギャップを特に計測しないタスクメトリクスのみに依存しています。
インテント埋め込みモデルのより包括的なビューを提供するインテントセマンティックツールキットを提案する。
論文 参考訳(メタデータ) (2024-03-07T08:32:17Z) - Continuously Learning New Words in Automatic Speech Recognition [56.972851337263755]
本稿では,新たな単語認識のための自己教師付き連続学習手法を提案する。
過去の研究から,メモリ拡張型自動音声認識モデルを用いた。
提案手法により,新たな単語の出現頻度が高くなると,新たな単語のパフォーマンスが向上することを示す。
論文 参考訳(メタデータ) (2024-01-09T10:39:17Z) - Learning From Free-Text Human Feedback -- Collect New Datasets Or Extend
Existing Ones? [57.16050211534735]
一般的な対話データセットにおける自由文フィードバックのタイプと頻度について検討する。
この結果から, エラータイプ, ユーザ応答タイプ, それらの関係性など, 調査したデータセットの構成に関する新たな知見が得られた。
論文 参考訳(メタデータ) (2023-10-24T12:01:11Z) - SPACE-2: Tree-Structured Semi-Supervised Contrastive Pre-training for
Task-Oriented Dialog Understanding [68.94808536012371]
本稿では,限定ラベル付きダイアログと大規模未ラベルダイアログコーパスから対話表現を学習する,木構造付き事前学習会話モデルを提案する。
提案手法は,7つのデータセットと4つの一般的な対話理解タスクからなるDialoGLUEベンチマークにおいて,最新の結果が得られる。
論文 参考訳(メタデータ) (2022-09-14T13:42:50Z) - Redwood: Using Collision Detection to Grow a Large-Scale Intent
Classification Dataset [4.224157527132053]
意図分類システムでは、新しいスキルの意図のためのトレーニングデータが既に存在する意図と意味的に重なると問題が発生することがある。
本稿では,システムのスキルセットを育成するために,複数のデータセット間の意図的衝突検出タスクを紹介する。
そこで本研究では,意図衝突検出の必要性を強調するために,意図を調停しない方法で新たなデータを追加すると,モデル性能が損なわれることを示す。
論文 参考訳(メタデータ) (2022-04-12T02:28:23Z) - Synthesizing the Unseen for Zero-shot Object Detection [72.38031440014463]
そこで本研究では,視覚領域における視覚的特徴と視覚的対象の両方を学習するために,視覚的特徴を合成することを提案する。
クラスセマンティックスを用いた新しい生成モデルを用いて特徴を生成するだけでなく,特徴を識別的に分離する。
論文 参考訳(メタデータ) (2020-10-19T12:36:11Z) - Intent Mining from past conversations for conversational agent [1.9754522186574608]
ボットは、ラウンド・ザ・タイムのサポートと顧客エンゲージメントを高めるために、ますますデプロイされている。
商用ボット構築フレームワークの多くは、ユーザ入力を認識するためのインテントモデルの構築とトレーニングを必要とする標準的なアプローチに従っている。
我々は、不均衡なデータクラスタリングのための新しい密度ベースクラスタリングアルゴリズムITERDB-LabelSCANを導入した。
論文 参考訳(メタデータ) (2020-05-22T05:29:13Z) - Automatic Discovery of Novel Intents & Domains from Text Utterances [18.39942131996558]
本稿では,ラベルのない大量のデータから新しいドメインや意図を自動的に発見する新しいフレームワークADVINを提案する。
ADVINは3つのベンチマークデータセットのベースラインと、商用音声処理エージェントからの実際のユーザ発話を大きく上回る。
論文 参考訳(メタデータ) (2020-05-22T00:47:10Z) - AGIF: An Adaptive Graph-Interactive Framework for Joint Multiple Intent
Detection and Slot Filling [69.59096090788125]
本稿では,多目的検出とスロットフィリングを併用する適応グラフ対話フレームワーク(AGIF)を提案する。
スロットとインテントの強い相関関係をモデル化するために,インテント-スロットグラフ相互作用層を導入する。
このような相互作用層が各トークンに適応的に適用され、関連する意図情報を自動抽出する利点がある。
論文 参考訳(メタデータ) (2020-04-21T15:07:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。