論文の概要: Example-Driven Intent Prediction with Observers
- arxiv url: http://arxiv.org/abs/2010.08684v2
- Date: Tue, 25 May 2021 02:09:16 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-06 09:01:50.900412
- Title: Example-Driven Intent Prediction with Observers
- Title(参考訳): オブザーバによるサンプル駆動インテント予測
- Authors: Shikib Mehri and Mihail Eric
- Abstract要約: 本稿では,対話システムに宛てた発話に対して,ユーザの意図を識別することを目的とした意図分類問題に焦点をあてる。
本稿では,(1)観察者および(2)サンプル駆動学習という,発話分類モデルの一般化性向上のための2つのアプローチを提案する。
- 参考スコア(独自算出の注目度): 15.615065041164629
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: A key challenge of dialog systems research is to effectively and efficiently
adapt to new domains. A scalable paradigm for adaptation necessitates the
development of generalizable models that perform well in few-shot settings. In
this paper, we focus on the intent classification problem which aims to
identify user intents given utterances addressed to the dialog system. We
propose two approaches for improving the generalizability of utterance
classification models: (1) observers and (2) example-driven training. Prior
work has shown that BERT-like models tend to attribute a significant amount of
attention to the [CLS] token, which we hypothesize results in diluted
representations. Observers are tokens that are not attended to, and are an
alternative to the [CLS] token as a semantic representation of utterances.
Example-driven training learns to classify utterances by comparing to examples,
thereby using the underlying encoder as a sentence similarity model. These
methods are complementary; improving the representation through observers
allows the example-driven model to better measure sentence similarities. When
combined, the proposed methods attain state-of-the-art results on three intent
prediction datasets (\textsc{banking77}, \textsc{clinc150}, \textsc{hwu64}) in
both the full data and few-shot (10 examples per intent) settings. Furthermore,
we demonstrate that the proposed approach can transfer to new intents and
across datasets without any additional training.
- Abstract(参考訳): ダイアログシステム研究の重要な課題は、新しいドメインに効果的かつ効率的に適応することである。
適応のためのスケーラブルなパラダイムは、少数の設定でうまく機能する汎用モデルの開発を必要とする。
本稿では,対話システムに対する発話に対するユーザの意図を識別することを目的とした意図分類問題に着目する。
発話分類モデルの一般化性を改善するために,(1)オブザーバと(2)サンプル駆動トレーニングという2つのアプローチを提案する。
従来の研究によると、BERTのようなモデルは[CLS]トークンにかなりの注意を払っている傾向があり、その結果は希薄表現となる。
オブザーバは参加していないトークンであり、発話の意味表現としての[CLS]トークンの代替である。
例駆動学習は、例と比較することで発話を分類し、基礎となるエンコーダを文類似性モデルとして利用する。
これらの手法は相補的であり、オブザーバによる表現の改善により、サンプル駆動モデルは文の類似度をよりよく測定できる。
提案手法は,3つの意図予測データセット (\textsc{banking77}, \textsc{clinc150}, \textsc{hwu64}) に対して,全データと少数ショット (インテント当たり10例) の両方で最先端の結果が得られる。
さらに,提案手法は,新たなインテントやデータセット間で,新たなトレーニングを必要とせずに移行できることを実証する。
関連論文リスト
- Prefer to Classify: Improving Text Classifiers via Auxiliary Preference
Learning [76.43827771613127]
本稿では、このような補助データアノテーションの新しい代替手段として、入力テキストのペア間のタスク固有の嗜好について検討する。
本稿では、与えられた分類課題と補助的選好の両方を学ぶことの協調効果を享受できる、P2Cと呼ばれる新しいマルチタスク学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-06-08T04:04:47Z) - Generalization Properties of Retrieval-based Models [50.35325326050263]
検索ベースの機械学習手法は、幅広い問題で成功をおさめた。
これらのモデルの約束を示す文献が増えているにもかかわらず、そのようなモデルの理論的基盤はいまだに解明されていない。
本稿では,その一般化能力を特徴付けるために,検索ベースモデルの形式的処理を行う。
論文 参考訳(メタデータ) (2022-10-06T00:33:01Z) - An Additive Instance-Wise Approach to Multi-class Model Interpretation [53.87578024052922]
解釈可能な機械学習は、ブラックボックスシステムの特定の予測を駆動する要因に関する洞察を提供する。
既存の手法は主に、局所的な加法的あるいはインスタンス的なアプローチに従う説明的入力特徴の選択に重点を置いている。
本研究は,両手法の長所を生かし,複数の対象クラスに対する局所的な説明を同時に学習するためのグローバルフレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-07T06:50:27Z) - Distant finetuning with discourse relations for stance classification [55.131676584455306]
そこで本研究では,定位分類のモデルとして,原文から銀ラベルでデータを抽出し,微調整する手法を提案する。
また,様々な段階において微調整に用いるデータのノイズレベルが減少する3段階のトレーニングフレームワークを提案する。
NLPCC 2021共有タスクArgumentative Text Understanding for AI Debaterでは,26の競合チームの中で1位にランクインした。
論文 参考訳(メタデータ) (2022-04-27T04:24:35Z) - Layer-wise Analysis of a Self-supervised Speech Representation Model [26.727775920272205]
自己教師付き学習アプローチは、音声表現モデルの事前学習に成功している。
事前訓練された表現そのものに符号化された情報のタイプや範囲についてはあまり研究されていない。
論文 参考訳(メタデータ) (2021-07-10T02:13:25Z) - Adaptive Prototypical Networks with Label Words and Joint Representation
Learning for Few-Shot Relation Classification [17.237331828747006]
本研究は,少ショット関係分類(FSRC)に焦点を当てる。
クラスプロトタイプの表現にラベル単語を追加するための適応的混合機構を提案する。
FewRelでは、異なる数ショット(FS)設定で実験が行われた。
論文 参考訳(メタデータ) (2021-01-10T11:25:42Z) - Explaining and Improving Model Behavior with k Nearest Neighbor
Representations [107.24850861390196]
モデルの予測に責任のあるトレーニング例を特定するために, k 近傍表現を提案する。
我々は,kNN表現が学習した素因関係を明らかにするのに有効であることを示す。
以上の結果から,kNN手法により,直交モデルが逆入力に対してより堅牢であることが示唆された。
論文 参考訳(メタデータ) (2020-10-18T16:55:25Z) - Learning What Makes a Difference from Counterfactual Examples and
Gradient Supervision [57.14468881854616]
ニューラルネットワークの一般化能力を改善するための補助的学習目標を提案する。
我々は、異なるラベルを持つ最小差の例のペア、すなわち反ファクトまたはコントラストの例を使用し、タスクの根底にある因果構造を示す信号を与える。
このテクニックで訓練されたモデルは、配布外テストセットのパフォーマンスを向上させる。
論文 参考訳(メタデータ) (2020-04-20T02:47:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。