論文の概要: Data Augmentation for Copy-Mechanism in Dialogue State Tracking
- arxiv url: http://arxiv.org/abs/2002.09634v1
- Date: Sat, 22 Feb 2020 05:40:32 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-29 19:29:42.492678
- Title: Data Augmentation for Copy-Mechanism in Dialogue State Tracking
- Title(参考訳): 対話状態追跡におけるコピー機構のためのデータ拡張
- Authors: Xiaohui Song, Liangjun Zang, Yipeng Su, Xing Wu, Jizhong Han and
Songlin Hu
- Abstract要約: 対話状態追跡(DST)のための共通複写機構モデルの一般化能力に影響を与える要因を明らかにする。
ユーザ発話をコピーし、実際のスロット値をランダムに生成した文字列に置き換えることで、入力データセットを増強する。
- 参考スコア(独自算出の注目度): 30.768655511224527
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While several state-of-the-art approaches to dialogue state tracking (DST)
have shown promising performances on several benchmarks, there is still a
significant performance gap between seen slot values (i.e., values that occur
in both training set and test set) and unseen ones (values that occur in
training set but not in test set). Recently, the copy-mechanism has been widely
used in DST models to handle unseen slot values, which copies slot values from
user utterance directly. In this paper, we aim to find out the factors that
influence the generalization ability of a common copy-mechanism model for DST.
Our key observations include: 1) the copy-mechanism tends to memorize values
rather than infer them from contexts, which is the primary reason for
unsatisfactory generalization performance; 2) greater diversity of slot values
in the training set increase the performance on unseen values but slightly
decrease the performance on seen values. Moreover, we propose a simple but
effective algorithm of data augmentation to train copy-mechanism models, which
augments the input dataset by copying user utterances and replacing the real
slot values with randomly generated strings. Users could use two
hyper-parameters to realize a trade-off between the performances on seen values
and unseen ones, as well as a trade-off between overall performance and
computational cost. Experimental results on three widely used datasets (WoZ
2.0, DSTC2, and Multi-WoZ 2.0) show the effectiveness of our approach.
- Abstract(参考訳): 対話状態追跡(DST)に対する最先端のアプローチはいくつかのベンチマークで有望な性能を示しているが、スロット値(トレーニングセットとテストセットの両方で発生する値)と未確認値(トレーニングセットでは発生するが、テストセットでは発生しない値)の間には、依然として大きなパフォーマンスギャップがある。
近年、DSTモデルでは、ユーザ発話から直接スロット値をコピーする未確認スロット値を扱うために、コピー機構が広く使われている。
本稿では,DSTの共通複写機構モデルの一般化能力に影響を与える要因を明らかにすることを目的とする。
私たちの重要な観察は
1)複写機械主義は,文脈から推測するよりも価値を記憶する傾向にあり,それが不満足な一般化性能の主な理由である。
2) トレーニングセットにおけるスロット値の多様性は未確認値の性能を増加させるが, 観測値のパフォーマンスはわずかに低下する。
さらに,ユーザの発話をコピーし,実際のスロット値をランダムに生成された文字列に置き換えることで,入力データセットを拡張できるコピー機械モデルの学習に,データ拡張の単純かつ効果的なアルゴリズムを提案する。
ユーザは2つのハイパーパラメータを使用して、目に見えない値のパフォーマンスと、全体のパフォーマンスと計算コストの間のトレードオフを実現することができる。
3つのデータセット(woz 2.0、dstc2、multi-woz 2.0)の実験結果は、このアプローチの有効性を示している。
関連論文リスト
- TIGER: Time-frequency Interleaved Gain Extraction and Reconstruction for Efficient Speech Separation [19.126525226518975]
パラメータと計算コストを大幅に削減した音声分離モデルを提案する。
TIGERは事前の知識を活用して周波数帯域を分割し、周波数情報を圧縮する。
我々は、TIGERが、最先端(SOTA)モデルTF-GridNetを上回る性能を達成することを示す。
論文 参考訳(メタデータ) (2024-10-02T12:21:06Z) - JPAVE: A Generation and Classification-based Model for Joint Product
Attribute Prediction and Value Extraction [59.94977231327573]
JPAVEと呼ばれる値生成/分類と属性予測を備えたマルチタスク学習モデルを提案する。
我々のモデルの2つの変種は、オープンワールドとクローズドワールドのシナリオのために設計されている。
公開データセットにおける実験結果は,強いベースラインと比較して,我々のモデルが優れていることを示す。
論文 参考訳(メタデータ) (2023-11-07T18:36:16Z) - Free-text Keystroke Authentication using Transformers: A Comparative
Study of Architectures and Loss Functions [1.0152838128195467]
キーストロークバイオメトリックスは、個人のタイピング行動におけるユニークなパターンを活用する、ユーザ識別と検証のための有望なアプローチである。
本稿では,キーストロークシーケンスから情報的特徴を抽出する自己注意型トランスフォーマーネットワークを提案する。
我々のモデルは、フリーテキストキーストローク認証における従来の最先端技術を上回る。
論文 参考訳(メタデータ) (2023-10-18T00:34:26Z) - Retrieval-Enhanced Contrastive Vision-Text Models [61.783728119255365]
そこで本研究では,メモリから取得したクロスモーダルな情報を推論時に表現することで,その埋め込みを洗練できる視覚テキストモデルを提案する。
注目すべきことに、これは凍ったCLIPの上に軽量の単層核融合トランスを用いて行うことができる。
検索強化コントラスト訓練(RECO)がCLIPの性能を大幅に向上することを示す。
論文 参考訳(メタデータ) (2023-06-12T15:52:02Z) - Value function estimation using conditional diffusion models for control [62.27184818047923]
拡散値関数(DVF)と呼ばれる単純なアルゴリズムを提案する。
拡散モデルを用いて環境-ロボット相互作用の連成多段階モデルを学ぶ。
本稿では,DVFを用いて複数のコントローラの状態を効率よく把握する方法を示す。
論文 参考訳(メタデータ) (2023-06-09T18:40:55Z) - DOAD: Decoupled One Stage Action Detection Network [77.14883592642782]
人々をローカライズし、ビデオからアクションを認識することは、ハイレベルなビデオ理解にとって難しい課題だ。
既存の手法は主に2段階ベースで、1段階は人物境界ボックス生成、もう1段階は行動認識を行う。
本稿では、時間的行動検出の効率を向上させるために、DOADと呼ばれる分離したワンステージネットワークを提案する。
論文 参考訳(メタデータ) (2023-04-01T08:06:43Z) - On the Eigenvalues of Global Covariance Pooling for Fine-grained Visual
Recognition [65.67315418971688]
グローバル共分散プーリング(GCP)の小さな固有値をトラッピングすることで、よりスムーズな勾配が得られることを示す。
きめ細かいデータセットでは、小さな固有値の切り抜きは、モデルを収束させるのに失敗する。
この観測から着想を得て,小さな固有値の重要性を拡大するネットワーク分岐を提案する。
論文 参考訳(メタデータ) (2022-05-26T11:41:36Z) - Efficient Two-Stage Detection of Human-Object Interactions with a Novel
Unary-Pairwise Transformer [41.44769642537572]
Unary-Pairwise Transformerは、HOIのユニタリおよびペアワイズ表現を利用する2段階の検出器である。
本手法はHICO-DETおよびV-COCOデータセット上で評価し,最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2021-12-03T10:52:06Z) - Few-Shot Named Entity Recognition: A Comprehensive Study [92.40991050806544]
マルチショット設定のモデル一般化能力を向上させるための3つの手法を検討する。
ラベル付きデータの比率の異なる10の公開nerデータセットについて経験的比較を行う。
マルチショットとトレーニングフリーの両方の設定で最新の結果を作成します。
論文 参考訳(メタデータ) (2020-12-29T23:43:16Z) - A Fast and Robust BERT-based Dialogue State Tracker for Schema-Guided
Dialogue Dataset [8.990035371365408]
本稿では,目標指向対話システムにおける状態追跡のための高速かつ堅牢なBERTベースモデルであるFastSGTを紹介する。
提案モデルは自然言語記述を含むGuided Dialogueデータセットのために設計されている。
本モデルでは,精度を著しく向上しつつ,計算およびメモリ消費の面で効率を保っている。
論文 参考訳(メタデータ) (2020-08-27T18:51:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。