論文の概要: ASSIST: Towards Label Noise-Robust Dialogue State Tracking
- arxiv url: http://arxiv.org/abs/2202.13024v1
- Date: Sat, 26 Feb 2022 00:33:32 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-04 11:00:28.240113
- Title: ASSIST: Towards Label Noise-Robust Dialogue State Tracking
- Title(参考訳): ASSIST: ラベルノイズ・ロバスト対話状態追跡を目指して
- Authors: Fanghua Ye, Yue Feng, Emine Yilmaz
- Abstract要約: 本稿では,雑音ラベルから対話状態追跡モデルを頑健に学習するためのASSISTを提案する。
ASSISTはDSTのゴール精度を初期バージョンのMultiWOZ 2.0で最大28.16%、最新バージョンのMultiWOZ 2.4で最大8.41%改善している。
- 参考スコア(独自算出の注目度): 19.742274632152366
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The MultiWOZ 2.0 dataset has greatly boosted the research on dialogue state
tracking (DST). However, substantial noise has been discovered in its state
annotations. Such noise brings about huge challenges for training DST models
robustly. Although several refined versions, including MultiWOZ 2.1-2.4, have
been published recently, there are still lots of noisy labels, especially in
the training set. Besides, it is costly to rectify all the problematic
annotations. In this paper, instead of improving the annotation quality
further, we propose a general framework, named ASSIST (lAbel noiSe-robuSt
dIalogue State Tracking), to train DST models robustly from noisy labels.
ASSIST first generates pseudo labels for each sample in the training set by
using an auxiliary model trained on a small clean dataset, then puts the
generated pseudo labels and vanilla noisy labels together to train the primary
model. We show the validity of ASSIST theoretically. Experimental results also
demonstrate that ASSIST improves the joint goal accuracy of DST by up to
$28.16\%$ on the initial version MultiWOZ 2.0 and $8.41\%$ on the latest
version MultiWOZ 2.4, respectively.
- Abstract(参考訳): multiwoz 2.0データセットは対話状態追跡(dst)の研究を大きく促進した。
しかし、その状態アノテーションからかなりのノイズが発見されている。
このようなノイズは、DSTモデルを堅牢にトレーニングする上で大きな課題をもたらします。
multiwoz 2.1-2.4を含むいくつかの改良版が最近出版されているが、特にトレーニングセットではノイズの多いラベルが多数残されている。
さらに、問題のあるアノテーションをすべて修正するのはコストがかかる。
本稿では、アノテーションの品質をさらに向上させる代わりに、雑音ラベルからDSTモデルを堅牢に訓練するための一般的なフレームワークであるASSIST(lAbel noiSe-robuSt dIalogue State Tracking)を提案する。
ASSISTはまず、小さなクリーンデータセットでトレーニングされた補助モデルを使用してトレーニングセットの各サンプルの擬似ラベルを生成し、生成した擬似ラベルとバニラノイズラベルをまとめて一次モデルをトレーニングする。
理論的にはASSISTの有効性を示す。
実験の結果、ASSISTは、MultiWOZ 2.0の初期バージョンでは最大28.16 %、最新バージョンでは8.41 %、DSTの目標精度は最大28.16 %向上した。
関連論文リスト
- Label-Noise Robust Diffusion Models [18.82847557713331]
条件拡散モデルは、様々な生成タスクにおいて顕著な性能を示した。
訓練には、条件付き入力でしばしばノイズを含む大規模なデータセット、すなわちノイズラベルが必要である。
本稿では,雑音ラベル付き条件付き拡散モデルの学習のための遷移対応重み付きDenoising Score Matchingを提案する。
論文 参考訳(メタデータ) (2024-02-27T14:00:34Z) - Robust Tiny Object Detection in Aerial Images amidst Label Noise [50.257696872021164]
本研究は,ノイズラベル管理下での微小物体検出の問題に対処する。
本稿では,DN-TOD(Denoising Tiny Object Detector)を提案する。
本手法は,1段と2段の両方のオブジェクト検出パイプラインにシームレスに統合できる。
論文 参考訳(メタデータ) (2024-01-16T02:14:33Z) - Label-Retrieval-Augmented Diffusion Models for Learning from Noisy
Labels [61.97359362447732]
ノイズの多いラベルからの学習は、実際のアプリケーションのための機械学習において、重要かつ長年にわたる問題である。
本稿では,生成モデルの観点からラベルノイズ問題を再構成する。
我々のモデルは、標準的な実世界のベンチマークデータセットで新しいSOTA(State-of-the-art)結果を達成する。
論文 参考訳(メタデータ) (2023-05-31T03:01:36Z) - MetaASSIST: Robust Dialogue State Tracking with Meta Learning [15.477794753452358]
既存の対話データセットには、状態アノテーションに多くのノイズが含まれている。
ASSISTという名前の一般的なフレームワークは、最近、堅牢な対話状態追跡(DST)モデルをトレーニングするために提案されている。
重み付けパラメータを適応的に学習するメタ学習ベースのMetaASSISTを提案する。
論文 参考訳(メタデータ) (2022-10-22T09:14:45Z) - Neighborhood Collective Estimation for Noisy Label Identification and
Correction [92.20697827784426]
ノイズラベルを用いた学習(LNL)は,ノイズラベルに対するモデルオーバーフィットの効果を軽減し,モデル性能と一般化を改善するための戦略を設計することを目的としている。
近年の進歩は、個々のサンプルのラベル分布を予測し、ノイズ検証とノイズラベル補正を行い、容易に確認バイアスを生じさせる。
提案手法では, 候補サンプルの予測信頼性を, 特徴空間近傍と対比することにより再推定する。
論文 参考訳(メタデータ) (2022-08-05T14:47:22Z) - Sample Prior Guided Robust Model Learning to Suppress Noisy Labels [8.119439844514973]
本稿では,サンプルの事前知識を発生させることで雑音を抑えるための深層モデルの学習を行う新しいフレームワークPGDFを提案する。
我々のフレームワークは、より有益なハードクリーンなサンプルをクリーンにラベル付けされたセットに保存することができる。
我々は,CIFAR-10とCIFAR-100に基づく合成データセットと,WebVisionとChrothing1Mを用いた実世界のデータセットを用いて評価を行った。
論文 参考訳(メタデータ) (2021-12-02T13:09:12Z) - Learning with Noisy Labels Revisited: A Study Using Real-World Human
Annotations [54.400167806154535]
ノイズラベルを用いた学習に関する既存の研究は、主に合成ラベルノイズに焦点を当てている。
本研究は2つの新しいベンチマークデータセット(CIFAR-10N, CIFAR-100N)を示す。
実世界のノイズラベルは古典的に採用されたクラス依存のラベルではなく、インスタンス依存のパターンに従うことを示す。
論文 参考訳(メタデータ) (2021-10-22T22:42:11Z) - An Ensemble Noise-Robust K-fold Cross-Validation Selection Method for
Noisy Labels [0.9699640804685629]
大規模なデータセットには、ディープニューラルネットワーク(DNN)によって記憶されるような、ラベルのずれたサンプルが含まれている傾向があります。
本稿では, ノイズデータからクリーンなサンプルを効果的に選択するために, アンサンブルノイズ・ロバスト K-fold Cross-Validation Selection (E-NKCVS) を提案する。
我々は,ラベルが手動で異なる雑音比で破損した様々な画像・テキスト分類タスクに対するアプローチを評価する。
論文 参考訳(メタデータ) (2021-07-06T02:14:52Z) - Training Classifiers that are Universally Robust to All Label Noise
Levels [91.13870793906968]
ディープニューラルネットワークは、ラベルノイズの存在下で過度に適合する傾向がある。
ポジティヴ・アンラベルラーニングの新たなサブカテゴリを取り入れた蒸留ベースのフレームワークを提案する。
我々の枠組みは概して中~高騒音レベルにおいて優れています。
論文 参考訳(メタデータ) (2021-05-27T13:49:31Z) - MultiWOZ 2.4: A Multi-Domain Task-Oriented Dialogue Dataset with
Essential Annotation Corrections to Improve State Tracking Evaluation [22.642643471824076]
この作業ではMultiWOZ 2.4を導入し、MultiWOZ 2.1上でバリデーションセットとテストセットのすべてのアノテーションを洗練する。
トレーニングセットのアノテーションは、堅牢でノイズ耐性のあるモデルトレーニングを促進するために変わっていない。
さらに8つの最先端の対話状態追跡モデルをベンチマークする。
論文 参考訳(メタデータ) (2021-04-01T21:31:48Z) - Improving Limited Labeled Dialogue State Tracking with Self-Supervision [91.68515201803986]
既存の対話状態追跡(DST)モデルには多くのラベル付きデータが必要である。
本稿では,潜在的一貫性の維持と対話行動のモデル化という,自己指導型の2つの目的について検討する。
提案する自己教師型信号は,1%のラベル付きデータのみを使用する場合,関節ゴール精度を8.95%向上させることができる。
論文 参考訳(メタデータ) (2020-10-26T21:57:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。