論文の概要: Few Shot Dialogue State Tracking using Meta-learning
- arxiv url: http://arxiv.org/abs/2101.06779v2
- Date: Sat, 23 Jan 2021 21:08:04 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-27 21:54:39.596704
- Title: Few Shot Dialogue State Tracking using Meta-learning
- Title(参考訳): メタラーニングを用いたショット対話状態追跡
- Authors: Saket Dingliwal, Bill Gao, Sanchit Agarwal, Chien-Wei Lin, Tagyoung
Chung, Dilek Hakkani-Tur
- Abstract要約: 対話状態追跡(dst)は、ホテル、タクシー予約、観光情報など特定の目的のために設計された自動化システムのコアコンポーネントを形成する。
このようなシステムを新しいドメインにデプロイする必要性が高まっているため、ゼロ/フェーショットDSTの問題を解決する必要がある。
提案するメタラーナーは基礎モデルに依存しないため,既存のDSTシステムはトレーニング戦略を用いて未知領域の性能を向上させることができる。
- 参考スコア(独自算出の注目度): 3.6292310166028403
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Dialogue State Tracking (DST) forms a core component of automated chatbot
based systems designed for specific goals like hotel, taxi reservation, tourist
information, etc. With the increasing need to deploy such systems in new
domains, solving the problem of zero/few-shot DST has become necessary. There
has been a rising trend for learning to transfer knowledge from resource-rich
domains to unknown domains with minimal need for additional data. In this work,
we explore the merits of meta-learning algorithms for this transfer and hence,
propose a meta-learner D-REPTILE specific to the DST problem. With extensive
experimentation, we provide clear evidence of benefits over conventional
approaches across different domains, methods, base models, and datasets with
significant (5-25%) improvement over the baseline in a low-data setting. Our
proposed meta-learner is agnostic of the underlying model and hence any
existing state-of-the-art DST system can improve its performance on unknown
domains using our training strategy.
- Abstract(参考訳): 対話状態追跡(DST)は、ホテル、タクシー予約、観光情報など特定の目的のために設計された自動チャットボットベースのシステムの中核となるコンポーネントである。
このようなシステムを新しいドメインにデプロイする必要性が高まっているため、ゼロ/フェーショットDSTの問題を解決する必要がある。
リソース豊富なドメインから未知のドメインに、追加データの必要性を最小限に抑えて知識を移行する学習のトレンドが増えている。
本研究では,この伝達に対するメタ学習アルゴリズムのメリットについて検討し,dst問題に特有のメタ学習型d-reptileを提案する。
大規模な実験により、さまざまなドメイン、メソッド、ベースモデル、データセットにまたがる従来のアプローチに対するメリットの明確な証拠が得られ、低データ環境ではベースラインよりも大幅に(5~25%)改善されています。
提案するメタラーナーは基礎モデルに依存しないため,既存のDSTシステムはトレーニング戦略を用いて未知領域の性能を向上させることができる。
関連論文リスト
- A Zero-Shot Open-Vocabulary Pipeline for Dialogue Understanding [0.0]
ドメイン分類と状態追跡(DST)をひとつのパイプラインに統合するゼロショットオープン語彙システムを提案する。
我々のアプローチには、より能力の低いモデルに対する質問応答タスクとしてDSTを再構成し、より適応可能なモデルに自己修正プロンプトを採用することが含まれる。
論文 参考訳(メタデータ) (2024-09-24T08:33:41Z) - UNO-DST: Leveraging Unlabelled Data in Zero-Shot Dialogue State Tracking [54.51316566989655]
従来のゼロショット対話状態追跡(DST)手法は、対象領域における非競合データを無視して、転送学習のみを適用した。
我々は,ゼロショットDSTを,ジョイントおよび自己学習手法による非ラベルデータを利用して,少数ショットDSTに変換する。
ゼロショットシナリオにおける汎用言語モデルに対する本手法の有効性を実証し、MultiWOZの全ドメインで平均的な共同ゴール精度を8%向上する。
論文 参考訳(メタデータ) (2023-10-16T15:16:16Z) - Choice Fusion as Knowledge for Zero-Shot Dialogue State Tracking [5.691339955497443]
ゼロショットの対話状態トラッキング(DST)は、望ましいドメインをトレーニングすることなく、タスク指向の対話におけるユーザの要求を追跡する。
ドメインに依存しないQAデータセットに基づいて訓練し、ゼロショット対話状態生成のための知識としてスロット値の候補選択を直接利用するCoFunDSTを提案する。
提案手法は,MultiWOZ 2.1 における既存のゼロショット DST アプローチと比較して,精度が向上する。
論文 参考訳(メタデータ) (2023-02-25T07:32:04Z) - Schema Encoding for Transferable Dialogue State Tracking [2.5838973036257458]
対話状態追跡(DST)はタスク指向対話システムにとって不可欠なサブタスクである。
最近の研究は、DSTのためのディープニューラルモデルに焦点を当てている。
他のドメインに適用するには、新しいデータセットが必要です。
論文 参考訳(メタデータ) (2022-10-05T15:53:06Z) - Prompt Learning for Few-Shot Dialogue State Tracking [75.50701890035154]
本稿では,限られたラベル付きデータを用いて,対話状態追跡(DST)モデルを効率的に学習する方法に焦点を当てる。
本稿では,2つの主要なコンポーネントである値ベースプロンプトと逆プロンプト機構からなる,数ショットDSTのためのプロンプト学習フレームワークを設計する。
実験により、我々のモデルは未確認のスロットを生成し、既存の最先端の数ショット法より優れていることが示された。
論文 参考訳(メタデータ) (2022-01-15T07:37:33Z) - Unified Instance and Knowledge Alignment Pretraining for Aspect-based
Sentiment Analysis [96.53859361560505]
Aspect-based Sentiment Analysis (ABSA) は、ある側面に対する感情の極性を決定することを目的としている。
事前トレーニングと下流ABSAデータセットの間には、常に深刻なドメインシフトが存在する。
我々は,バニラ・プレトレイン・ファインチューンパイプラインにアライメント事前訓練フレームワークを導入する。
論文 参考訳(メタデータ) (2021-10-26T04:03:45Z) - Learning to Generalize Unseen Domains via Memory-based Multi-Source
Meta-Learning for Person Re-Identification [59.326456778057384]
本稿では,メモリベースのマルチソースメタラーニングフレームワークを提案する。
また,メタテスト機能を多様化するメタバッチ正規化層(MetaBN)を提案する。
実験により、M$3$Lは、目に見えない領域に対するモデルの一般化能力を効果的に向上できることが示された。
論文 参考訳(メタデータ) (2020-12-01T11:38:16Z) - Hybrid Generative-Retrieval Transformers for Dialogue Domain Adaptation [77.62366712130196]
マルチドメイン MetaLWOz データセットに微調整した GPT-2 に基づくハイブリッド生成・検索モデル DSTC8 の高速領域適応タスクにおける入賞条件について述べる。
提案モデルでは,MetaLWOz上の解析論理をフォールバックとして使用し,人間の評価におけるSoTA(第2位システムよりも4%向上)と,未知のMultiWOZデータセットに適応した競合一般化性能を実現する。
論文 参考訳(メタデータ) (2020-03-03T18:07:42Z) - Data Techniques For Online End-to-end Speech Recognition [17.621967685914587]
ドメイン内データに制限があるため、多くの場合、新しいユースケースのためのASRシステムを短時間で構築する必要がある。
最近開発されたエンドツーエンドのメソッドは、モデリングパイプラインを大いに単純化するが、それでもデータ空間の問題に悩まされている。
本稿では,オンラインASRシステムをエンド・ツー・エンドで構築するための簡単な実装手法について検討する。
論文 参考訳(メタデータ) (2020-01-24T22:59:46Z) - Domain Adaption for Knowledge Tracing [65.86619804954283]
本稿では,DAKT問題に対処するための新しい適応型フレームワーク,すなわち知識追跡(AKT)を提案する。
まず,Deep Knowledge Trace(DKT)に基づく教育的特徴(スリップ,推測,質問文など)を取り入れ,優れた知識追跡モデルを得る。
第2の側面として、3つのドメイン適応プロセスを提案し、採用する。まず、ターゲットモデルトレーニングに有用なソースインスタンスを選択するために、自動エンコーダを事前訓練する。
論文 参考訳(メタデータ) (2020-01-14T15:04:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。