論文の概要: Dialogue Strategy Adaptation to New Action Sets Using Multi-dimensional
Modelling
- arxiv url: http://arxiv.org/abs/2204.07082v1
- Date: Thu, 14 Apr 2022 16:26:22 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-15 15:43:04.566926
- Title: Dialogue Strategy Adaptation to New Action Sets Using Multi-dimensional
Modelling
- Title(参考訳): 多次元モデリングを用いた新しいアクションセットへの対話戦略適応
- Authors: Simon Keizer, Norbert Braunschweiler, Svetlana Stoyanchev, Rama
Doddipatla
- Abstract要約: 統計的音声対話システムを構築する上での大きなボトルネックは、大量のトレーニングデータを必要とすることである。
対話管理における多次元的アプローチを採用し,伝達学習の可能性を評価する。
具体的には、トレーニング済みのタスク非依存ポリシーを利用して、拡張されたタスク固有のアクションセットのトレーニングを高速化する。
- 参考スコア(独自算出の注目度): 15.575400480417844
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: A major bottleneck for building statistical spoken dialogue systems for new
domains and applications is the need for large amounts of training data. To
address this problem, we adopt the multi-dimensional approach to dialogue
management and evaluate its potential for transfer learning. Specifically, we
exploit pre-trained task-independent policies to speed up training for an
extended task-specific action set, in which the single summary action for
requesting a slot is replaced by multiple slot-specific request actions. Policy
optimisation and evaluation experiments using an agenda-based user simulator
show that with limited training data, much better performance levels can be
achieved when using the proposed multi-dimensional adaptation method. We
confirm this improvement in a crowd-sourced human user evaluation of our spoken
dialogue system, comparing partially trained policies. The multi-dimensional
system (with adaptation on limited training data in the target scenario)
outperforms the one-dimensional baseline (without adaptation on the same amount
of training data) by 7% perceived success rate.
- Abstract(参考訳): 新しいドメインやアプリケーションのために統計的音声対話システムを構築するための大きなボトルネックは、大量のトレーニングデータの必要性である。
この問題に対処するために,対話管理における多次元的アプローチを採用し,伝達学習の可能性を評価する。
具体的には、事前訓練されたタスク非依存ポリシーを利用して、スロット要求のための単一のサマリアクションを複数のスロット固有のリクエストアクションに置き換える、拡張されたタスク固有のアクションセットのトレーニングをスピードアップする。
政策最適化とアジェンダベースのユーザシミュレータによる評価実験により,訓練データに制限がある場合,提案手法を用いることで,より優れた性能が得られることが示された。
この改善をクラウドソースによる音声対話システムにおけるユーザ評価で確認し、部分的に訓練されたポリシーを比較した。
多次元システム(対象シナリオにおける限られたトレーニングデータへの適応)は、1次元ベースライン(同じトレーニングデータへの適応なしに)を7%向上させる。
関連論文リスト
- Denoising Pre-Training and Customized Prompt Learning for Efficient Multi-Behavior Sequential Recommendation [69.60321475454843]
マルチビヘイビアシークエンシャルレコメンデーションに適した,最初の事前学習および迅速な学習パラダイムであるDPCPLを提案する。
事前学習段階において,複数の時間スケールでノイズを除去する新しい行動マイナ (EBM) を提案する。
次に,提案するCustomized Prompt Learning (CPL)モジュールを用いて,事前学習したモデルを高効率にチューニングすることを提案する。
論文 参考訳(メタデータ) (2024-08-21T06:48:38Z) - Towards All-in-one Pre-training via Maximizing Multi-modal Mutual
Information [77.80071279597665]
マルチモーダル相互情報事前学習(M3I事前学習)を最大化するオールインワン単段階事前学習手法を提案する。
提案手法は,ImageNet分類,オブジェクト検出,LVIS長鎖オブジェクト検出,ADE20kセマンティックセマンティックセマンティックセマンティクスなど,様々なビジョンベンチマークにおける事前学習手法よりも優れた性能を実現する。
論文 参考訳(メタデータ) (2022-11-17T18:59:49Z) - An Information-Theoretic Approach for Estimating Scenario Generalization
in Crowd Motion Prediction [27.10815774845461]
本稿では,ソース・クラウド・シナリオに基づいて学習したモデルの一般化を特徴付ける新しいスコアリング手法を提案する。
インタラクションコンポーネントはシナリオドメインの難易度を特徴付けることを目的としており、シナリオドメインの多様性はダイバーシティスコアで取得される。
提案手法の有効性をシミュレーションおよび実世界(ソース,ターゲット)の一般化タスクで検証した。
論文 参考訳(メタデータ) (2022-11-02T01:39:30Z) - Is MultiWOZ a Solved Task? An Interactive TOD Evaluation Framework with
User Simulator [37.590563896382456]
タスク指向対話(TOD)システムのための対話型評価フレームワークを提案する。
まず,事前学習したモデルに基づいて目標指向のユーザシミュレータを構築し,ユーザシミュレータを用いて対話システムと対話して対話を生成する。
実験の結果,提案したユーザシミュレータによりトレーニングされたRLベースのTODシステムは,約98%のインフォメーションと成功率を達成することができた。
論文 参考訳(メタデータ) (2022-10-26T07:41:32Z) - Effective Adaptation in Multi-Task Co-Training for Unified Autonomous
Driving [103.745551954983]
本稿では,3つの下流タスクにおけるMoCoやSimCLRなど,多種多様な自己監督手法の転送性能について検討する。
彼らのパフォーマンスは、サブ最適か、あるいはシングルタスクベースラインよりもはるかに遅れていることに気付きました。
汎用マルチタスクトレーニングのための,単純かつ効果的な事前訓練-適応-ファインチューンパラダイムを提案する。
論文 参考訳(メタデータ) (2022-09-19T12:15:31Z) - Reinforcement Learning of Multi-Domain Dialog Policies Via Action
Embeddings [38.51601073819774]
強化学習によるタスク指向の対話ポリシーの学習は、通常、ユーザと大量の対話を必要とする。
本稿では,異なるダイアログドメインからのデータを活用することで,各ドメインから必要なデータ量を削減することを提案する。
このアプローチがユーザとのインタラクションを著しく少なくし、学習に必要なダイアログ数の35%を削減し、シミュレートされたドメインの集合上で各ドメインに対して個別のポリシーをトレーニングするよりも高い習熟度で学習できることを示します。
論文 参考訳(メタデータ) (2022-07-01T14:49:05Z) - Self-training Improves Pre-training for Few-shot Learning in
Task-oriented Dialog Systems [47.937191088981436]
大規模事前訓練型言語モデルでは、ToDで数発の学習を行う上で有望な結果が示されている。
本稿では,より強力な学生モデルを訓練するために,最も自信のないラベル付きデータを反復的にラベル付けする自己学習手法を提案する。
目的分類,ダイアログ状態追跡,ダイアログアクト予測,応答選択など,ToDの4つの下流タスクに関する実験と分析を行った。
論文 参考訳(メタデータ) (2021-08-28T07:22:06Z) - High-Quality Diversification for Task-Oriented Dialogue Systems [18.455916009255485]
多様な対話路を持つDRLエージェントの訓練は、稀なユーザ要求や目に見えない状況に備える。
1つの効果的な多様化方法は、エージェントが多様な学習されたユーザーモデルと対話できるようにすることである。
シミュレータで訓練されたタスク指向対話システムのための新しい対話多様化手法を提案する。
論文 参考訳(メタデータ) (2021-06-02T02:10:07Z) - Meta Dialogue Policy Learning [58.045067703675095]
我々は、ドメイン間の共有可能な低レベル信号を利用するために、Deep Transferable Q-Network (DTQN)を提案する。
状態と行動表現空間をこれらの低レベル成分に対応する特徴部分空間に分解する。
実験において,本モデルは,成功率と対話効率の両方の観点から,ベースラインモデルより優れている。
論文 参考訳(メタデータ) (2020-06-03T23:53:06Z) - Hybrid Generative-Retrieval Transformers for Dialogue Domain Adaptation [77.62366712130196]
マルチドメイン MetaLWOz データセットに微調整した GPT-2 に基づくハイブリッド生成・検索モデル DSTC8 の高速領域適応タスクにおける入賞条件について述べる。
提案モデルでは,MetaLWOz上の解析論理をフォールバックとして使用し,人間の評価におけるSoTA(第2位システムよりも4%向上)と,未知のMultiWOZデータセットに適応した競合一般化性能を実現する。
論文 参考訳(メタデータ) (2020-03-03T18:07:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。