論文の概要: Domain-independent User Simulation with Transformers for Task-oriented
Dialogue Systems
- arxiv url: http://arxiv.org/abs/2106.08838v1
- Date: Wed, 16 Jun 2021 14:56:04 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-17 17:29:50.941508
- Title: Domain-independent User Simulation with Transformers for Task-oriented
Dialogue Systems
- Title(参考訳): タスク指向対話システムのためのトランスフォーマによるドメイン非依存ユーザシミュレーション
- Authors: Hsien-chin Lin, Nurul Lubis, Songbo Hu, Carel van Niekerk, Christian
Geishauser, Michael Heck, Shutong Feng, Milica Ga\v{s}i\'c
- Abstract要約: 強化学習による対話ポリシの最適化には,多数のトレーニングインタラクションが必要である。
多くのセットアップは、人間ではなくユーザーシミュレータに頼っている。
手書きのルールベースのユーザシミュレータは、複雑なドメインに対して、小さくてシンプルなドメインでは十分であることが示されている。
ドメインに依存しないトランスフォーマーベースユーザシミュレータ(TUS)を提案する。
- 参考スコア(独自算出の注目度): 3.1433893853959605
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Dialogue policy optimisation via reinforcement learning requires a large
number of training interactions, which makes learning with real users time
consuming and expensive. Many set-ups therefore rely on a user simulator
instead of humans. These user simulators have their own problems. While
hand-coded, rule-based user simulators have been shown to be sufficient in
small, simple domains, for complex domains the number of rules quickly becomes
intractable. State-of-the-art data-driven user simulators, on the other hand,
are still domain-dependent. This means that adaptation to each new domain
requires redesigning and retraining. In this work, we propose a
domain-independent transformer-based user simulator (TUS). The structure of our
TUS is not tied to a specific domain, enabling domain generalisation and
learning of cross-domain user behaviour from data. We compare TUS with the
state of the art using automatic as well as human evaluations. TUS can compete
with rule-based user simulators on pre-defined domains and is able to
generalise to unseen domains in a zero-shot fashion.
- Abstract(参考訳): 強化学習による対話政策の最適化には,多数のトレーニングインタラクションが必要である。
そのため、多くのセットアップは人間ではなくユーザーシミュレータに頼っている。
これらのユーザーシミュレータには独自の問題がある。
ルールベースのユーザシミュレータは手書きだが、複雑なドメインに対して小さな単純なドメインでは十分であることが示されている。
一方、最先端のデータ駆動型ユーザーシミュレータはドメインに依存している。
つまり、新しいドメインへの適応には再設計と再トレーニングが必要です。
本研究では,ドメインに依存しないトランスフォーマーベースユーザシミュレータ(TUS)を提案する。
TUSの構造は特定のドメインと結びついておらず、データからドメイン間のユーザ動作の一般化と学習を可能にします。
自動評価と人的評価を用いて,TUSとアートの現状を比較した。
TUSは、事前定義されたドメイン上のルールベースのユーザーシミュレータと競合し、ゼロショット方式で見えないドメインに一般化することができる。
関連論文リスト
- Autonomous Vehicle Controllers From End-to-End Differentiable Simulation [60.05963742334746]
そこで我々は,AVコントローラのトレーニングにAPG(analytic Policy gradients)アプローチを適用可能なシミュレータを提案し,その設計を行う。
提案するフレームワークは, エージェントがより根底的なポリシーを学ぶのを助けるために, 環境力学の勾配を役立てる, エンド・ツー・エンドの訓練ループに, 微分可能シミュレータを組み込む。
ダイナミクスにおけるパフォーマンスとノイズに対する堅牢性の大幅な改善と、全体としてより直感的なヒューマンライクな処理が見られます。
論文 参考訳(メタデータ) (2024-09-12T11:50:06Z) - One-Shot Domain Adaptive and Generalizable Semantic Segmentation with
Class-Aware Cross-Domain Transformers [96.51828911883456]
セマンティックセグメンテーションのための教師なしのsim-to-realドメイン適応(UDA)は、シミュレーションデータに基づいて訓練されたモデルの実世界のテスト性能を改善することを目的としている。
従来のUDAは、適応のためのトレーニング中に利用可能なラベルのない実世界のサンプルが豊富にあると仮定することが多い。
実世界のデータサンプルが1つしか利用できない,一発の教師なしシム・トゥ・リアル・ドメイン適応(OSUDA)と一般化問題について検討する。
論文 参考訳(メタデータ) (2022-12-14T15:54:15Z) - Towards Optimal Strategies for Training Self-Driving Perception Models
in Simulation [98.51313127382937]
合成ドメインのみにおけるラベルの使用に焦点を当てる。
提案手法では,ニューラル不変表現の学習方法と,シミュレータからデータをサンプリングする方法に関する理論的にインスピレーションを得た視点を導入する。
マルチセンサーデータを用いた鳥眼視車両分割作業におけるアプローチについて紹介する。
論文 参考訳(メタデータ) (2021-11-15T18:37:43Z) - Contrastive Learning and Self-Training for Unsupervised Domain
Adaptation in Semantic Segmentation [71.77083272602525]
UDAはラベル付きソースドメインからラベルなしターゲットドメインへの効率的な知識伝達を試みている。
本稿では,領域にまたがるカテゴリ別センタロイドを適応させるコントラスト学習手法を提案する。
提案手法を自己学習で拡張し,メモリ効率の良い時間アンサンブルを用いて一貫性と信頼性の高い擬似ラベルを生成する。
論文 参考訳(メタデータ) (2021-05-05T11:55:53Z) - Batch Normalization Embeddings for Deep Domain Generalization [50.51405390150066]
ドメインの一般化は、異なるドメインと見えないドメインで堅牢に実行されるように機械学習モデルをトレーニングすることを目的としている。
一般的な領域一般化ベンチマークにおいて,最先端技術よりも分類精度が著しく向上したことを示す。
論文 参考訳(メタデータ) (2020-11-25T12:02:57Z) - Multi-Agent Task-Oriented Dialog Policy Learning with Role-Aware Reward
Decomposition [64.06167416127386]
本稿では,システムとユーザの両方をダイアログエージェントとみなすマルチエージェントダイアログポリシー学習を提案する。
2人のエージェントが互いに相互作用し、同時に一緒に学習されます。
その結果,本手法がシステムポリシとユーザポリシを同時に構築できることが示唆された。
論文 参考訳(メタデータ) (2020-04-08T04:51:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。