論文の概要: Findings from Experiments of On-line Joint Reinforcement Learning of
Semantic Parser and Dialogue Manager with real Users
- arxiv url: http://arxiv.org/abs/2110.13213v1
- Date: Mon, 25 Oct 2021 18:51:41 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-27 15:25:36.588540
- Title: Findings from Experiments of On-line Joint Reinforcement Learning of
Semantic Parser and Dialogue Manager with real Users
- Title(参考訳): 実ユーザによるセマンティックパーザと対話マネージャのオンライン共同強化学習実験からの発見
- Authors: Matthieu Riou and Bassam Jabaian and St\'ephane Huet and Fabrice
Lef\`evre
- Abstract要約: 本論文では,これらの困難を緩和する便利な方法として,オンライン学習を追求する。
新しい課題は、ユーザが生み出すオンライン学習のコストを制御することである。
- 参考スコア(独自算出の注目度): 3.9686445409447617
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Design of dialogue systems has witnessed many advances lately, yet acquiring
huge set of data remains an hindrance to their fast development for a new task
or language. Besides, training interactive systems with batch data is not
satisfactory. On-line learning is pursued in this paper as a convenient way to
alleviate these difficulties. After the system modules are initiated, a single
process handles data collection, annotation and use in training algorithms. A
new challenge is to control the cost of the on-line learning borne by the user.
Our work focuses on learning the semantic parsing and dialogue management
modules (speech recognition and synthesis offer ready-for-use solutions). In
this context we investigate several variants of simultaneous learning which are
tested in user trials. In our experiments, with varying merits, they can all
achieve good performance with only a few hundreds of training dialogues and
overstep a handcrafted system. The analysis of these experiments gives us some
insights, discussed in the paper, into the difficulty for the system's trainers
to establish a coherent and constant behavioural strategy to enable a fast and
good-quality training phase.
- Abstract(参考訳): 対話システムの設計は近年多くの進歩を目の当たりにしているが、膨大なデータ集合の獲得は、新しいタスクや言語への迅速な開発を妨げている。
さらに、バッチデータによるインタラクティブシステムのトレーニングも満足できない。
本論文では,これらの困難を緩和する便利な方法としてオンライン学習を追求する。
システムモジュールが起動すると、単一のプロセスがトレーニングアルゴリズムでデータ収集、アノテーション、使用を処理します。
新しい課題は、ユーザが生み出すオンライン学習のコストを制御することである。
本研究は,意味解析と対話管理モジュール(音声認識と合成が利用可能ソリューションを提供する)の学習に焦点を当てている。
この文脈では,ユーザ試験でテストされる同時学習のいくつかの変種について検討する。
実験では、様々なメリットを伴って、数百のトレーニングダイアログだけで優れたパフォーマンスを達成でき、手作りのシステムを追い越すことができます。
これらの実験の分析から,システムのトレーナが協調的かつ定常的な行動戦略を確立して,迅速かつ高品質なトレーニングフェーズを実現することの難しさに関する知見が得られた。
関連論文リスト
- Pre-training Multi-party Dialogue Models with Latent Discourse Inference [85.9683181507206]
我々は、多人数対話の会話構造、すなわち、各発話が応答する相手を理解するモデルを事前訓練する。
ラベル付きデータを完全に活用するために,談話構造を潜在変数として扱い,それらを共同で推論し,談話認識モデルを事前学習することを提案する。
論文 参考訳(メタデータ) (2023-05-24T14:06:27Z) - Multi-Task Learning based Online Dialogic Instruction Detection with
Pre-trained Language Models [34.66425105076059]
コントラッシブ・ロスによりカテゴリ間のマージンを大きくすることで、異なるクラスのインスタンスを識別する能力を向上するマルチタスク・パラダイムを提案する。
実世界のオンライン教育データセットを用いた実験により,本手法が代表的ベースラインよりも優れた性能を発揮することが示された。
論文 参考訳(メタデータ) (2021-07-15T04:57:57Z) - Alexa Conversations: An Extensible Data-driven Approach for Building
Task-oriented Dialogue Systems [21.98135285833616]
従来の目標指向対話システムは、自然言語理解、対話状態追跡、政策学習、応答生成など、さまざまなコンポーネントに依存している。
スケーラブルかつデータ効率の高い,目標指向の対話システム構築のための新たなアプローチを提案する。
論文 参考訳(メタデータ) (2021-04-19T07:09:27Z) - Continual Learning in Task-Oriented Dialogue Systems [49.35627673523519]
タスク指向対話システムにおける継続的な学習は、システム全体のリトレーニングのコストを伴わずに、時間を通じて新しいドメインや機能を追加できる。
37ドメインのタスク指向対話システムを4つの設定で継続的に学習するための継続的学習ベンチマークを提案する。
論文 参考訳(メタデータ) (2020-12-31T08:44:25Z) - Learning Adaptive Language Interfaces through Decomposition [89.21937539950966]
本稿では,分解による新しいハイレベルな抽象化を学習するニューラルセマンティック解析システムを提案する。
ユーザは、新しい振る舞いを記述する高レベルな発話を低レベルなステップに分解することで、対話的にシステムを教える。
論文 参考訳(メタデータ) (2020-10-11T08:27:07Z) - MinTL: Minimalist Transfer Learning for Task-Oriented Dialogue Systems [75.43457658815943]
タスク指向対話システムのシステム設計プロセスを簡単にするミニマリスト変換学習(MinTL)を提案する。
MinTLはシンプルだが効果的な転送学習フレームワークであり、事前訓練されたSeq2seqモデルのプラグインと再生を可能にする。
トレーニング済みの2つのバックボーン(T5とBART)で学習フレームワークをインスタンス化し、MultiWOZで評価する。
論文 参考訳(メタデータ) (2020-09-25T02:19:13Z) - Rethinking Supervised Learning and Reinforcement Learning in
Task-Oriented Dialogue Systems [58.724629408229205]
本稿では、従来の教師あり学習とシミュレータなしの逆学習法を用いて、最先端のRL法に匹敵する性能を実現する方法を示す。
我々の主な目的は、教師あり学習で強化学習に勝ることではなく、タスク指向対話システムの最適化における強化学習と教師あり学習の役割を再考する価値を示すことである。
論文 参考訳(メタデータ) (2020-09-21T12:04:18Z) - A System for Real-Time Interactive Analysis of Deep Learning Training [66.06880335222529]
現在利用可能なシステムは、トレーニングプロセスが始まる前に指定しなければならないログデータのみを監視することに限定されている。
本稿では,リアルタイム情報を生成するライブプロセス上で対話型クエリを実行可能にするシステムを提案する。
論文 参考訳(メタデータ) (2020-01-05T11:33:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。