論文の概要: Taming the Beast: Learning to Control Neural Conversational Models
- arxiv url: http://arxiv.org/abs/2108.10561v1
- Date: Tue, 24 Aug 2021 07:58:16 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-25 18:50:05.883500
- Title: Taming the Beast: Learning to Control Neural Conversational Models
- Title(参考訳): 野獣のタミング:ニューラルな会話モデルを制御する学習
- Authors: Andrea Madotto
- Abstract要約: 本論文は,タスク指向およびチャットシナリオにおける深層学習に基づく,エンドツーエンドな生成対話システムの制御可能性について考察する。
生成的対話システムの制御のさまざまな側面について検討し,その制御方法とトピックスについて考察する。
- 参考スコア(独自算出の注目度): 10.407021682762075
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This thesis investigates the controllability of deep learning-based,
end-to-end, generative dialogue systems in both task-oriented and chit-chat
scenarios. In particular, we study the different aspects of controlling
generative dialogue systems, including controlling styles and topics and
continuously adding and combining dialogue skills. In the three decades since
the first dialogue system was commercialized, the basic architecture of such
systems has remained substantially unchanged, consisting of four pipelined
basic components, namely, natural language understanding (NLU), dialogue state
tracking (DST), a dialogue manager (DM) and natural language generation (NLG).
The dialogue manager, which is the critical component of the modularized
system, controls the response content and style. This module is usually
programmed by rules and is designed to be highly controllable and easily
extendable. With the emergence of powerful "deep learning" architectures,
end-to-end generative dialogue systems have been proposed to optimize overall
system performance and simplify training. However, these systems cannot be
easily controlled and extended as the modularized dialogue manager can. This is
because a single neural system is used, which is usually a large pre-trained
language model (e.g., GPT-2), and thus it is hard to surgically change
desirable attributes (e.g., style, topics, etc.). More importantly,
uncontrollable dialogue systems can generate offensive and even toxic
responses. Therefore, in this thesis, we study controllable methods for
end-to-end generative dialogue systems in task-oriented and chit-chat
scenarios. Throughout the chapters, we describe 1) how to control the style and
topics of chit-chat models, 2) how to continuously control and extend
task-oriented dialogue systems, and 3) how to compose and control multi-skill
dialogue models.
- Abstract(参考訳): 本論文は,タスク指向とチャットの両シナリオにおいて,深層学習に基づく,エンドツーエンドで生成的な対話システムの制御可能性について考察する。
特に,スタイルや話題の制御や対話スキルの継続的な付加・結合など,生成対話システム制御のさまざまな側面について検討する。
最初の対話システムが商用化されてから30年が経ち、これらのシステムの基本的なアーキテクチャは、自然言語理解(NLU)、対話状態追跡(DST)、対話マネージャ(DM)、自然言語生成(NLG)という4つのパイプライン化された基本コンポーネントで、ほとんど変わっていない。
モジュール化システムの重要なコンポーネントである対話マネージャは、応答内容とスタイルを制御する。
このモジュールは通常規則でプログラムされ、高度に制御可能で容易に拡張できるように設計されている。
強力な「深層学習」アーキテクチャの出現に伴い、システム全体の性能を最適化し、訓練を簡素化するエンドツーエンド生成対話システムが提案されている。
しかし、これらのシステムはモジュール化された対話マネージャができる限り容易に制御・拡張できない。
これは、通常、大きな事前学習された言語モデル(gpt-2など)である単一のニューラルネットワークが使用されているため、望ましい属性(スタイル、トピックなど)を外科的に変更することは困難である。
さらに重要なことに、制御不能な対話システムは攻撃的、さらには有害な反応を引き起こす可能性がある。
そこで本論文では,タスク指向およびチャットシナリオにおけるエンドツーエンド生成対話システムの制御可能な手法について検討する。
1)chit-chatモデルのスタイルと話題の制御方法,2)タスク指向対話システムの継続的な制御と拡張方法,3)マルチスキル対話モデルの構成と制御方法について述べる。
関連論文リスト
- DEMO: Reframing Dialogue Interaction with Fine-grained Element Modeling [73.08187964426823]
大規模言語モデル (LLM) によって実現された対話システムは、人間と機械の相互作用において中心的なモードの1つとなっている。
本稿では,新しい研究課題--$textbfD$ialogue $textbfE$lement $textbfMO$delingを紹介する。
本稿では,包括的対話モデリングと評価のために設計された新しいベンチマークである$textbfDEMO$を提案する。
論文 参考訳(メタデータ) (2024-12-06T10:01:38Z) - WavChat: A Survey of Spoken Dialogue Models [66.82775211793547]
GPT-4oのようなシステムで実証された音声対話モデルの最近の進歩は、音声領域において大きな注目を集めている。
これらの高度な音声対話モデルは、音声、音楽、その他の音声関連の特徴を理解するだけでなく、音声のスタイリスティックな特徴や音節的な特徴も捉える。
音声対話システムの進歩にもかかわらず、これらのシステムを体系的に組織化し分析する包括的調査が欠如している。
論文 参考訳(メタデータ) (2024-11-15T04:16:45Z) - OmniFlatten: An End-to-end GPT Model for Seamless Voice Conversation [53.7173034249361]
エンド・ツー・エンドのGPTベースモデルであるOmniFlattenは、低レイテンシで自然な会話に固有の複雑な振る舞いを効果的にモデル化することができる。
提案手法は, 簡便なモデリング手法と, より効率的かつ自然な対話システムを構築するための研究の方向性を提供する。
論文 参考訳(メタデータ) (2024-10-23T11:58:58Z) - Are cascade dialogue state tracking models speaking out of turn in
spoken dialogues? [1.786898113631979]
本稿では,対話状態追跡のような複雑な環境下でのアートシステムのエラーを包括的に解析する。
音声MultiWozに基づいて、音声対話システムとチャットベースの対話システムとのギャップを埋めるためには、非カテゴリースロットの値の誤差に対処することが不可欠である。
論文 参考訳(メタデータ) (2023-11-03T08:45:22Z) - A Review of Dialogue Systems: From Trained Monkeys to Stochastic Parrots [0.0]
人工知能をデプロイして、人間と会話できる自動対話エージェントを構築することを目指している。
本稿では,長年にわたって対話システムを構築するために開発された手法について概説する。
論文 参考訳(メタデータ) (2021-11-02T08:07:55Z) - UniDS: A Unified Dialogue System for Chit-Chat and Task-oriented
Dialogues [59.499965460525694]
上記の2つのスキルを備えた統合対話システム(UniDS)を提案する。
我々は、チャットとタスク指向の対話の両方に対応可能な統合対話データスキーマを設計する。
我々は、事前訓練されたチャット対話モデルから混合対話データでUniDSを訓練する。
論文 参考訳(メタデータ) (2021-10-15T11:56:47Z) - Alexa Conversations: An Extensible Data-driven Approach for Building
Task-oriented Dialogue Systems [21.98135285833616]
従来の目標指向対話システムは、自然言語理解、対話状態追跡、政策学習、応答生成など、さまざまなコンポーネントに依存している。
スケーラブルかつデータ効率の高い,目標指向の対話システム構築のための新たなアプローチを提案する。
論文 参考訳(メタデータ) (2021-04-19T07:09:27Z) - Integrating Pre-trained Model into Rule-based Dialogue Management [32.90885176553305]
ルールベースの対話管理は、まだ産業用タスク指向対話システムのための最も人気のあるソリューションです。
データ駆動対話システム(通常はエンドツーエンド構造)は学術研究で人気がある。
本稿ではルールベースとデータ駆動型ダイアログマネージャの長所を活用する手法を提案する。
論文 参考訳(メタデータ) (2021-02-17T03:44:22Z) - Conversation Learner -- A Machine Teaching Tool for Building Dialog
Managers for Task-Oriented Dialog Systems [57.082447660944965]
Conversation Learnerは、ダイアログマネージャを構築するための機械学習ツールである。
ダイアログ作成者が慣れ親しんだツールを使ってダイアログフローを作成し、ダイアログフローをパラメトリックモデルに変換することができる。
ユーザシステムダイアログをトレーニングデータとして活用することで、ダイアログ作成者が時間とともにダイアログマネージャを改善することができる。
論文 参考訳(メタデータ) (2020-04-09T00:10:54Z) - Recent Advances and Challenges in Task-oriented Dialog System [63.82055978899631]
課題指向対話システムは、学術・産業社会でますます注目を集めている。
タスク指向ダイアログシステムにおける3つの重要なトピックについて論じる。(1)低リソース環境でのダイアログモデリングを容易にするデータ効率の改善、(2)ダイアログポリシー学習のためのマルチターンダイナミクスのモデリング、(3)ダイアログモデルへのドメイン知識の統合。
論文 参考訳(メタデータ) (2020-03-17T01:34:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。