論文の概要: Can Current Task-oriented Dialogue Models Automate Real-world Scenarios
in the Wild?
- arxiv url: http://arxiv.org/abs/2212.10504v1
- Date: Tue, 20 Dec 2022 18:18:41 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-21 15:57:09.559349
- Title: Can Current Task-oriented Dialogue Models Automate Real-world Scenarios
in the Wild?
- Title(参考訳): 現在のタスク指向対話モデルは野生における実世界のシナリオを自動化するか?
- Authors: Sang-Woo Lee, Sungdong Kim, Donghyeon Ko, Donghoon Ham, Youngki Hong,
Shin Ah Oh, Hyunhoon Jung, Wangkyo Jung, Kyunghyun Cho, Donghyun Kwak,
Hyungsuk Noh, Woomyoung Park
- Abstract要約: タスク指向対話(TOD)システムは主にスロット充足に基づくTODフレームワークに基づいている。
現在のTODモデルは、シナリオの解明にはまだ長い道のりがある、と私たちは主張する。
WebTODでは,対話システムは大規模言語モデルを用いたWeb/モバイルインタフェースの理解方法を学ぶ。
- 参考スコア(独自算出の注目度): 48.79943762731801
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Task-oriented dialogue (TOD) systems are mainly based on the
slot-filling-based TOD (SF-TOD) framework, in which dialogues are broken down
into smaller, controllable units (i.e., slots) to fulfill a specific task. A
series of approaches based on this framework achieved remarkable success on
various TOD benchmarks. However, we argue that the current TOD benchmarks are
limited to surrogate real-world scenarios and that the current TOD models are
still a long way from unraveling the scenarios. In this position paper, we
first identify current status and limitations of SF-TOD systems. After that, we
explore the WebTOD framework, the alternative direction for building a scalable
TOD system when a web/mobile interface is available. In WebTOD, the dialogue
system learns how to understand the web/mobile interface that the human agent
interacts with, powered by a large-scale language model.
- Abstract(参考訳): タスク指向対話 (TOD) は主にスロット充足に基づくTOD (SF-TOD) フレームワークに基づいており、特定のタスクを達成するために対話をより小さく制御可能な単位(スロット)に分割する。
このフレームワークに基づく一連のアプローチは、様々なTODベンチマークで大きな成功を収めた。
しかし、現在のTODベンチマークは現実世界のシナリオのサロゲートに限られており、現在のTODモデルはシナリオの展開にはまだ長い道のりがある、と我々は論じる。
本稿では,まずsf-todシステムの現状と限界を明らかにする。
その後、Web/モバイルインターフェースが利用可能になったときに、スケーラブルなTODシステムを構築するための代替方向であるWebTODフレームワークについて検討する。
webtodでは、対話システムは、人間のエージェントが対話するweb/モバイルインターフェースを、大規模な言語モデルで理解する方法を学習する。
関連論文リスト
- Beyond Ontology in Dialogue State Tracking for Goal-Oriented Chatbot [3.2288892242158984]
本稿では,対話状態追跡(DST)性能を向上させる新しい手法を提案する。
提案手法により,Large Language Model (LLM) による対話状態の推測が可能となる。
提案手法は,42.57%のJGAで最先端を達成し,オープンドメインの現実世界での会話でも良好に機能した。
論文 参考訳(メタデータ) (2024-10-30T07:36:23Z) - Training Zero-Shot Generalizable End-to-End Task-Oriented Dialog System Without Turn-level Dialog Annotations [2.757798192967912]
この作業はマルチタスク命令の微調整を用いて、より効率的でスケーラブルなタスク指向対話システムを構築する。
提案手法は,アノテートされたデータに基づいて訓練された最先端モデルと,市販のChatGPTモデルから10億のパラメータを比較検討する。
論文 参考訳(メタデータ) (2024-07-21T04:52:38Z) - VisualWebArena: Evaluating Multimodal Agents on Realistic Visual Web Tasks [93.85005277463802]
VisualWebArenaは、マルチモーダルWebエージェントのパフォーマンスを現実的なタスクで評価するために設計されたベンチマークである。
このベンチマークを実行するには、イメージテキスト入力を正確に処理し、自然言語命令を解釈し、ユーザが定義した目的を達成するためにウェブサイト上でアクションを実行する必要がある。
論文 参考訳(メタデータ) (2024-01-24T18:35:21Z) - InstructTODS: Large Language Models for End-to-End Task-Oriented
Dialogue Systems [60.53276524369498]
大規模言語モデル(LLM)は自然言語処理(NLP)における多様なタスクに使用されている。
InstructTODSは、ゼロショットのタスク指向対話システムのための新しいフレームワークである。
InstructTODSは、ユーザの意図を動的クエリにシームレスに翻訳するプロキシの信念状態を生成する。
論文 参考訳(メタデータ) (2023-10-13T06:36:26Z) - Enhancing Performance on Seen and Unseen Dialogue Scenarios using
Retrieval-Augmented End-to-End Task-Oriented System [89.40590076430297]
この作業により、単純なキャッシュを通じてより柔軟性のあるTODシステムが可能になる。
我々は,TOD生成中に対話履歴と検索情報の両方を参照・基盤にできるエンドツーエンドTODモデルを訓練する。
非空共同ゴール精度を6.7%向上させるなど,我々のフレームワークの優れた性能を示す実験を行った。
論文 参考訳(メタデータ) (2023-08-16T06:52:10Z) - Enhancing Task Bot Engagement with Synthesized Open-Domain Dialog [89.35658776144638]
TODとODDの両方を扱えるシステムを構築し、異なる知識ソースにアクセスすることが不可欠である。
本稿では,知識基盤のODDとTODを組み合わせた対話を自動的に生成するフレームワークを提案する。
本研究では,TODモードとODDモードを適切に適用し,異なる知識ソースにアクセス可能な統合モデルPivotBotを提案する。
論文 参考訳(メタデータ) (2022-12-20T05:51:47Z) - A Chit-Chats Enhanced Task-Oriented Dialogue Corpora for Fuse-Motive
Conversation Systems [9.541995537438394]
CCET (China Chat-Enhanced-Task) と呼ばれるマルチターン対話データセットをリリースする。
本稿では, CC音声で統合されたTODセッションの評価指標とともに, ヒューズ動機対話の形式化手法を提案する。
論文 参考訳(メタデータ) (2022-05-12T05:43:18Z) - Cross-Lingual Dialogue Dataset Creation via Outline-Based Generation [70.81596088969378]
言語間アウトラインに基づく対話データセット(COD)は、自然言語の理解を可能にする。
CODは、4つの異なる言語で対話状態の追跡とエンドツーエンドの対話モデリングと評価を可能にする。
論文 参考訳(メタデータ) (2022-01-31T18:11:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。