論文の概要: Instruction Clarification Requests in Multimodal Collaborative Dialogue
Games: Tasks, and an Analysis of the CoDraw Dataset
- arxiv url: http://arxiv.org/abs/2302.14406v1
- Date: Tue, 28 Feb 2023 08:41:53 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-01 17:30:16.075497
- Title: Instruction Clarification Requests in Multimodal Collaborative Dialogue
Games: Tasks, and an Analysis of the CoDraw Dataset
- Title(参考訳): マルチモーダル・コラボレーティブ・ダイアログゲームにおける指示明確化要求:タスクとCoDrawデータセットの解析
- Authors: Brielen Madureira and David Schlangen
- Abstract要約: 本稿では,CoDrawにおける命令明確化要求(iCR)について解説する。
プレイヤーが自己動機的に生成する語彙的および意味論的に多様なiCRを含むことを示す。
次に、iCRの作成時期と認識方法の2つのタスクのベースラインモデルを定式化し、提供します。
- 参考スコア(独自算出の注目度): 17.285206913252786
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In visual instruction-following dialogue games, players can engage in repair
mechanisms in face of an ambiguous or underspecified instruction that cannot be
fully mapped to actions in the world. In this work, we annotate Instruction
Clarification Requests (iCRs) in CoDraw, an existing dataset of interactions in
a multimodal collaborative dialogue game. We show that it contains lexically
and semantically diverse iCRs being produced self-motivatedly by players
deciding to clarify in order to solve the task successfully. With 8.8k iCRs
found in 9.9k dialogues, CoDraw-iCR (v1) is a large spontaneous iCR corpus,
making it a valuable resource for data-driven research on clarification in
dialogue. We then formalise and provide baseline models for two tasks:
Determining when to make an iCR and how to recognise them, in order to
investigate to what extent these tasks are learnable from data.
- Abstract(参考訳): ビジュアルインストラクションフォローの対話ゲームでは、プレイヤーは世界のアクションに完全にマッピングできない曖昧で不特定なインストラクションに直面して、修復メカニズムに関与することができる。
本研究では,マルチモーダル協調対話ゲームにおける既存のインタラクションデータセットであるCoDrawで,命令明確化要求(iCR)を注釈付けする。
本研究は,課題の解決に成功するために,プレイヤーが自己動機付けで作成した語彙的・意味論的に多様なiCRを含むことを示す。
9.9kの対話で8.8kのiCRが見つかると、CoDraw-iCR (v1)は大きな自発的iCRコーパスとなり、対話の明確化に関するデータ駆動研究の貴重な資源となる。
次に,2つのタスクのベースラインモデルを形式化し,提供する。 icrをいつ作成するか,どのように認識するかを判断し,これらのタスクがデータからどの程度学習可能かを調べる。
関連論文リスト
- Enhancing Multimodal Query Representation via Visual Dialogues for End-to-End Knowledge Retrieval [26.585985828583304]
本稿では,マルチモーダルクエリを理解可能なテキスト検索機能を実現するために,エンドツーエンドのマルチモーダル検索システムRet-XKnowを提案する。
マルチモーダルインタラクションを効果的に学習するために、視覚対話データセットから構築したVisual Dialogue-to-Retrievalデータセットも導入する。
提案手法は,ゼロショット設定における検索性能を大幅に向上するだけでなく,微調整シナリオの大幅な改善も達成できることを示す。
論文 参考訳(メタデータ) (2024-11-13T04:32:58Z) - Reasoning in Conversation: Solving Subjective Tasks through Dialogue
Simulation for Large Language Models [56.93074140619464]
本稿では,対話シミュレーションによる主観的課題の解決に焦点を当てたRiC(Reasoning in Conversation)を提案する。
RiCのモチベーションは、チェーン・オブ・ソート・スタイルの合理性を提供するのではなく、対話をシミュレートすることで有用な文脈情報をマイニングすることである。
GPT-4、ChatGPT、OpenChatなど、APIベースのLLMとオープンソースのLLMの両方を12のタスクで評価する。
論文 参考訳(メタデータ) (2024-02-27T05:37:10Z) - DiactTOD: Learning Generalizable Latent Dialogue Acts for Controllable
Task-Oriented Dialogue Systems [15.087619144902776]
本稿では,潜在空間における対話行動を表現する対話行動モデル(DiactTOD)を提案する。
大規模なコーパスで事前トレーニングを行うと、DiactTODは対話を予測し制御し、制御可能な応答を生成する。
論文 参考訳(メタデータ) (2023-08-01T23:29:16Z) - 'What are you referring to?' Evaluating the Ability of Multi-Modal
Dialogue Models to Process Clarificational Exchanges [65.03196674816772]
参照表現が宛先に対して意図された参照を一意に識別しない場合、参照の曖昧さが対話で生じる。
出席者は、通常、そのような曖昧さをすぐに検知し、メタコミュニケーション、明確化取引所(CE: Meta-communicative, Clarification Exchanges)を使用して、話者と作業する。
ここでは、CRを生成・応答する能力は、マルチモーダルな視覚的基盤を持つ対話モデルのアーキテクチャと目的関数に特定の制約を課していると論じる。
論文 参考訳(メタデータ) (2023-07-28T13:44:33Z) - "Are you telling me to put glasses on the dog?'' Content-Grounded
Annotation of Instruction Clarification Requests in the CoDraw Dataset [17.285206913252786]
我々はCoDraw-iCR (v2)を導入し、既存のiCR識別子を拡張し、基礎となる対話ゲームアイテムと可能なアクションを基盤としたきめ細かい情報を提供する。
論文 参考訳(メタデータ) (2023-06-04T15:23:16Z) - Towards End-to-End Open Conversational Machine Reading [57.18251784418258]
オープン検索型会話機械読解(OR-CMR)タスクでは,機械は対話履歴とテキスト知識ベースに応答するマルチターン質問を行う必要がある。
OR-CMRを完全エンドツーエンドで統一されたテキスト・ツー・テキスト・タスクとしてモデル化し、ShARCおよびOR-ShARCデータセットを用いた実験により、提案したエンドツーエンド・フレームワークの有効性を示す。
論文 参考訳(メタデータ) (2022-10-13T15:50:44Z) - Information Extraction and Human-Robot Dialogue towards Real-life Tasks:
A Baseline Study with the MobileCS Dataset [52.22314870976088]
SereTODチャレンジは、実際のユーザとChina Mobileのカスタマーサービススタッフの実際のダイアログ書き起こしで構成されるMobileCSデータセットを編成してリリースする。
MobileCSデータセットに基づいて、SereTODチャレンジには2つのタスクがあり、対話システム自体の構築を評価するだけでなく、ダイアログの書き起こしからの情報も抽出する。
本稿では主に,MobileCSデータセットを用いた2つのタスクのベースラインスタディを示す。
論文 参考訳(メタデータ) (2022-09-27T15:30:43Z) - KETOD: Knowledge-Enriched Task-Oriented Dialogue [77.59814785157877]
対話システム研究における既存の研究は、主にタスク指向の対話とチャットを独立したドメインとして扱う。
本研究では,タスク指向対話と知識ベースチップチャットを一つのモデルに効果的に統合する方法について検討する。
論文 参考訳(メタデータ) (2022-05-11T16:01:03Z) - Reasoning in Dialog: Improving Response Generation by Context Reading
Comprehension [49.92173751203827]
マルチターンダイアログでは、発話が文の完全な形を取るとは限らない。
読み解きの質問に答えるモデルの能力を検討し、応答生成性能の向上を提案する。
論文 参考訳(メタデータ) (2020-12-14T10:58:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。