論文の概要: Navigating Connected Memories with a Task-oriented Dialog System
- arxiv url: http://arxiv.org/abs/2211.08462v1
- Date: Tue, 15 Nov 2022 19:31:57 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-17 14:55:16.172122
- Title: Navigating Connected Memories with a Task-oriented Dialog System
- Title(参考訳): タスク指向対話システムによる接続メモリのナビゲーション
- Authors: Seungwhan Moon, Satwik Kottur, Alborz Geramifard, Babak Damavandi
- Abstract要約: マルチターンで対話的な対話を通じて,ユーザがメディアコレクションを検索できるようにする強力なツールとして,コネクテッドメモリのためのダイアログを提案する。
新しいタスク指向のダイアログデータセットCOMETを使用し、シミュレーションされたパーソナルメモリグラフをベースとしたユーザ>アシスタントダイアログ(トータリング103k$発話)を含む。
COMETを分析し、意味のある進捗をベンチマークするために4つの主要なタスクを定式化し、最先端の言語モデルを強力なベースラインとして採用する。
- 参考スコア(独自算出の注目度): 13.117491508194242
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent years have seen an increasing trend in the volume of personal media
captured by users, thanks to the advent of smartphones and smart glasses,
resulting in large media collections. Despite conversation being an intuitive
human-computer interface, current efforts focus mostly on single-shot natural
language based media retrieval to aid users query their media and re-live their
memories. This severely limits the search functionality as users can neither
ask follow-up queries nor obtain information without first formulating a
single-turn query.
In this work, we propose dialogs for connected memories as a powerful tool to
empower users to search their media collection through a multi-turn,
interactive conversation. Towards this, we collect a new task-oriented dialog
dataset COMET, which contains $11.5k$ user<->assistant dialogs (totaling $103k$
utterances), grounded in simulated personal memory graphs. We employ a
resource-efficient, two-phase data collection pipeline that uses: (1) a novel
multimodal dialog simulator that generates synthetic dialog flows grounded in
memory graphs, and, (2) manual paraphrasing to obtain natural language
utterances. We analyze COMET, formulate four main tasks to benchmark meaningful
progress, and adopt state-of-the-art language models as strong baselines, in
order to highlight the multimodal challenges captured by our dataset.
- Abstract(参考訳): 近年、スマートフォンやスマートグラスの出現により、ユーザーによって捉えられたパーソナルメディアの量が増加し、大きなメディアコレクションが生まれている。
会話は人間とコンピュータの直感的なインターフェースであるにもかかわらず、現在の取り組みは主に、ユーザーが自分のメディアを問い合わせて記憶を生き返らせるために、シングルショットの自然言語ベースのメディア検索に焦点を当てている。
これは、ユーザーが1ターンのクエリを記述せずにフォローアップクエリや情報を得ることができないため、検索機能を厳しく制限する。
本研究では,マルチターン対話によるメディアコレクションを検索するための強力なツールとして,コネクテッドメモリのためのダイアログを提案する。
そこで我々は,11.5k$のユーザ<->アシスタントダイアログを含むタスク指向ダイアログデータセットCOMETを,シミュレーションされたパーソナルメモリグラフに基づいて収集した。
本研究では,(1)メモリグラフ上に構築された合成ダイアログフローを生成する新しいマルチモーダルダイアログシミュレータ,(2)自然言語の発話を得るための手動パラフレーズを用いて,資源効率のよい2段階データ収集パイプラインを構築した。
我々はCOMETを分析し、意味のある進捗をベンチマークするために4つの主要なタスクを定式化し、最新の言語モデルを強力なベースラインとして採用し、データセットが捉えたマルチモーダル課題を強調します。
関連論文リスト
- Evaluating Very Long-Term Conversational Memory of LLM Agents [95.84027826745609]
我々は,高品質で長期的な対話を生成するための,マシン・ヒューマン・パイプラインを導入する。
我々は、各エージェントに画像の共有と反応の能力を持たせる。
生成した会話は、長距離一貫性のために人間のアノテーションによって検証され、編集される。
論文 参考訳(メタデータ) (2024-02-27T18:42:31Z) - Multi-User MultiWOZ: Task-Oriented Dialogues among Multiple Users [51.34484827552774]
マルチユーザMulti-User MultiWOZデータセットを2つのユーザと1つのエージェント間のタスク指向対話としてリリースする。
これらの対話は、タスク指向のシナリオにおける協調的な意思決定の興味深いダイナミクスを反映している。
本稿では,複数ユーザ間のタスク指向のチャットを簡潔なタスク指向のクエリとして書き換える,マルチユーザコンテキストクエリ書き換えの新しいタスクを提案する。
論文 参考訳(メタデータ) (2023-10-31T14:12:07Z) - DialogStudio: Towards Richest and Most Diverse Unified Dataset
Collection for Conversational AI [92.29874802394167]
DialogStudioは対話データセットの最大かつ最も多様なコレクションである。
本コレクションは,オープンドメイン対話,タスク指向対話,自然言語理解,対話レコメンデーション,対話要約,知識基底対話などのデータを含む。
論文 参考訳(メタデータ) (2023-07-19T17:57:53Z) - Multi-grained Hypergraph Interest Modeling for Conversational
Recommendation [75.65483522949857]
複雑な履歴データの下でユーザの興味を捉えるために, マルチグラデーション・ハイパーグラフ・インフォメーション・モデリング手法を提案する。
提案手法では,まず,ユーザの過去の対話セッションをモデル化し,セッションベースハイパーグラフを作成するためにハイパーグラフ構造を用いる。
さらに,2種類のハイパーグラフに対して多粒度ハイパーグラフの畳み込みを行い,拡張表現を用いて関心を意識したCRSを開発する。
論文 参考訳(メタデータ) (2023-05-04T13:13:44Z) - Tell Your Story: Task-Oriented Dialogs for Interactive Content Creation [11.538915414185022]
本稿では,メディアコレクションからモンタージュをシームレスに検索,コンパイル,編集するためのインタラクティブツールとして,モンタージュ生成のためのタスク指向ダイアログを提案する。
大規模なメディアコレクションからシミュレーションしたメディアモンタージュに条件付き10kのダイアログを含む新しいデータセットC3(Conversational Content Creation)を収集する。
我々の最先端言語モデルの解析とベンチマークは、データセットに存在するマルチモーダルな課題を示している。
論文 参考訳(メタデータ) (2022-11-08T01:23:59Z) - HybriDialogue: An Information-Seeking Dialogue Dataset Grounded on
Tabular and Textual Data [87.67278915655712]
我々は、ウィキペディアのテキストとテーブルの両方を基盤とした、クラウドソーシングされた自然な会話からなる新しい対話データセットHybriDialogueを提示する。
これらの会話は、複雑なマルチホップ質問をシンプルで現実的なマルチターン対話に分解することで生成される。
論文 参考訳(メタデータ) (2022-04-28T00:52:16Z) - What Did You Say? Task-Oriented Dialog Datasets Are Not Conversational!? [4.022057598291766]
我々は,MultiWOZ,SGD,SMCalFlowの対話効果と文脈効果の分類を概説する。
我々は、MultiWOZのターンの4%未満、SGDのターンの10%が会話型であるのに対して、SMCalFlowは現在のリリースでは会話型ではないことを発見した。
論文 参考訳(メタデータ) (2022-03-07T14:26:23Z) - Constructing Multi-Modal Dialogue Dataset by Replacing Text with
Semantically Relevant Images [17.076424447172297]
本稿では,人間の介入を最小限に抑えた45kマルチモーダル対話データセットを提案する。
このようなデータセットを作成する方法は,(1)テキスト対話データセットの作成と前処理,(2)テキストから画像への置き換え技術による画像混合対話の作成,(3)文脈相似性に基づくフィルタリング手法を用いて構成する。
論文 参考訳(メタデータ) (2021-07-19T08:44:11Z) - Dialogue History Matters! Personalized Response Selectionin Multi-turn
Retrieval-based Chatbots [62.295373408415365]
本稿では,コンテキスト応答マッチングのためのパーソナライズドハイブリッドマッチングネットワーク(phmn)を提案する。
1) ユーザ固有の対話履歴からパーソナライズされた発話行動を付加的なマッチング情報として抽出する。
ユーザ識別による2つの大規模データセット,すなわちパーソナライズされた対話 Corpus Ubuntu (P-Ubuntu) とパーソナライズされたWeiboデータセット (P-Weibo) のモデルを評価する。
論文 参考訳(メタデータ) (2021-03-17T09:42:11Z) - Interview: A Large-Scale Open-Source Corpus of Media Dialog [11.28504775964698]
本稿では,ニュースインタビューの書き起こしから収集した大規模(105Kの会話)メディアダイアログデータセット「Interview」を紹介する。
既存の会話データに対する大規模プロキシと比較して、我々のデータセットでトレーニングされた言語モデルは、ドメイン外のゼロショットのパフォーマンスが向上する。
「インタービュー」には各ターンの話者ロールアノテーションが含まれており、エンゲージメント・レスポンシブ・ダイアログシステムの開発を容易にする。
論文 参考訳(メタデータ) (2020-04-07T02:44:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。