論文の概要: History-Aware Question Answering in a Blocks World Dialogue System
- arxiv url: http://arxiv.org/abs/2005.12501v1
- Date: Tue, 26 May 2020 03:16:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-28 23:31:18.683372
- Title: History-Aware Question Answering in a Blocks World Dialogue System
- Title(参考訳): ブロック世界対話システムにおける履歴認識質問応答
- Authors: Benjamin Kane, Georgiy Platonov, and Lenhart K. Schubert
- Abstract要約: 対話に基づく空間推論システムにとって、世界の歴史的状態の記憶を維持することが不可欠である。
本稿では,視覚システム,アニメーションアバターを介する音声入力と出力,空間的問合せを頑健に解釈する対話システムからなる全空間問合せパイプラインを構築した。
- 参考スコア(独自算出の注目度): 1.6058099298620425
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: It is essential for dialogue-based spatial reasoning systems to maintain
memory of historical states of the world. In addition to conveying that the
dialogue agent is mentally present and engaged with the task, referring to
historical states may be crucial for enabling collaborative planning (e.g., for
planning to return to a previous state, or diagnosing a past misstep). In this
paper, we approach the problem of spatial memory in a multi-modal spoken
dialogue system capable of answering questions about interaction history in a
physical blocks world setting. This work builds upon a full spatial
question-answering pipeline consisting of a vision system, speech input and
output mediated by an animated avatar, a dialogue system that robustly
interprets spatial queries, and a constraint solver that derives answers based
on 3-D spatial modelling. The contributions of this work include a symbolic
dialogue context registering knowledge about discourse history and changes in
the world, as well as a natural language understanding module capable of
interpreting free-form historical questions and querying the dialogue context
to form an answer.
- Abstract(参考訳): 対話ベースの空間推論システムでは、世界の歴史的状態の記憶を維持することが不可欠である。
対話エージェントが精神的に存在し、タスクに携わっていることを伝えることに加えて、歴史的な状態を参照することは、協調的な計画(例えば、以前の状態に戻る計画、過去のミスステップの診断など)を可能にするために重要である。
本稿では,物理ブロックの世界設定における対話履歴に関する疑問に答えることのできるマルチモーダル音声対話システムにおいて,空間記憶の問題にアプローチする。
この研究は、視覚システム、アニメーションアバターによる音声入力と出力、空間的クエリを頑健に解釈する対話システム、三次元空間モデリングに基づく回答を導出する制約解決器からなる全空間質問応答パイプラインの上に構築される。
この作品のコントリビューションには、対話の歴史や世界の変化に関する知識を登録するシンボリックな対話コンテキストや、自由形式の歴史的疑問を解釈し、対話コンテキストをクエリして回答を形成する自然言語理解モジュールが含まれる。
関連論文リスト
- Human-Robot Dialogue Annotation for Multi-Modal Common Ground [4.665414514091581]
本稿では,人間とロボットの対話データにアノテートした記号表現の開発について述べる。
遠隔対話では,人間とロボットが不慣れな環境における共同ナビゲーションと探索作業に従事しているが,ロボットは限られた通信制約のため,すぐには高品質な視覚情報を共有できない。
このパラダイム内では、抽象的意味表現の強化である対話-AMRアノテーションを通じて、対話中の1つの発話の命題意味と補間力を取り込む。
論文 参考訳(メタデータ) (2024-11-19T19:33:54Z) - WavChat: A Survey of Spoken Dialogue Models [66.82775211793547]
GPT-4oのようなシステムで実証された音声対話モデルの最近の進歩は、音声領域において大きな注目を集めている。
これらの高度な音声対話モデルは、音声、音楽、その他の音声関連の特徴を理解するだけでなく、音声のスタイリスティックな特徴や音節的な特徴も捉える。
音声対話システムの進歩にもかかわらず、これらのシステムを体系的に組織化し分析する包括的調査が欠如している。
論文 参考訳(メタデータ) (2024-11-15T04:16:45Z) - Enhancing Visual Dialog State Tracking through Iterative Object-Entity Alignment in Multi-Round Conversations [3.784841749866846]
MDST(Multi-round Dialogue State Tracking Model)を導入する。
MDSTは、内的対話状態表現を視覚言語表現の2-タプルとして定義し、各ラウンドの対話履歴をキャプチャする。
VisDial v1.0データセットの実験結果は、MDSTが生成環境において新しい最先端性能を達成することを示した。
論文 参考訳(メタデータ) (2024-08-13T08:36:15Z) - PK-Chat: Pointer Network Guided Knowledge Driven Generative Dialogue
Model [79.64376762489164]
PK-Chatは、知識グラフ上のポインタネットワークと、事前訓練された言語モデルを組み合わせた、ポインタネットワーク誘導生成対話モデルである。
PK-Chatが対話で生成した単語は、単語リストの予測と外部知識グラフ知識の直接予測から導かれる。
PK-Chatに基づく対話システムは、地球科学の学術シナリオ向けに構築されている。
論文 参考訳(メタデータ) (2023-04-02T18:23:13Z) - End-to-end Spoken Conversational Question Answering: Task, Dataset and
Model [92.18621726802726]
音声による質問応答では、システムは関連する音声書き起こしの中に連続したテキストスパンからの質問に答えるように設計されている。
本稿では,複雑な対話フローをモデル化することを目的とした音声対話型質問応答タスク(SCQA)を提案する。
本研究の目的は,音声記録に基づく対話型質問に対処するシステムを構築することであり,情報収集システムによる様々なモダリティからより多くの手がかりを提供する可能性を探ることである。
論文 参考訳(メタデータ) (2022-04-29T17:56:59Z) - HybriDialogue: An Information-Seeking Dialogue Dataset Grounded on
Tabular and Textual Data [87.67278915655712]
我々は、ウィキペディアのテキストとテーブルの両方を基盤とした、クラウドソーシングされた自然な会話からなる新しい対話データセットHybriDialogueを提示する。
これらの会話は、複雑なマルチホップ質問をシンプルで現実的なマルチターン対話に分解することで生成される。
論文 参考訳(メタデータ) (2022-04-28T00:52:16Z) - Back to the Future: Bidirectional Information Decoupling Network for
Multi-turn Dialogue Modeling [80.51094098799736]
ユニバーサル対話エンコーダとして双方向情報デカップリングネットワーク(BiDeN)を提案する。
BiDeNは過去と将来の両方のコンテキストを明示的に取り入れており、幅広い対話関連のタスクに一般化することができる。
異なる下流タスクのデータセットに対する実験結果は、我々のBiDeNの普遍性と有効性を示している。
論文 参考訳(メタデータ) (2022-04-18T03:51:46Z) - Advances in Multi-turn Dialogue Comprehension: A Survey [51.215629336320305]
対話モデリングの観点から,従来の手法を検討した。
対話理解タスクで広く使用されている対話モデリングの3つの典型的なパターンについて議論します。
論文 参考訳(メタデータ) (2021-03-04T15:50:17Z) - Building A User-Centric and Content-Driven Socialbot [2.072266782237039]
我々は,ソーシャルボット会話用に設計した対話戦略を収容できるシステムアーキテクチャを開発した。
このアーキテクチャは、ユーザ発話を分析するための多次元言語理解モジュールで構成されている。
様々な情報源からソーシャルチャットコンテンツを収集し,ソーシャルボットを支える新しい知識基盤を構築した。
論文 参考訳(メタデータ) (2020-05-06T07:11:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。