論文の概要: Looking for Confirmations: An Effective and Human-Like Visual Dialogue
Strategy
- arxiv url: http://arxiv.org/abs/2109.05312v1
- Date: Sat, 11 Sep 2021 16:28:58 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-14 15:49:51.150960
- Title: Looking for Confirmations: An Effective and Human-Like Visual Dialogue
Strategy
- Title(参考訳): 確認を求める:効果的で人間に似た対話戦略
- Authors: Alberto Testoni and Raffaella Bernardi
- Abstract要約: State-Of-The-Artシステムは文法的に正しいが、効果的な戦略が欠如しており、人間には不自然に聞こえるという疑問を生じさせる。
我々は,効率的な目標指向戦略を導出するビームサーチリグレードアルゴリズムに基づくモデルであるConfirm-itを設計する。
本研究では,確認イットによって生成された対話は,ビーム探索復号化よりも自然かつ効果的であることを示す。
- 参考スコア(独自算出の注目度): 6.02280861819024
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generating goal-oriented questions in Visual Dialogue tasks is a challenging
and long-standing problem. State-Of-The-Art systems are shown to generate
questions that, although grammatically correct, often lack an effective
strategy and sound unnatural to humans. Inspired by the cognitive literature on
information search and cross-situational word learning, we design Confirm-it, a
model based on a beam search re-ranking algorithm that guides an effective
goal-oriented strategy by asking questions that confirm the model's conjecture
about the referent. We take the GuessWhat?! game as a case-study. We show that
dialogues generated by Confirm-it are more natural and effective than beam
search decoding without re-ranking.
- Abstract(参考訳): Visual Dialogueタスクでゴール指向の質問を生成することは、困難で長期にわたる問題である。
State-Of-The-Artシステムは文法的に正しいが、効果的な戦略が欠如しており、人間には不自然に聞こえる。
情報探索と断続的単語学習に関する認知文学から着想を得て,ビーム探索再分類アルゴリズムに基づくモデルであるConfirm-itを設計し,モデルが参照者について推測したことを裏付ける質問を行うことで,効果的な目標指向戦略を導出する。
何だと思う?
ケーススタディとしてのゲーム。
確認によって生成された対話は,再ランク付けせずにビーム探索復号よりも自然かつ効果的であることを示す。
関連論文リスト
- Reasoning in Conversation: Solving Subjective Tasks through Dialogue
Simulation for Large Language Models [56.93074140619464]
本稿では,対話シミュレーションによる主観的課題の解決に焦点を当てたRiC(Reasoning in Conversation)を提案する。
RiCのモチベーションは、チェーン・オブ・ソート・スタイルの合理性を提供するのではなく、対話をシミュレートすることで有用な文脈情報をマイニングすることである。
GPT-4、ChatGPT、OpenChatなど、APIベースのLLMとオープンソースのLLMの両方を12のタスクで評価する。
論文 参考訳(メタデータ) (2024-02-27T05:37:10Z) - Uncovering Hidden Connections: Iterative Search and Reasoning for Video-grounded Dialog [83.63849872250651]
ビデオグラウンドダイアログは、正確な応答生成のために、ダイアログ履歴とビデオコンテンツの両方を深く理解する必要がある。
本稿では,テキストエンコーダ,ビジュアルエンコーダ,ジェネレータで構成される反復探索・推論フレームワークを提案する。
論文 参考訳(メタデータ) (2023-10-11T07:37:13Z) - Are Current Decoding Strategies Capable of Facing the Challenges of
Visual Dialogue? [3.491999371287298]
我々は,Visual Dialogueの参照ゲームにおいて,異なるデコード戦略を比較した。
いずれも、語彙の豊かさ、タスクの正確さ、視覚的な接点のバランスを取れなかった。
我々の発見と提案は、より効果的な復号アルゴリズムの設計の出発点になるかもしれない。
論文 参考訳(メタデータ) (2022-10-24T07:34:39Z) - KETOD: Knowledge-Enriched Task-Oriented Dialogue [77.59814785157877]
対話システム研究における既存の研究は、主にタスク指向の対話とチャットを独立したドメインとして扱う。
本研究では,タスク指向対話と知識ベースチップチャットを一つのモデルに効果的に統合する方法について検討する。
論文 参考訳(メタデータ) (2022-05-11T16:01:03Z) - Towards Large-Scale Interpretable Knowledge Graph Reasoning for Dialogue
Systems [109.16553492049441]
よりスケーラブルで一般化可能な対話システムに知識推論機能を組み込む新しい手法を提案する。
我々の知識を最大限に活用するために、変圧器モデルが微分可能な知識グラフを解析して応答を生成するのは、これが初めてである。
論文 参考訳(メタデータ) (2022-03-20T17:51:49Z) - Retrieval-Free Knowledge-Grounded Dialogue Response Generation with
Adapters [52.725200145600624]
軽量アダプタで事前学習した言語モデルに事前知識を注入し、検索プロセスをバイパスする KnowExpert を提案する。
実験結果から,KnowExpertは検索ベースラインと相容れない性能を示した。
論文 参考訳(メタデータ) (2021-05-13T12:33:23Z) - The Interplay of Task Success and Dialogue Quality: An in-depth
Evaluation in Task-Oriented Visual Dialogues [6.02280861819024]
一般的なエンドツーエンドアプローチでは、この選択はモデルが言語的に豊かな対話を生成するための学習を妨げることを示しています。
GuessWhatでは、トレーニングセットで頻繁に発生しない単語を接地、エンコード、デコードすることを学ぶと、モデルが精度を高めることができることを示しています。
論文 参考訳(メタデータ) (2021-03-20T10:13:30Z) - Reasoning in Dialog: Improving Response Generation by Context Reading
Comprehension [49.92173751203827]
マルチターンダイアログでは、発話が文の完全な形を取るとは限らない。
読み解きの質問に答えるモデルの能力を検討し、応答生成性能の向上を提案する。
論文 参考訳(メタデータ) (2020-12-14T10:58:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。