論文の概要: Commonsense Reasoning for Conversational AI: A Survey of the State of
the Art
- arxiv url: http://arxiv.org/abs/2302.07926v1
- Date: Wed, 15 Feb 2023 19:55:57 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-17 15:56:28.523334
- Title: Commonsense Reasoning for Conversational AI: A Survey of the State of
the Art
- Title(参考訳): 会話型AIのためのコモンセンス推論:最先端技術に関する調査
- Authors: Christopher Richardson and Larry Heck
- Abstract要約: 論文では、関連するトレーニングデータセットをリストアップし、会話型AIにコモンセンスを含めるための主要なアプローチについて説明する。
本稿では,BlenderBot3とLaMDAの2つの最先端オープンダイアログモデルの限られたコモンセンス能力について予備観測を行った。
- 参考スコア(独自算出の注目度): 0.76146285961466
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large, transformer-based pretrained language models like BERT, GPT, and T5
have demonstrated a deep understanding of contextual semantics and language
syntax. Their success has enabled significant advances in conversational AI,
including the development of open-dialogue systems capable of coherent, salient
conversations which can answer questions, chat casually, and complete tasks.
However, state-of-the-art models still struggle with tasks that involve higher
levels of reasoning - including commonsense reasoning that humans find trivial.
This paper presents a survey of recent conversational AI research focused on
commonsense reasoning. The paper lists relevant training datasets and describes
the primary approaches to include commonsense in conversational AI. The paper
also discusses benchmarks used for evaluating commonsense in conversational AI
problems. Finally, the paper presents preliminary observations of the limited
commonsense capabilities of two state-of-the-art open dialogue models,
BlenderBot3 and LaMDA, and its negative effect on natural interactions. These
observations further motivate research on commonsense reasoning in
conversational AI.
- Abstract(参考訳): BERT、GPT、T5のような大きなトランスフォーマーベースの事前訓練された言語モデルは、文脈意味論と言語構文の深い理解を示している。
彼らの成功は会話型aiにおいて大きな進歩をもたらし、コヒーレントで有能な会話ができるオープンダイアログシステムの開発、質問への回答、カジュアルな会話、完全なタスクなどを可能にした。
しかし、最先端のモデルは高いレベルの推論を含むタスクといまだに苦労している。
本稿では,コモンセンス推論に着目した近年の会話型AI研究について報告する。
論文は関連するトレーニングデータセットをリストアップし、会話型aiにcommonsenseを含めるための主要なアプローチを説明する。
また、会話型AI問題におけるコモンセンスの評価に用いられるベンチマークについても論じる。
最後に,2つの最先端オープン対話モデルであるblenderbot3とlamdaのコモンセンス能力と,その自然相互作用に対する負の影響について予備的な観察を行った。
これらの観察は、会話型AIにおける常識推論の研究をさらに動機付けている。
関連論文リスト
- WavChat: A Survey of Spoken Dialogue Models [66.82775211793547]
GPT-4oのようなシステムで実証された音声対話モデルの最近の進歩は、音声領域において大きな注目を集めている。
これらの高度な音声対話モデルは、音声、音楽、その他の音声関連の特徴を理解するだけでなく、音声のスタイリスティックな特徴や音節的な特徴も捉える。
音声対話システムの進歩にもかかわらず、これらのシステムを体系的に組織化し分析する包括的調査が欠如している。
論文 参考訳(メタデータ) (2024-11-15T04:16:45Z) - Do great minds think alike? Investigating Human-AI Complementarity in Question Answering with CAIMIRA [43.116608441891096]
人間は知識に基づく帰納的、概念的推論においてAIシステムより優れています。
GPT-4やLLaMAのような最先端のLLMは、ターゲット情報検索において優れた性能を示す。
論文 参考訳(メタデータ) (2024-10-09T03:53:26Z) - Self-Directed Turing Test for Large Language Models [56.64615470513102]
チューリングテストは、自然言語の会話においてAIが人間のような振る舞いを示すことができるかどうかを調べる。
従来のチューリングテストでは、各参加者が1回に1つのメッセージだけを送信する厳格な対話形式を採用している。
本稿では,バーストダイアログ形式を用いた自己指示チューリングテストを提案する。
論文 参考訳(メタデータ) (2024-08-19T09:57:28Z) - Expanding the Set of Pragmatic Considerations in Conversational AI [0.26206189324400636]
本稿では,現在の会話型AIシステムの実用的限界について論じる。
私たちは、苦情をTTT(Turing Test Triggers)とラベル付けします。
我々は、対話型AIシステムに必要な実用的能力を特定するために、実用的考察の分類法を開発する。
論文 参考訳(メタデータ) (2023-10-27T19:21:50Z) - DiPlomat: A Dialogue Dataset for Situated Pragmatic Reasoning [89.92601337474954]
プラグマティック推論は、実生活における会話でしばしば起こる暗黙の意味を解読する上で重要な役割を担っている。
そこで我々は,現実的な推論と会話理解の場所に関するマシンの能力のベンチマークを目的とした,新しい挑戦であるDiPlomatを紹介した。
論文 参考訳(メタデータ) (2023-06-15T10:41:23Z) - Discourse over Discourse: The Need for an Expanded Pragmatic Focus in
Conversational AI [0.5884031187931463]
会話の要約と他の会話型AIアプリケーションにおけるいくつかの課題について論じる。
本稿では,いわゆる星文による現実語の重要性について述べる。
AIの品質の基準は人間の行動と区別できないため、苦情を"Turing Test Triggers"とラベル付けします。
論文 参考訳(メタデータ) (2023-04-27T21:51:42Z) - Question-Interlocutor Scope Realized Graph Modeling over Key Utterances
for Dialogue Reading Comprehension [61.55950233402972]
本稿では,対話読解のためのキーワード抽出手法を提案する。
複数の連続した発話によって形成された単位に対して予測を行い、より多くの回答を含む発話を実現する。
発話のテキスト上に構築されたグラフとして,質問-対話者スコープ実現グラフ(QuISG)モデルを提案する。
論文 参考訳(メタデータ) (2022-10-26T04:00:42Z) - State-of-the-art in Open-domain Conversational AI: A Survey [1.6507910904669727]
我々は,SoTAのオープンドメイン会話型AIモデルについて,今後の研究を刺激する上で有効な課題を提示する目的で調査する。
問題を取り巻く倫理的議論をガイドするために,対話型AIの性別に関する統計情報を提供する。
論文 参考訳(メタデータ) (2022-05-02T15:08:18Z) - Advances in Multi-turn Dialogue Comprehension: A Survey [51.215629336320305]
自然言語を理解し、人間と対話するための訓練機械は、人工知能の解明と本質的なタスクである。
本稿では,対話理解タスクにおける対話モデリングの技術的視点から,過去の手法を概観する。
さらに,対話シナリオにおけるPrLMの強化に使用される対話関連事前学習手法を分類する。
論文 参考訳(メタデータ) (2021-10-11T03:52:37Z) - Advances in Multi-turn Dialogue Comprehension: A Survey [51.215629336320305]
対話モデリングの観点から,従来の手法を検討した。
対話理解タスクで広く使用されている対話モデリングの3つの典型的なパターンについて議論します。
論文 参考訳(メタデータ) (2021-03-04T15:50:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。