論文の概要: ConvoSense: Overcoming Monotonous Commonsense Inferences for
Conversational AI
- arxiv url: http://arxiv.org/abs/2401.15471v1
- Date: Sat, 27 Jan 2024 17:51:05 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-30 18:15:29.518367
- Title: ConvoSense: Overcoming Monotonous Commonsense Inferences for
Conversational AI
- Title(参考訳): ConvoSense: 会話AIのための単調なコモンセンス推論を克服する
- Authors: Sarah E. Finch and Jinho D. Choi
- Abstract要約: ConvoSenseは、対話コンテキストにおけるコモンセンス推論のためのデータセットで、GPT、ConvoSenseを使用している。
私たちのデータセットには12,000の対話で50万以上の推論があり、10の一般的な推論タイプがあります。
- 参考スコア(独自算出の注目度): 14.314435286162311
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Mastering commonsense understanding and reasoning is a pivotal skill
essential for conducting engaging conversations. While there have been several
attempts to create datasets that facilitate commonsense inferences in dialogue
contexts, existing datasets tend to lack in-depth details, restate information
already present in the conversation, and often fail to capture the multifaceted
nature of commonsense reasoning. In response to these limitations, we compile a
new synthetic dataset for commonsense reasoning in dialogue contexts using GPT,
ConvoSense, that boasts greater contextual novelty, offers a higher volume of
inferences per example, and substantially enriches the detail conveyed by the
inferences. Our dataset contains over 500,000 inferences across 12,000
dialogues with 10 popular inference types, which empowers the training of
generative commonsense models for dialogue that are superior in producing
plausible inferences with high novelty when compared to models trained on the
previous datasets. To the best of our knowledge, ConvoSense is the first of its
kind to provide such a multitude of novel inferences at such a large scale.
- Abstract(参考訳): 常識の理解と推論を習得することは、対話を行う上で重要なスキルである。
対話コンテキストにおけるコモンセンス推論を促進するデータセットを作成する試みはいくつかあるが、既存のデータセットは詳細な詳細を欠く傾向にあり、会話にすでに存在する情報を復元し、しばしばコモンセンス推論の多面的な性質を捉えない。
これらの制約に対応するために、GPTを用いて対話文脈におけるコモンセンス推論のための新しい合成データセット、ConvoSenseをコンパイルする。
我々のデータセットには12,000の対話に対して50,000以上の推論と10の一般的な推論型が含まれており、前回のデータセットでトレーニングされたモデルと比較すると、高い新規性で予測可能な推論を生成するのに優れた対話のための生成コモンセンスモデルのトレーニングを促進する。
私たちの知る限りでは、ConvoSenseはそのような大規模な新しい推論を多数提供する最初の種類のものだ。
関連論文リスト
- Pre-training Multi-party Dialogue Models with Latent Discourse Inference [85.9683181507206]
我々は、多人数対話の会話構造、すなわち、各発話が応答する相手を理解するモデルを事前訓練する。
ラベル付きデータを完全に活用するために,談話構造を潜在変数として扱い,それらを共同で推論し,談話認識モデルを事前学習することを提案する。
論文 参考訳(メタデータ) (2023-05-24T14:06:27Z) - CGoDial: A Large-Scale Benchmark for Chinese Goal-oriented Dialog
Evaluation [75.60156479374416]
CGoDialは、Goal指向のダイアログ評価のための、新しい挑戦的で包括的な中国のベンチマークである。
96,763のダイアログセッションと574,949のダイアログがすべて含まれており、異なる知識ソースを持つ3つのデータセットをカバーする。
学術ベンチマークと音声対話のシナリオのギャップを埋めるために、実際の会話からデータを収集したり、クラウドソーシングを通じて既存のデータセットに音声機能を追加する。
論文 参考訳(メタデータ) (2022-11-21T16:21:41Z) - Multiview Contextual Commonsense Inference: A New Dataset and Task [40.566530682082714]
CICEROv2は2,379の対話から8,351のインスタンスからなるデータセットである。
それは、コンテキストのコモンセンス推論の質問に対して、複数の人間が書いた回答を含んでいる。
CICEROv2の推論は、他の文脈コモンセンス推論データセットよりも意味的に多様であることを示す。
論文 参考訳(メタデータ) (2022-10-06T13:08:41Z) - HybriDialogue: An Information-Seeking Dialogue Dataset Grounded on
Tabular and Textual Data [87.67278915655712]
我々は、ウィキペディアのテキストとテーブルの両方を基盤とした、クラウドソーシングされた自然な会話からなる新しい対話データセットHybriDialogueを提示する。
これらの会話は、複雑なマルチホップ質問をシンプルで現実的なマルチターン対話に分解することで生成される。
論文 参考訳(メタデータ) (2022-04-28T00:52:16Z) - Commonsense-Focused Dialogues for Response Generation: An Empirical
Study [39.49727190159279]
対話応答生成におけるコモンセンスの実証的研究について述べる。
まず、ConceptNetを利用して既存の対話データセットから共通感覚対話を自動的に抽出する。
次に、対話的な環境での社会的常識を示すことを目的とした、25K対話を備えた対話データセットを新たに収集する。
論文 参考訳(メタデータ) (2021-09-14T04:32:09Z) - RiSAWOZ: A Large-Scale Multi-Domain Wizard-of-Oz Dataset with Rich
Semantic Annotations for Task-Oriented Dialogue Modeling [35.75880078666584]
RiSAWOZ は、Rich Semantic s を用いた大規模マルチドメインの Chinese Wizard-of-Oz データセットである。
11.2Kのヒューマン・ツー・ヒューマン(H2H)マルチターン・アノテート・ダイアログを含み、12ドメインにまたがる150K以上の発話がある。
論文 参考訳(メタデータ) (2020-10-17T08:18:59Z) - Ranking Enhanced Dialogue Generation [77.8321855074999]
対話履歴を効果的に活用する方法は、マルチターン対話生成において重要な問題である。
これまでの研究は通常、歴史をモデル化するために様々なニューラルネットワークアーキテクチャを使用していた。
本稿では,ランキング拡張対話生成フレームワークを提案する。
論文 参考訳(メタデータ) (2020-08-13T01:49:56Z) - Rethinking Dialogue State Tracking with Reasoning [76.0991910623001]
本稿では, 対話状態の段階的追跡を, バックエンドデータの助けを借りて行うことを提案する。
実験の結果,MultiWOZ 2.1の連立信条精度は38.6%向上した。
論文 参考訳(メタデータ) (2020-05-27T02:05:33Z) - Fact-based Dialogue Generation with Convergent and Divergent Decoding [2.28438857884398]
本稿では,コンバージェントな思考能力を備えたエンドツーエンドのファクトベース対話システムを提案する。
我々のモデルは、情報的かつ多様な応答を生成できる新しい収束および分岐復号を組み込んでいる。
論文 参考訳(メタデータ) (2020-05-06T23:49:35Z) - KdConv: A Chinese Multi-domain Dialogue Dataset Towards Multi-turn
Knowledge-driven Conversation [66.99734491847076]
我々は,中国語の多分野知識駆動会話データセットKdConvを提案する。
私たちのコーパスには3つのドメイン(映画、音楽、旅行)から4.5Kの会話と、平均19.0の回転数で86Kの発話が含まれています。
論文 参考訳(メタデータ) (2020-04-08T16:25:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。