Fugu-MT 論文翻訳(概要): DeliChess: A Multi-party Dialogue Dataset for Deliberation in Chess Puzzle Solving

論文の概要: DeliChess: A Multi-party Dialogue Dataset for Deliberation in Chess Puzzle Solving

arxiv url: http://arxiv.org/abs/2606.04987v1
Date: Wed, 03 Jun 2026 15:08:46 GMT
ステータス: 翻訳完了
システム内更新日: 2026-06-04 20:44:18.84675
Title: DeliChess: A Multi-party Dialogue Dataset for Deliberation in Chess Puzzle Solving
Title（参考訳）: DeliChess: チェスパズル解決における議論のための多人数対話データセット
Authors: Xiaochen Zhu, Georgi Karadzhov, Tom Stafford, Andreas Vlachos,
Abstract要約: DeliChessは、グループ熟考対話の新しいデータセットである。各グループはまずパズルを個別に完了し、その後、修正された集合回答を提出する前に複数のパーティで議論を行う。チェスエンジンの評価に基づいて,3つの指標を用いて評価を行った。
参考スコア（独自算出の注目度）: 10.692162092366523
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Multi-party dialogue is a critical setting for studying collaborative reasoning and decision-making, yet existing datasets rarely focus on structured, in-depth complex reasoning tasks. We introduce DeliChess, a novel dataset of group deliberation dialogues in which participants collaboratively solve multiple-choice chess puzzles. Each group first completes the puzzle individually, then engages in a multi-party discussion before submitting a revised collective answer. The dataset includes 107 dialogues with full transcripts, pre- and post-discussion choices, and metadata on puzzle difficulty and move quality. We evaluate performance using three metrics based on chess engine evaluations, and find that deliberation significantly improves group accuracy. We further analyse the role of probing utterances (i.e., messages that elicit proposals, justifications, or strategic reflection) using a classifier trained on prior deliberation data. While probing makes group performance more variable after discussion, it does not consistently lead to better performance. Our dataset offers a rich testbed for modelling group reasoning, dialogue dynamics, and the resolution of differing perspectives and opinions in a well-defined strategic domain.
Abstract（参考訳）: 複数パーティの対話は、協調推論と意思決定を研究する上で重要な設定であるが、既存のデータセットは構造化された複雑な推論タスクにはほとんど焦点を当てない。 DeliChessは、参加者が協力して複数のチェスパズルを解くグループ討論対話の新しいデータセットである。各グループはまずパズルを個別に完了し、その後、修正された集合回答を提出する前に複数のパーティで議論を行う。データセットには、完全な書き起こしを含む107の対話、前と後の選択、パズルの難しさと品質の移動に関するメタデータが含まれている。チェスエンジン評価に基づく3つの指標を用いて性能評価を行い,検討によってグループ精度が大幅に向上することが確認された。さらに、事前の審議データに基づいて訓練された分類器を用いて、発話(すなわち、提案を誘発するメッセージ、正当化または戦略的反映)を探索する役割について分析する。議論の後、グループパフォーマンスがより可変になる一方で、パフォーマンスが常に向上するとは限らない。我々のデータセットは、グループ推論、対話力学、そして明確に定義された戦略的領域における異なる視点と意見の解決のためのリッチなテストベッドを提供する。

関連論文リスト

Data Selection for Multi-turn Dialogue Instruction Tuning [36.29487117560294]
textbfMDS (Multi-turn Dialogue Selection) は、独立したターンではなく、会話全体をスコアする対話レベルフレームワークである。 MDSは、強力なシングルターンセレクタ、対話レベルスコアラ、ベースラインを3つのマルチターンベンチマークとドメイン内バンキングテストセットで上回る。
論文参考訳（メタデータ） (2026-04-09T07:01:26Z)
The effect of diversity on group decision-making [11.079483551335597]
小集団は対話を通じて直感的なバイアスを克服し、個人の意思決定を改善することができることを示す。大規模なサンプルと異なる運用方法によって、より認知的な多様性がより成功したグループ熟考と結びついていることが一貫して明らかになる。
論文参考訳（メタデータ） (2024-02-02T14:15:01Z)
Pre-training Multi-party Dialogue Models with Latent Discourse Inference [85.9683181507206]
我々は、多人数対話の会話構造、すなわち、各発話が応答する相手を理解するモデルを事前訓練する。ラベル付きデータを完全に活用するために,談話構造を潜在変数として扱い,それらを共同で推論し,談話認識モデルを事前学習することを提案する。
論文参考訳（メタデータ） (2023-05-24T14:06:27Z)
SuperDialseg: A Large-scale Dataset for Supervised Dialogue Segmentation [55.82577086422923]
文書地上対話の助けを借りて,対話のセグメンテーションポイントを実現可能な定義を提供する。我々は,9,478の対話を含むSuperDialsegと呼ばれる大規模教師付きデータセットをリリースする。また、対話セグメンテーションタスクの5つのカテゴリにまたがる18のモデルを含むベンチマークも提供する。
論文参考訳（メタデータ） (2023-05-15T06:08:01Z)
CluCDD:Contrastive Dialogue Disentanglement via Clustering [18.06976502939079]
毎日、膨大な数の多人数の対話がオンラインで行われている。対話の切り離しは、絡み合った対話を分離したセッションに分けることを目的としている。コントラスト学習により発話を集約するCluCDDというモデルを提案する。
論文参考訳（メタデータ） (2023-02-16T08:47:51Z)
CGoDial: A Large-Scale Benchmark for Chinese Goal-oriented Dialog Evaluation [75.60156479374416]
CGoDialは、Goal指向のダイアログ評価のための、新しい挑戦的で包括的な中国のベンチマークである。 96,763のダイアログセッションと574,949のダイアログがすべて含まれており、異なる知識ソースを持つ3つのデータセットをカバーする。学術ベンチマークと音声対話のシナリオのギャップを埋めるために、実際の会話からデータを収集したり、クラウドソーシングを通じて既存のデータセットに音声機能を追加する。
論文参考訳（メタデータ） (2022-11-21T16:21:41Z)
HybriDialogue: An Information-Seeking Dialogue Dataset Grounded on Tabular and Textual Data [87.67278915655712]
我々は、ウィキペディアのテキストとテーブルの両方を基盤とした、クラウドソーシングされた自然な会話からなる新しい対話データセットHybriDialogueを提示する。これらの会話は、複雑なマルチホップ質問をシンプルで現実的なマルチターン対話に分解することで生成される。
論文参考訳（メタデータ） (2022-04-28T00:52:16Z)
Reasoning in Dialog: Improving Response Generation by Context Reading Comprehension [49.92173751203827]
マルチターンダイアログでは、発話が文の完全な形を取るとは限らない。読み解きの質問に答えるモデルの能力を検討し、応答生成性能の向上を提案する。
論文参考訳（メタデータ） (2020-12-14T10:58:01Z)
Learning an Effective Context-Response Matching Model with Self-Supervised Tasks for Retrieval-based Dialogues [88.73739515457116]
我々は,次のセッション予測,発話復元,不整合検出,一貫性判定を含む4つの自己教師型タスクを導入する。我々はPLMに基づく応答選択モデルとこれらの補助タスクをマルチタスク方式で共同で訓練する。実験結果から,提案した補助的自己教師型タスクは,多ターン応答選択において大きな改善をもたらすことが示された。
論文参考訳（メタデータ） (2020-09-14T08:44:46Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。