論文の概要: Data Selection for Multi-turn Dialogue Instruction Tuning
- arxiv url: http://arxiv.org/abs/2604.07892v2
- Date: Sun, 12 Apr 2026 02:03:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-14 14:47:45.792977
- Title: Data Selection for Multi-turn Dialogue Instruction Tuning
- Title(参考訳): マルチターン対話指導のためのデータ選択
- Authors: Bo Li, Shikun Zhang, Wei Ye,
- Abstract要約: textbfMDS (Multi-turn Dialogue Selection) は、独立したターンではなく、会話全体をスコアする対話レベルフレームワークである。
MDSは、強力なシングルターンセレクタ、対話レベルスコアラ、ベースラインを3つのマルチターンベンチマークとドメイン内バンキングテストセットで上回る。
- 参考スコア(独自算出の注目度): 36.29487117560294
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Instruction-tuned language models increasingly rely on large multi-turn dialogue corpora, but these datasets are often noisy and structurally inconsistent, with topic drift, repetitive chitchat, and mismatched answer formats across turns. We address this from a data selection perspective and propose \textbf{MDS} (Multi-turn Dialogue Selection), a dialogue-level framework that scores whole conversations rather than isolated turns. MDS combines a global coverage stage that performs bin-wise selection in the user-query trajectory space to retain representative yet non-redundant dialogues, with a local structural stage that evaluates within-dialogue reliability through entity-grounded topic grounding and information progress, together with query-answer form consistency for functional alignment. MDS outperforms strong single-turn selectors, dialogue-level LLM scorers, and heuristic baselines on three multi-turn benchmarks and an in-domain Banking test set, achieving the best overall rank across reference-free and reference-based metrics, and is more robust on long conversations under the same training budget. Code and resources are included in the supplementary materials.
- Abstract(参考訳): 命令調整型言語モデルは、大きなマルチターン対話コーパスにますます依存しているが、これらのデータセットは、しばしばノイズが多く、構造的に一貫性がない。
データ選択の観点からこの問題に対処し,独立したターンではなく会話全体をスコアする対話レベルフレームワークである‘textbf{MDS} (Multi-turn Dialogue Selection) を提案する。
MDSは、ユーザ・クエリ・トラジェクトリ空間におけるバイナリ・ワイド・セレクションを実行し、非冗長な対話を代表的に維持するグローバル・カバレッジ・ステージと、エンティティ・グラウンドド・トピック・グラウンドディングと情報・プログレスを通じて対話内信頼性を評価するローカル・ストラクチャ・ステージと、機能的アライメントのためのクエリ・アンサー・フォーム整合性を組み合わせた。
MDSは、3つのマルチターンベンチマークとドメイン内バンキングテストセットで強力なシングルターンセレクタ、対話レベルLLMスコアラ、ヒューリスティックベースラインを上回り、参照なしおよび参照ベースメトリクス全体で最高の総合ランクを獲得し、同じトレーニング予算の下での長い会話においてより堅牢である。
コードとリソースは補充材料に含まれている。
関連論文リスト
- Dynamic Knowledge Fusion for Multi-Domain Dialogue State Tracking [14.34658776558061]
マルチドメインDSTに適用可能な動的知識融合フレームワークを開発する。
マルチドメイン・ダイアログ・ベンチマークから得られた結果から,本手法は対話追跡の精度と一般化を著しく向上することが示された。
論文 参考訳(メタデータ) (2026-03-11T03:29:26Z) - How to Choose How to Choose Your Chatbot: A Massively Multi-System MultiReference Data Set for Dialog Metric Evaluation [7.781647951264202]
我々はMMSMR(Massively Multi-System Multi Reference dataset)をリリースし、ダイアログのメトリクスと評価の今後の取り組みを可能にする。
我々は、単一参照評価セットを拡張して8参照ダイアログデータセットを作成し、リリースする。
次に、1750のシステムをトレーニングし、新しいテストセットとDailyDialogデータセットで評価します。
論文 参考訳(メタデータ) (2023-05-23T21:33:43Z) - Re$^3$Dial: Retrieve, Reorganize and Rescale Dialogue Corpus for
Long-Turn Open-Domain Dialogue Pre-training [90.3412708846419]
既存の事前学習コーパスのほとんどの対話は、3回未満の対話を含む。
数十億ドル規模のロングターン対話を自動的に構築するRetrieve, Reorganize, Rescale framework (Re$3$Dial)を提案する。
上記のプロセスを繰り返すことで、Re$3$Dialはコヒーレントなロングターン対話をもたらすことができる。
論文 参考訳(メタデータ) (2023-05-04T07:28:23Z) - FCC: Fusing Conversation History and Candidate Provenance for Contextual
Response Ranking in Dialogue Systems [53.89014188309486]
複数のチャネルからコンテキスト情報を統合できるフレキシブルなニューラルネットワークフレームワークを提案する。
会話応答ランキングタスクの評価に広く用いられているMSDialogデータセット上で,本モデルの評価を行った。
論文 参考訳(メタデータ) (2023-03-31T23:58:28Z) - DIONYSUS: A Pre-trained Model for Low-Resource Dialogue Summarization [127.714919036388]
DIONYSUSは、任意の新しいドメインでの対話を要約するための訓練済みエンコーダデコーダモデルである。
実験の結果,DIONYSUSは6つのデータセット上で既存の手法よりも優れていた。
論文 参考訳(メタデータ) (2022-12-20T06:21:21Z) - CGoDial: A Large-Scale Benchmark for Chinese Goal-oriented Dialog
Evaluation [75.60156479374416]
CGoDialは、Goal指向のダイアログ評価のための、新しい挑戦的で包括的な中国のベンチマークである。
96,763のダイアログセッションと574,949のダイアログがすべて含まれており、異なる知識ソースを持つ3つのデータセットをカバーする。
学術ベンチマークと音声対話のシナリオのギャップを埋めるために、実際の会話からデータを収集したり、クラウドソーシングを通じて既存のデータセットに音声機能を追加する。
論文 参考訳(メタデータ) (2022-11-21T16:21:41Z) - UniConv: A Unified Conversational Neural Architecture for Multi-domain
Task-oriented Dialogues [101.96097419995556]
ユニコンブ」はタスク指向対話におけるエンドツーエンド対話システムのための新しい統合型ニューラルネットワークである。
我々は、MultiWOZ2.1ベンチマークにおいて、対話状態追跡、コンテキスト・ツー・テキスト、エンドツーエンド設定の包括的な実験を行う。
論文 参考訳(メタデータ) (2020-04-29T16:28:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。