論文の概要: From Words to Wisdom: Discourse Annotation and Baseline Models for Student Dialogue Understanding
- arxiv url: http://arxiv.org/abs/2511.20547v1
- Date: Tue, 25 Nov 2025 17:46:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-26 17:37:04.587182
- Title: From Words to Wisdom: Discourse Annotation and Baseline Models for Student Dialogue Understanding
- Title(参考訳): 言葉から知恵へ:学生対話理解のための談話注釈とベースラインモデル
- Authors: Farjana Sultana Mim, Shuchin Aeron, Eric Miller, Kristen Wendell,
- Abstract要約: 本研究は、知識構築とタスク生産談話を含む学生会話の注釈付き教育対話データセットを導入する。
また,学習済みの大規模言語モデル GPT-3.5 と Llama-3.1 を用いて,会話のターン毎に,これらの言論特性を自動的に予測するベースラインモデルを構築した。
実験結果から,これらの最先端モデルがこの課題に対して準最適に実行し,今後の研究の可能性を示している。
- 参考スコア(独自算出の注目度): 5.459797813771498
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Identifying discourse features in student conversations is quite important for educational researchers to recognize the curricular and pedagogical variables that cause students to engage in constructing knowledge rather than merely completing tasks. The manual analysis of student conversations to identify these discourse features is time-consuming and labor-intensive, which limits the scale and scope of studies. Leveraging natural language processing (NLP) techniques can facilitate the automatic detection of these discourse features, offering educational researchers scalable and data-driven insights. However, existing studies in NLP that focus on discourse in dialogue rarely address educational data. In this work, we address this gap by introducing an annotated educational dialogue dataset of student conversations featuring knowledge construction and task production discourse. We also establish baseline models for automatically predicting these discourse properties for each turn of talk within conversations, using pre-trained large language models GPT-3.5 and Llama-3.1. Experimental results indicate that these state-of-the-art models perform suboptimally on this task, indicating the potential for future research.
- Abstract(参考訳): 学生の会話における談話の特徴を特定することは、学習者が単にタスクを完了させるのではなく、知識構築に学生を関与させるような、カリキュラム変数や教育変数を認識することが、教育研究者にとって非常に重要である。
これらの談話の特徴を特定するための学生の会話のマニュアル分析は、時間と労働集約であり、研究の規模と範囲を制限している。
自然言語処理(NLP)技術を活用することで、これらの談話機能の自動検出が容易になり、教育研究者がスケーラブルでデータ駆動的な洞察を提供する。
しかし、対話における談話に焦点を当てたNLPにおける既存の研究は、教育データにはほとんど対応していない。
本研究では,知識構築とタスク生産談話を特徴とする学生会話の注釈付き教育対話データセットを導入することで,このギャップに対処する。
また,学習済みの大規模言語モデル GPT-3.5 と Llama-3.1 を用いて,会話のターン毎に,これらの言論特性を自動的に予測するベースラインモデルを構築した。
実験結果から,これらの最先端モデルがこの課題に対して準最適に実行し,今後の研究の可能性を示している。
関連論文リスト
- IntrEx: A Dataset for Modeling Engagement in Educational Conversations [7.526860155587907]
IntrExは、教師と学生の交流における興味と期待される興味を示す最初の大きなデータセットである。
我々は、100以上の第二言語学習者による厳密なアノテーションプロセスを採用している。
大規模言語モデル(LLM)が人間の興味ある判断を予測できるかどうかを検討する。
論文 参考訳(メタデータ) (2025-09-08T13:07:35Z) - LLM-Assisted Automated Deductive Coding of Dialogue Data: Leveraging Dialogue-Specific Characteristics to Enhance Contextual Understanding [0.0]
本研究では,LLMを用いた対話データの自動符号化手法を開発した。
対話特有の特徴に基づいて発話のコードを予測する。
また,行動予測の精度は事象予測の精度よりも一貫して高かった。
論文 参考訳(メタデータ) (2025-04-28T12:31:38Z) - WavChat: A Survey of Spoken Dialogue Models [66.82775211793547]
GPT-4oのようなシステムで実証された音声対話モデルの最近の進歩は、音声領域において大きな注目を集めている。
これらの高度な音声対話モデルは、音声、音楽、その他の音声関連の特徴を理解するだけでなく、音声のスタイリスティックな特徴や音節的な特徴も捉える。
音声対話システムの進歩にもかかわらず、これらのシステムを体系的に組織化し分析する包括的調査が欠如している。
論文 参考訳(メタデータ) (2024-11-15T04:16:45Z) - Exploring Knowledge Tracing in Tutor-Student Dialogues using LLMs [49.18567856499736]
本研究では,大規模言語モデル(LLM)が対話学習を支援することができるかどうかを検討する。
我々は,学習者の知識レベルを対話全体にわたって追跡するために,ラベル付きデータに知識追跡(KT)手法を適用した。
我々は,2つの学習対話データセットの実験を行い,従来のKT手法よりも学生の反応の正しさを予測できる新しいLCM-based method LLMKTが優れていることを示す。
論文 参考訳(メタデータ) (2024-09-24T22:31:39Z) - Bridging Information Gaps in Dialogues With Grounded Exchanges Using Knowledge Graphs [4.449835214520727]
対話的接地のための大規模言語モデルの可能性について検討する。
私たちのアプローチでは、5つの知識領域にまたがる人間の会話を注釈付けして、BridgeKGと呼ばれる対話コーパスを作成します。
本研究は,これらのモデルが会話ベースタスクや一般的な予測誤りに対して,コンテキスト内学習をどのように利用するかについての知見を提供する。
論文 参考訳(メタデータ) (2024-08-02T08:07:15Z) - Learning to Memorize Entailment and Discourse Relations for
Persona-Consistent Dialogues [8.652711997920463]
既存の作業は、高度ネットワーク構造を持つ対話者ペルソナを意図的に学習することで、対話システムの性能を改善した。
本研究は,ペルソナ一貫性のある対話課題における係り受け関係と談話関係を記憶する学習方法を提案する。
論文 参考訳(メタデータ) (2023-01-12T08:37:00Z) - "How Robust r u?": Evaluating Task-Oriented Dialogue Systems on Spoken
Conversations [87.95711406978157]
本研究は、音声タスク指向会話における新しいベンチマークを示す。
マルチドメイン対話状態追跡と知識基底型対話モデルについて検討する。
我々のデータセットは,タスク指向対話システムの音声によるベンチマークを可能にする。
論文 参考訳(メタデータ) (2021-09-28T04:51:04Z) - Structural Pre-training for Dialogue Comprehension [51.215629336320305]
本稿では,SPIDER, Structure Pre-trained DialoguE Readerについて述べる。
対話のような特徴をシミュレートするために,元のLM目的に加えて,2つの訓練目標を提案する。
広く使われている対話ベンチマークの実験結果から,新たに導入した自己教師型タスクの有効性が検証された。
論文 参考訳(メタデータ) (2021-05-23T15:16:54Z) - Advances in Multi-turn Dialogue Comprehension: A Survey [51.215629336320305]
対話モデリングの観点から,従来の手法を検討した。
対話理解タスクで広く使用されている対話モデリングの3つの典型的なパターンについて議論します。
論文 参考訳(メタデータ) (2021-03-04T15:50:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。