論文の概要: Listen, Correct, and Feed Back: Spoken Pedagogical Feedback Generation
- arxiv url: http://arxiv.org/abs/2604.14177v1
- Date: Sat, 28 Mar 2026 07:47:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-19 19:09:11.701778
- Title: Listen, Correct, and Feed Back: Spoken Pedagogical Feedback Generation
- Title(参考訳): 耳を傾けて、正しく、フィードバックする:見事な教育的フィードバック生成
- Authors: Junhong Liang, Yifan Lu, Ekaterina Kochmar, Fajri Koto,
- Abstract要約: 我々は,Speak & Improve Challenge 2025コーパスに基づくデータセットであるtextbfSPFG (textbfSpoken textbfPedagogical textbfFeedback textbfGeneration)を紹介する。
書き起こしによる文法的誤り訂正(SGEC)の設定について検討し、3つの命令調整LDM(Qwen2.5, Llama-3.1, GLM-4)を評価する。
結果は、SFTが最も一貫した改善を提供する一方で、(DPOとKTOを使用して)嗜好に基づくアライメントが可能であることを示している。
- 参考スコア(独自算出の注目度): 25.967830220467633
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Grammatical error correction (GEC) and explanation (GEE) have made rapid progress, but real teaching scenarios also require \emph{learner-friendly pedagogical feedback} that is actionable, level-appropriate, and encouraging. We introduce \textbf{SPFG} (\textbf{S}poken \textbf{P}edagogical \textbf{F}eedback \textbf{G}eneration), a dataset built based on the Speak \& Improve Challenge 2025 corpus, pairing fluency-oriented transcriptions with GEC targets and \emph{human-verified} teacher-style feedback, including preferred/rejected feedback pairs for preference learning. We study a transcript-based Spoken Grammatical Error Correction (SGEC) setting and evaluate three instruction-tuned LLMs (Qwen2.5, Llama-3.1, and GLM-4), comparing supervised fine-tuning (SFT) with preference-based alignment (using DPO and KTO) for jointly generating corrections and feedback. Results show that SFT provides the most consistent improvements, while DPO/KTO yield smaller or mixed gains, and that correction quality and feedback quality are weakly coupled. Our implementation is available at https://github.com/Skywalker-Harrison/spfg.
- Abstract(参考訳): 文法的誤り訂正(GEC)と説明(GEE)は急速に進歩してきたが、実際の教育シナリオには、行動可能で、レベルに適合し、奨励する「emph{learner- friendly pedagogical feedback}」も必要である。
我々は,Speak \& Improve Challenge 2025コーパスをベースとしたデータセットである \textbf{SPFG} (\textbf{S}poken \textbf{P}edagogical \textbf{F}eedback \textbf{G}eneration, GECターゲットと組み合わせた流派指向の書き起こしと,嗜好学習のための優先/拒否フィードバックペアを含む,emph{human-verified} 教師スタイルのフィードバックを紹介する。
本研究では,3つの命令調整LDM(Qwen2.5,Llama-3.1,GLM-4)をSGEC(Spoken Grammatical Error Correction)で設定し,教師付き微調整(SFT)と嗜好に基づくアライメント(DPO,KTO)を比較した。
その結果、SFTは最も一貫した改善を提供する一方、DPO/KTOはより小さくまたは混合的な利得をもたらし、補正品質とフィードバック品質は弱結合であることがわかった。
私たちの実装はhttps://github.com/Skywalker-Harrison/spfg.comで公開されています。
関連論文リスト
- CLASS-IT: Conversational and Lecture-Aligned Small-Scale Instruction Tuning for BabyLMs [81.79228604962687]
本研究は,小規模のLMが命令チューニングの恩恵を受けることができるかどうかを考察する。
我々は,統合的・逐次的なカリキュラムに適用された対話型および質問応答型指導調律データセットを比較した。
その結果、命令チューニングは微調整のシナリオでは小さくても一貫した利得をもたらすことが示され、逐次キュリキュラはマージされたデータより優れていた。
しかし、改良はゼロショットタスクに一貫して移行するわけではなく、相互作用中心の適応と広範な言語一般化とのトレードオフを示唆している。
論文 参考訳(メタデータ) (2025-10-29T10:36:39Z) - End-to-End Spoken Grammatical Error Correction [33.116296120680296]
文法的誤り訂正(GEC)とフィードバックは、第二言語(L2)学習者、教育者、検査者を支援する上で重要な役割を果たす。
GECは十分に確立されているが、音声GEC(SGEC)は、相違、転写エラー、構造化された入力の欠如などにより、さらなる課題を提起する。
本研究は,SGECとフィードバック生成のためのEnd-to-End(E2E)フレームワークについて検討し,課題と実現可能なソリューションを明らかにする。
論文 参考訳(メタデータ) (2025-06-23T11:40:04Z) - Text2Grad: Reinforcement Learning from Natural Language Feedback [32.59003667154527]
我々は、自由形式のテキストフィードバックをスパンレベルの勾配に変換する、きめ細かい強化パラダイムであるText2Gradを紹介する。
以上の結果から, 自然言語フィードバックが勾配に変換された場合, より詳細な政策最適化のための強力な信号であることが示唆された。
論文 参考訳(メタデータ) (2025-05-28T13:23:49Z) - Chain of Correction for Full-text Speech Recognition with Large Language Models [21.37485126269991]
Chain of Correction (CoC) は、セグメンテーションごとにエラーセグメントを補正するマルチターンチャットフォーマットである。
実験により、CoCはフルテキストASR出力の修正において、ベースラインやベンチマークシステムよりも大幅に優れていることが示された。
論文 参考訳(メタデータ) (2025-04-02T09:06:23Z) - Improving the Validity of Automatically Generated Feedback via Reinforcement Learning [46.667783153759636]
強化学習(RL)を用いた正当性と整合性の両方を最適化するフィードバック生成フレームワークを提案する。
具体的には、直接選好最適化(DPO)によるトレーニングのための拡張データセットにおいて、GPT-4のアノテーションを使用してフィードバックペアよりも好みを生成する。
論文 参考訳(メタデータ) (2024-03-02T20:25:50Z) - Beyond Imitation: Leveraging Fine-grained Quality Signals for Alignment [105.34140537748546]
我々はFIGAという改良されたアライメント手法を提案し、従来の手法とは異なり、良質な応答と悪質な応答の対比から導出されるきめ細かい品質信号を取り込む。
まず、初期応答とそれに対応する修正データセットをペアリングする精巧なアライメントデータセットをキュレートする。
第2に,LLMの微粒な品質信号を利用してアライメントの学習を指導する新たな損失関数を考案する。
論文 参考訳(メタデータ) (2023-11-07T15:36:40Z) - Constructive Large Language Models Alignment with Diverse Feedback [76.9578950893839]
本稿では,大規模言語モデルのアライメント向上のための新しい手法として,コンストラクティブ・ディバース・フィードバック(CDF)を導入する。
我々は,簡単な問題に対する批判的フィードバック,中級問題に対する改善的フィードバック,難題に対する選好的フィードバックを利用する。
このような多様なフィードバックでモデルをトレーニングすることで、トレーニングデータの少ない使用でアライメント性能を向上させることができる。
論文 参考訳(メタデータ) (2023-10-10T09:20:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。