論文の概要: Controllable Spoken Dialogue Generation: An LLM-Driven Grading System for K-12 Non-Native English Learners
- arxiv url: http://arxiv.org/abs/2604.22542v1
- Date: Fri, 24 Apr 2026 13:33:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-27 15:36:26.472716
- Title: Controllable Spoken Dialogue Generation: An LLM-Driven Grading System for K-12 Non-Native English Learners
- Title(参考訳): 制御可能な音声対話生成:K-12非負の英語学習者のためのLLM駆動グラディングシステム
- Authors: Haidong Yuan, Haokun Zhao, Wanshi Xu, Songjun Cao, Qingyu Zhou, Long Ma, Hongjie Fan,
- Abstract要約: 大規模言語モデル(LLM)は、非ネイティブな文脈において、K-12英語学習者の教育的ニーズを満たすことができないことが多い。
本稿では,中国国家カリキュラム(CSE)を代表事例として,LLM出力を学習者能力に適応する習熟度対応フレームワークを提案する。
我々のフレームワークは4階層のグレーディングシステムを通じて語彙の複雑さを正確に制御し、新しいリソースの集合を包括的にサポートする。
- 参考スコア(独自算出の注目度): 11.81809020716964
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large language models (LLMs) often fail to meet the pedagogical needs of K-12 English learners in non-native contexts due to a proficiency mismatch. To address this widespread challenge, we introduce a proficiency-aligned framework that adapts LLM outputs to learner abilities, using China's national curriculum (CSE) as a representative case. Our framework enables precise control over lexical complexity through a four-tier grading system, supported by a comprehensive suite of new resources: graded vocabulary lists and a multi-turn dialogue corpus. Our core technical contribution is the \textbf{DDPO} algorithm,Diversity Driven Policy Optimization, a multi-turn GRPO-based approach designed to preserve dialogue diversity while holistically optimizing dialogue quality. This method significantly outperforms conventional approaches, achieving low out-of-vocabulary rates and high diversity while enhancing conversational naturalness and pedagogical value. While grounded in the CSE, our framework is designed for flexibility and can be readily adapted to other educational standards. Our models, data, and code will all be open-sourced, providing a scalable platform for personalized English speaking practice that effectively addresses the unique challenges faced by K-12 learners in non-immersive environments.
- Abstract(参考訳): 大規模言語モデル(LLM)は、習熟ミスマッチのため、非ネイティブな文脈でK-12英語学習者の教育的ニーズを満たすことができないことが多い。
この課題に対処するために,中国国家カリキュラム(CSE)を代表事例として,LLM出力を学習者能力に適応する習熟度整合型枠組みを導入する。
我々のフレームワークは4階層のグレーティングシステムを通じて語彙の複雑さを正確に制御し、グレードドボキャブラリリストとマルチターン対話コーパスという、新しいリソース群を包括的にサポートする。
我々の中核となる技術的貢献は、対話品質を均等に最適化しつつ、対話の多様性を保ちつつ、多ターンGRPOベースのアプローチである、Diversity Driven Policy Optimizationである。
本手法は,会話の自然性や教育的価値を高めつつ,低語彙化率,高多様性を実現し,従来の手法よりも優れていた。
我々のフレームワークは、CSEに基礎を置いているが、柔軟性のために設計されており、他の教育標準にも容易に適応できる。
当社のモデル,データ,コードはすべてオープンソースとして公開され,K-12学習者が非没入環境において直面するユニークな課題に効果的に対処する,パーソナライズされた英語の実践のためのスケーラブルなプラットフォームを提供する。
関連論文リスト
- LVRPO: Language-Visual Alignment with GRPO for Multimodal Understanding and Generation [51.071351994330605]
統一型マルチモーダル事前訓練は,単一の基礎モデル内での言語とビジョンを共同でモデル化するための,有望なパラダイムとして登場した。
既存のアプローチは暗黙的あるいは間接的なアライメント信号に大きく依存しており、マルチモーダル理解と生成を同時にサポートするのに最適である。
LVRPOは言語と視覚的表現を明確に整合させる言語-視覚的強化に基づく嗜好最適化フレームワークである。
論文 参考訳(メタデータ) (2026-03-29T13:38:21Z) - Controlling Language Difficulty in Dialogues with Linguistic Features [9.426180715334667]
言語アノテートされた対話データに基づく大規模言語モデル(LLM)の訓練は、言語習熟度を正確に調節することができる。
提案手法は,高い対話品質を維持しつつ,言語能力の優れた制御性を実現する。
論文 参考訳(メタデータ) (2025-09-18T02:22:43Z) - Alignment Drift in CEFR-prompted LLMs for Interactive Spanish Tutoring [0.0]
本稿では,第二言語学習における適応型チューターとしてのLarge Language Models(LLMs)の可能性について検討する。
スペイン語の教師と学生の対話を,7Bから12Bまでの大きさの命令調整型オープンソースのLLMを用いてシミュレートした。
次に、チューターモデルからの出力を用いて、3つの習熟度レベルにわたるテキストの難易度を制御するCEFRベースのプロンプトの有効性を評価する。
論文 参考訳(メタデータ) (2025-05-13T08:50:57Z) - Conditional Language Policy: A General Framework for Steerable Multi-Objective Finetuning [72.46388818127105]
Conditional Language Policy (CLP) は、複数の目的に対して言語モデルを微調整するためのフレームワークである。
CLPは、推論時に競合する目的を効果的にトレードオフするステアブルモデルを学ぶ。
論文 参考訳(メタデータ) (2024-07-22T16:13:38Z) - Scalable Language Model with Generalized Continual Learning [58.700439919096155]
The Joint Adaptive Re-ization (JARe) is integrated with Dynamic Task-related Knowledge Retrieval (DTKR) to enable adapt adjust of language model based on specific downstream task。
提案手法は,様々なバックボーンやベンチマーク上での最先端性能を実証し,最小限の忘れを伴い,フルセットおよび少数ショットのシナリオにおいて効果的な連続学習を実現する。
論文 参考訳(メタデータ) (2024-04-11T04:22:15Z) - DIALIGHT: Lightweight Multilingual Development and Evaluation of
Task-Oriented Dialogue Systems with Large Language Models [76.79929883963275]
DIALIGHTは多言語タスク指向対話(ToD)システムの開発と評価のためのツールキットである。
ローカル発話レベルとグローバル対話レベルの両方において、人間のきめ細かい評価のためのセキュアでユーザフレンドリーなWebインターフェースを備えている。
評価の結果, PLMの微調整により精度とコヒーレンスが向上する一方, LLMベースのシステムは多様で類似した応答を生成するのに優れていた。
論文 参考訳(メタデータ) (2024-01-04T11:27:48Z) - Cross-lingual Data Augmentation for Document-grounded Dialog Systems in
Low Resource Languages [0.0]
本稿では,逆トレーニング検索 (Retriever and Re-ranker) と Fid (Fusion-in-decoder) ジェネレータを含む新しいパイプラインCLEM (Cross-Lingual Enhanced Model) を提案する。
また,ハイリソース言語をさらに活用するために,翻訳学習による多言語間のアライメントを実現する革新的なアーキテクチャを提案する。
論文 参考訳(メタデータ) (2023-05-24T09:40:52Z) - MaPLe: Multi-modal Prompt Learning [54.96069171726668]
本稿では,視覚と言語分岐の両方を対象としたマルチモーダル・プロンプト・ラーニング(MaPLe)を提案し,視覚と言語表現の整合性を改善する。
最先端のCo-CoOpと比較すると、MaPLeは優れた性能を示し、新規クラスでは3.45%の絶対的な向上を達成している。
論文 参考訳(メタデータ) (2022-10-06T17:59:56Z) - A Mixture-of-Expert Approach to RL-based Dialogue Management [56.08449336469477]
我々は、強化学習を用いて、近視性(一般的な発話の出力)を回避し、全体的なユーザ満足度を最大化する対話エージェントを開発する。
既存のRLアプローチのほとんどは、単語レベルでエージェントを訓練するので、中規模の語彙であっても、非常に複雑なアクション空間を扱う必要がある。
i)会話履歴の多様な意味を学習できるLMと、(ii)対応する発話を生成できる専門的なLM(または専門家)からなる、新しい専門家言語モデル(MoE-LM)を用いたRLベースのDMを開発する。
論文 参考訳(メタデータ) (2022-05-31T19:00:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。