論文の概要: Embedding Enhancement via Fine-Tuned Language Models for Learner-Item Cognitive Modeling
- arxiv url: http://arxiv.org/abs/2604.04088v1
- Date: Sun, 05 Apr 2026 12:11:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-07 15:49:18.912567
- Title: Embedding Enhancement via Fine-Tuned Language Models for Learner-Item Cognitive Modeling
- Title(参考訳): 学習項目認知モデルのための微調整言語モデルによる埋め込み強化
- Authors: Yuanhao Liu, Zihan Zhou, Kaiying Wu, Shuo Liu, Yiyang Huang, Jiajun Guo, Aimin Zhou, Hong Qian,
- Abstract要約: 本稿では,学習者間認知モデルのための統合埋め込み拡張フレームワークであるEduEmbedを紹介する。
本研究は,CDモデルのセマンティックギャップを橋渡しするために,役割特化表現と相互作用診断に基づくLMを微調整する。
提案手法を4つのCDタスクとコンピュータ適応テスト(CAT)タスクで評価し,ロバストな性能を実現する。
- 参考スコア(独自算出の注目度): 26.701229986225997
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Learner-item cognitive modeling plays a central role in the web-based online intelligent education system by enabling cognitive diagnosis (CD) across diverse online educational scenarios. Although ID embedding remains the mainstream approach in cognitive modeling due to its effectiveness and flexibility, recent advances in language models (LMs) have introduced new possibilities for incorporating rich semantic representations to enhance CD performance. This highlights the need for a comprehensive analysis of how LMs enhance embeddings through semantic integration across mainstream CD tasks. This paper identifies two key challenges in fully leveraging LMs in existing work: Misalignment between the training objectives of LMs and CD models creates a distribution gap in feature spaces; A unified framework is essential for integrating textual embeddings across varied CD tasks while preserving the strengths of existing cognitive modeling paradigms to ensure the robustness of embedding enhancement. To address these challenges, this paper introduces EduEmbed, a unified embedding enhancement framework that leverages fine-tuned LMs to enrich learner-item cognitive modeling across diverse CD tasks. EduEmbed operates in two stages. In the first stage, we fine-tune LMs based on role-specific representations and an interaction diagnoser to bridge the semantic gap of CD models. In the second stage, we employ a textual adapter to extract task-relevant semantics and integrate them with existing modeling paradigms to improve generalization. We evaluate the proposed framework on four CD tasks and computerized adaptive testing (CAT) task, achieving robust performance. Further analysis reveals the impact of semantic information across diverse tasks, offering key insights for future research on the application of LMs in CD for online intelligent education systems.
- Abstract(参考訳): 学習イテム認知モデリングは、様々なオンライン教育シナリオにまたがる認知診断(CD)を可能にすることにより、Webベースのオンライン知的教育システムにおいて中心的な役割を果たす。
ID埋め込みは、その有効性と柔軟性のために認知モデリングにおいて依然として主流のアプローチであるが、近年の言語モデル(LM)の進歩により、CD性能を高めるためにリッチセマンティック表現を組み込む新たな可能性が導入されている。
これは、メインストリームのCDタスク間のセマンティック統合を通じて、LMが埋め込みを強化する方法の包括的な分析の必要性を強調している。
本稿では,既存の作業におけるLMの完全活用における2つの重要な課題について述べる。 LMとCDモデルのトレーニング目標の相違は,特徴空間の分散ギャップを生じさせる; 既存の認知モデリングパラダイムの強みを保ちつつ,様々なCDタスクにまたがるテキスト埋め込みを統合するためには,統一的なフレームワークが不可欠である。
これらの課題に対処するため,本論文では,細調整されたLMを活用し,多様なCDタスクにまたがる学習者・イテム認知モデルを強化する統合組込み拡張フレームワークであるEduEmbedを紹介する。
EduEmbedは2つの段階に分かれている。
第1段階では,CDモデルのセマンティックギャップを埋めるために,役割特化表現と相互作用診断に基づいて微調整を行う。
第2段階では、タスク関連セマンティクスを抽出するためにテキストアダプタを使用し、それらを既存のモデリングパラダイムと統合して一般化を改善する。
提案手法を4つのCDタスクとコンピュータ適応テスト(CAT)タスクで評価し,ロバストな性能を実現する。
さらに分析した結果、様々なタスクにまたがる意味情報の影響が明らかとなり、オンライン知的教育システムにおけるCDにおけるLMの適用に関する今後の研究に重要な洞察を提供する。
関連論文リスト
- The Landscape of Agentic Reinforcement Learning for LLMs: A Survey [103.32591749156416]
エージェント強化学習(Agentic RL)の出現は、大規模言語モデル(LLM RL)に適用された従来の強化学習からパラダイムシフトを示している。
本研究では, LLM-RLの縮退した単段階マルコフ決定過程(MDPs)と, エージェントRLを定義する部分可観測マルコフ決定過程(POMDPs)とを対比することにより, この概念シフトを定式化する。
論文 参考訳(メタデータ) (2025-09-02T17:46:26Z) - Agentic Workflow for Education: Concepts and Applications [7.875055566698523]
本研究では,自己回帰,ツールの実行,タスク計画,マルチエージェント協調からなる4成分モデルであるエージェント・フォー・教育(AWE)を紹介した。
AWEは、教師の作業量を削減し、教育の質を高め、より広範な教育革新を可能にする、有望な道を提供する。
論文 参考訳(メタデータ) (2025-09-01T14:39:48Z) - LMCD: Language Models are Zeroshot Cognitive Diagnosis Learners [12.80627587335383]
認知診断(CD)はAIを活用した教育において重要な課題となっている。
プレトレーニング言語モデル(PLM)を利用した最近のNLPベースのアプローチは有望である。
ゼロショット認知診断学習者(LMCD)として言語モデルを提案する。
2つの実世界のデータセットの実験により、LMCDはエクササイズコールドとドメインコールドの両方で最先端の手法を大幅に上回っていることが示された。
論文 参考訳(メタデータ) (2025-05-27T14:19:35Z) - LLM4CD: Leveraging Large Language Models for Open-World Knowledge Augmented Cognitive Diagnosis [56.50378080174923]
オープンワールド知識強化認知診断のための大規模言語モデルを活用するLCM4CDを提案する。
本手法はLLMのオープンワールド知識を利用して認知表現型テキスト表現を構築し,CDタスクにリッチな意味情報を導入する。
このアプローチは、従来のID埋め込みを意味表現に置き換え、新しい学生やオープンワールドの知識を持つエクササイズに対応できるようにし、コールドスタート問題に対処する。
論文 参考訳(メタデータ) (2025-05-14T14:48:00Z) - Unified Generative and Discriminative Training for Multi-modal Large Language Models [88.84491005030316]
生成的トレーニングにより、視覚言語モデル(VLM)は様々な複雑なタスクに取り組むことができる。
CLIPのようなモデルで実証された差別的トレーニングは、ゼロショットイメージテキストの分類と検索に優れています。
本稿では,両パラダイムの強みを統合する統一的アプローチを提案する。
論文 参考訳(メタデータ) (2024-11-01T01:51:31Z) - Scalable Language Model with Generalized Continual Learning [58.700439919096155]
The Joint Adaptive Re-ization (JARe) is integrated with Dynamic Task-related Knowledge Retrieval (DTKR) to enable adapt adjust of language model based on specific downstream task。
提案手法は,様々なバックボーンやベンチマーク上での最先端性能を実証し,最小限の忘れを伴い,フルセットおよび少数ショットのシナリオにおいて効果的な連続学習を実現する。
論文 参考訳(メタデータ) (2024-04-11T04:22:15Z) - Interactive Continual Learning: Fast and Slow Thinking [19.253164551254734]
本稿では,対話型連続学習フレームワークを提案する。
System1におけるメモリ検索を改善するために,von Mises-Fisher(vMF)分布に基づくCL-vMF機構を導入する。
提案したICLの包括的評価は,既存の手法と比較して,忘れられ,優れた性能を示す。
論文 参考訳(メタデータ) (2024-03-05T03:37:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。