論文の概要: K12-KGraph: A Curriculum-Aligned Knowledge Graph for Benchmarking and Training Educational LLMs
- arxiv url: http://arxiv.org/abs/2605.09635v1
- Date: Sun, 10 May 2026 16:24:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-13 02:24:05.53882
- Title: K12-KGraph: A Curriculum-Aligned Knowledge Graph for Benchmarking and Training Educational LLMs
- Title(参考訳): K12-KGraph: ベンチマークと教育用LLMのためのカリキュラム対応知識グラフ
- Authors: Hao Liang, Qihan Lin, Zhaoyang Han, Xiaochen Ma, Zhen Hao Wong, Meiyi Qiang, Linzhuang Sun, Wentao Zhang,
- Abstract要約: K12-KGraphは,教育出版の教科書から抽出したカリキュラムに整合した知識グラフである。
このグラフには7つのノードタイプ(概念、スキル、実験、セクション、章、書籍)と、分類、前提条件、関連性、検証、位置、順序を含む9つの関係タイプが含まれている。
K12-Benchでは、Gemini-3-Flashは57%の正確なマッチングしか達成せず、最高のオープンソースモデルであるGemma-4-31B-ITは46%に達した。
- 参考スコア(独自算出の注目度): 13.794369477415293
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Large language models (LLMs) are increasingly used in K-12 education, yet existing benchmarks such as C-Eval, CMMLU, GaokaoBench, and EduEval mainly evaluate factual recall through exam-style question answering. Effective educational AI additionally requires curriculum cognition: understanding how knowledge is structured through prerequisite chains, concept taxonomies, experiment-concept links, and pedagogical sequencing. To address this gap, we introduce K12-KGraph, a curriculum-aligned knowledge graph extracted from official People's Education Press textbooks across mathematics, physics, chemistry, and biology from primary to high school. The graph contains seven node types (Concept, Skill, Experiment, Exercise, Section, Chapter, Book) and nine relation types covering taxonomy, prerequisite, association, verification, assessment, location, and order. Based on this graph, we construct two resources: (1) K12-Bench, a 23,640-question multi-select benchmark spanning five graph-derived task families (Ground, Prereq, Neighbor, Evidence, and Locate); and (2) K12-Train, a KG-guided supervised fine-tuning corpus of approximately 2,300 QA pairs synthesized from graph structure and node attributes. Experiments reveal substantial deficiencies in curriculum cognition: on K12-Bench, Gemini-3-Flash achieves only 57% exact match, while the best open-source model, Gemma-4-31B-IT, reaches 46%. Under a strictly matched 2,300-sample SFT budget on Qwen3-4B-Base and Llama-3.1-8B-Base, K12-Train consistently outperforms equally sized subsets from eight mainstream instruction-tuning corpora on both GaokaoBench and EduEval, demonstrating that curriculum-structured supervision is highly sample-efficient for educational tuning. We release the graph, benchmark, training data, and full construction pipeline.
- Abstract(参考訳): 大規模言語モデル (LLM) は、K-12教育での利用が増えているが、C-Eval、CMMLU、GaokaoBench、EduEvalといった既存のベンチマークは、主に試験スタイルの質問応答を通じて事実的リコールを評価する。
さらに効果的な教育AIはカリキュラムの認知を必要とする: 知識が前提となる連鎖、概念分類、実験と概念のリンク、教育的なシークエンシングを通じてどのように構成されているかを理解する。
このギャップに対処するために、小学校から高校までの数学、物理学、化学、生物学に関する公式のピープルズ・エデュケーション・プレス教科書から抽出したカリキュラム対応の知識グラフであるK12-KGraphを紹介した。
このグラフには7つのノードタイプ(概念、スキル、実験、運動、セクション、章、書籍)と9つの関係タイプがあり、分類、前提条件、関連性、検証、評価、位置、順序を含んでいる。
このグラフに基づいて、(1)K12-Bench、(Ground, Prereq, Neighbor, Evidence, Locate)5つのグラフ由来のタスクファミリにまたがる23,640のマルチセレクションベンチマーク、(2)K12-Train、(グラフ構造とノード属性から合成された約2,300QAペアのKG誘導微調整コーパスを構築する。
K12-Benchでは、Gemini-3-Flashは57%の正確なマッチングしか達成せず、最高のオープンソースモデルであるGemma-4-31B-ITは46%に達した。
Qwen3-4B-BaseとLlama-3.1-8B-Baseの2,300サンプルのSFT予算の下では、K12-Trainはガオカオベンチとエドゥエヴァルの8つのメインストリームの教育訓練コーパスから同じ大きさのサブセットを一貫して上回り、カリキュラム構造化の監督は教育のチューニングに非常に有効であることを示した。
グラフ、ベンチマーク、トレーニングデータ、完全な構築パイプラインをリリースしています。
関連論文リスト
- Enhancing Imbalanced Node Classification via Curriculum-Guided Feature Learning and Three-Stage Attention Network [5.709363708126687]
グラフニューラルネットワーク(GNN)における不均衡ノード分類は、モデルが不公平に学習し、あまり一般的でないクラスで性能を悪くする原因となる。
カリキュラム型特徴学習と3段階注意ネットワーク(CL3AN-GNN)を提案する。
社会的,生物学的,引用ネットワークにまたがる8つのOpen Graph Benchmarkデータセット上でCL3AN-GNNを評価した。
論文 参考訳(メタデータ) (2026-02-03T18:10:40Z) - Enhancing Large Language Model for Knowledge Graph Completion via Structure-Aware Alignment-Tuning [52.78024385391959]
知識グラフ補完(KGC)は、知識グラフから新しい知識を推測し、予測することを目的としている。
既存の手法は、自然言語とグラフ構造の間の矛盾した表現空間を無視することが多い。
構造認識アライメントチューニングにより,KGCのためのLLMを強化する新しいフレームワークSATを提案する。
論文 参考訳(メタデータ) (2025-09-01T06:38:11Z) - GKG-LLM: A Unified Framework for Generalized Knowledge Graph Construction [11.575505739575023]
一般化知識グラフを構築するための統一的なフレームワークを提案する。
まず、3種類のグラフにまたがる29のデータセットで15のサブタスクからデータを収集する。
そこで我々は,3種類のグラフからの知識を大規模言語モデルに反復的に注入することにより,3段階のカリキュラム学習微調整フレームワークを提案する。
論文 参考訳(メタデータ) (2025-03-14T09:23:22Z) - Graphusion: Leveraging Large Language Models for Scientific Knowledge Graph Fusion and Construction in NLP Education [14.368011453534596]
フリーテキストからのゼロショット知識グラフフレームワークであるGraphusionを紹介する。
核融合モジュールは、エンティティのマージ、競合解決、新しい三重項発見を取り入れた三重項のグローバルなビューを提供する。
本評価は,リンク予測における教師付きベースラインの精度を最大10%超えることを示す。
論文 参考訳(メタデータ) (2024-07-15T15:13:49Z) - State of the Art and Potentialities of Graph-level Learning [54.68482109186052]
グラフレベルの学習は、比較、回帰、分類など、多くのタスクに適用されている。
グラフの集合を学習する伝統的なアプローチは、サブストラクチャのような手作りの特徴に依存している。
ディープラーニングは、機能を自動的に抽出し、グラフを低次元表現に符号化することで、グラフレベルの学習をグラフの規模に適応させるのに役立っている。
論文 参考訳(メタデータ) (2023-01-14T09:15:49Z) - EDUKG: a Heterogeneous Sustainable K-12 Educational Knowledge Graph [27.95265784375714]
異種持続可能なK-12教育知識グラフであるEDUKGを提案する。
我々はまず,K-12教育における知識と資源を一様にモデル化するための,学際的できめ細かなオントロジーを設計する。
本稿では,教科書から事実知識をインタラクティブに抽出する柔軟な手法を提案する。
EDUKGには2億2200万以上のエンティティと386億のトリプルがある。
論文 参考訳(メタデータ) (2022-10-21T20:14:41Z) - KGE-CL: Contrastive Learning of Knowledge Graph Embeddings [64.67579344758214]
本稿では,知識グラフ埋め込みのための簡易かつ効率的な学習フレームワークを提案する。
これは、関連するエンティティと異なる三重項におけるエンティティ-リレーションのカップルのセマンティック距離を短縮することができる。
WN18RRデータセットで51.2% MRR、46.8% Hits@1、59.1% MRR、51.8% Hits@1、YAGO3-10データセットで達成できる。
論文 参考訳(メタデータ) (2021-12-09T12:45:33Z) - Investigating Pretrained Language Models for Graph-to-Text Generation [55.55151069694146]
Graph-to-text生成は、グラフベースのデータから流動的なテキストを生成することを目的としている。
本稿では,3つのグラフ領域,つまり表現,ウィキペディア知識グラフ(KG),科学的なKGについて検討する。
我々は, PLM の BART と T5 が新たな最先端の成果を達成し, タスク適応型事前学習戦略が性能をさらに向上することを示す。
論文 参考訳(メタデータ) (2020-07-16T16:05:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。