論文の概要: Generating Multiple-Choice Knowledge Questions with Interpretable Difficulty Estimation using Knowledge Graphs and Large Language Models
- arxiv url: http://arxiv.org/abs/2604.10748v1
- Date: Sun, 12 Apr 2026 17:42:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-14 20:13:16.200138
- Title: Generating Multiple-Choice Knowledge Questions with Interpretable Difficulty Estimation using Knowledge Graphs and Large Language Models
- Title(参考訳): 知識グラフと大規模言語モデルを用いた解釈困難度推定による複数項目知識質問の生成
- Authors: Mehmet Can Şakiroğlu, H. Altay Güvenir, Kamer Kaya,
- Abstract要約: 本研究では,入力文書からの難易度を推定し,複数の質問(MCQ)を生成する手法を提案する。
提案手法では,入力文書からKGをLLMで構築し,MCQを体系的に生成する。
各MCQに対して、データ駆動アプローチを用いて、9つの困難信号を計算し、統一困難スコアに結合する。
- 参考スコア(独自算出の注目度): 1.1470070927586014
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generating multiple-choice questions (MCQs) with difficulty estimation remains challenging in automated MCQ-generation systems used in adaptive, AI-assisted education. This study proposes a novel methodology for generating MCQs with difficulty estimation from the input documents by utilizing knowledge graphs (KGs) and large language models (LLMs). Our approach uses an LLM to construct a KG from input documents, from which MCQs are then systematically generated. Each MCQ is generated by selecting a node from the KG as the key, sampling a related triple or quintuple -- optionally augmented with an extra triple -- and prompting an LLM to generate a corresponding stem from these graph components. Distractors are then selected from the KG. For each MCQ, nine difficulty signals are computed and combined into a unified difficulty score using a data-driven approach. Experimental results demonstrate that our method generates high-quality MCQs whose difficulty estimation is interpretable and aligns with human perceptions. Our approach improves automated MCQ generation by integrating structured knowledge representations with LLMs and a data-driven difficulty estimation model.
- Abstract(参考訳): 適応型AI支援教育で使用される自動MCQ生成システムにおいて, 難易度推定を伴うマルチチョイス質問(MCQ)の生成は依然として困難である。
本研究では,知識グラフ (KGs) と大規模言語モデル (LLMs) を利用して,入力文書から予測が難しいMCQを生成する手法を提案する。
提案手法では,入力文書からKGをLLMで構築し,MCQを体系的に生成する。
各MCQは、キーとしてKGからノードを選択し、関連するトリプルまたはクインタプル(任意に余分なトリプルで拡張)をサンプリングし、LSMにこれらのグラフコンポーネントから対応するステムを生成するように促すことによって生成される。
その後、KGからディストラクターが選択される。
各MCQに対して、データ駆動アプローチを用いて、9つの困難信号を計算し、統一困難スコアに結合する。
実験の結果,評価の難易度が解釈可能であり,人間の知覚と一致した高品質なMCQが得られた。
提案手法は,構造化知識表現をLLMとデータ駆動の難易度推定モデルに統合することにより,MCQの自動生成を改善する。
関連論文リスト
- Orchestrating LLM Agents for Scientific Research: A Pilot Study of Multiple Choice Question (MCQ) Generation and Evaluation [0.0]
大規模言語モデル (LLMs) は急速に科学的研究を変容させているが、これらのシステムが研究活動を再形成する方法に関する実証的な証拠は依然として限られている。
人間の研究者が複数のLSMエージェントを協調してデータ抽出、コーパス構築、アーティファクト生成、アーティファクト評価を行うAIオーケストレーション研究ワークフローの混合手法によるパイロット評価を報告する。
論文 参考訳(メタデータ) (2026-02-21T16:20:07Z) - FarsiMCQGen: a Persian Multiple-choice Question Generation Framework [2.026379197206863]
本稿では,ペルシャ語多言語質問(MCQ)を生成する革新的なアプローチであるFarsiMCQGenを紹介する。
提案手法は,候補生成,フィルタリング,ランキング技術を組み合わせて,実際のMCQに類似した回答選択を生成するモデルを構築する。
トランスフォーマーやナレッジグラフといった高度な手法を活用し、ルールベースのアプローチと統合して、テストテイカーに挑戦する信頼性のあるイントラクタを作成します。
論文 参考訳(メタデータ) (2025-10-16T20:52:07Z) - Prompting is not Enough: Exploring Knowledge Integration and Controllable Generation [89.65955788873532]
オープンドメイン質問応答(OpenQA)は自然言語処理(NLP)の基盤である。
我々は,知識統合と制御可能生成を探求し,OpenQAの性能向上を目的としたGenKIという新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2025-05-26T08:18:33Z) - Automatic Dataset Generation for Knowledge Intensive Question Answering Tasks [10.562940259841623]
本稿では,知識集約型QAタスクにおけるLarge Language Models(LLMs)の拡張手法を提案する。
提案システムは,自動QAジェネレータとモデルファインタナーを備え,パープレキシティ,ROUGE,BLEU,BERTScoreを用いて評価する。
実験は、適応型人工知能(AI)システムの開発において、論理的コヒーレンスと事実的精度の改善を示す。
論文 参考訳(メタデータ) (2025-05-20T11:16:29Z) - Question-Aware Knowledge Graph Prompting for Enhancing Large Language Models [51.47994645529258]
本稿では,問合せをGNNアグリゲーションに組み込んでKG関連性を動的に評価するQAP(QA-Aware Knowledge Graph Prompting)を提案する。
実験の結果、QAPは複数のデータセットで最先端の手法よりも優れており、その有効性を強調している。
論文 参考訳(メタデータ) (2025-03-30T17:09:11Z) - Reasoning and Sampling-Augmented MCQ Difficulty Prediction via LLMs [1.749935196721634]
マルチチョイス質問(MCQ)の難易度を予測するための新しい2段階手法を提案する。
まず、各MCQの複雑さをより正確に見積もるために、大きな言語モデル(LLM)を使用して、各オプションに到達するために必要な推論ステップを拡張します。
第2に,MCQ に応答する学生の変動を考慮した分布から知識レベルを抽出する。
論文 参考訳(メタデータ) (2025-03-11T15:39:43Z) - Token-Level Density-Based Uncertainty Quantification Methods for Eliciting Truthfulness of Large Language Models [76.17975723711886]
不確実性定量化(英: Uncertainty Quantification、UQ)は、大規模言語モデル(LLM)から真正性を求めるための顕著なアプローチである。
本研究では,テキスト生成のために,分類タスクのUQ技術であるMahalanobis Distance (MD)を適用した。
提案手法は,複数レイヤのLCMからトークン埋め込みを抽出し,各トークンのMDスコアを計算し,これらの特徴を訓練した線形回帰を用いてロバストな不確実性スコアを提供する。
論文 参考訳(メタデータ) (2025-02-20T10:25:13Z) - Benchmarking Uncertainty Quantification Methods for Large Language Models with LM-Polygraph [83.90988015005934]
不確実性定量化は機械学習アプリケーションにおいて重要な要素である。
最新のUQベースラインの集合を実装した新しいベンチマークを導入する。
我々は、11タスクにわたるUQと正規化技術に関する大規模な実証的研究を行い、最も効果的なアプローチを特定した。
論文 参考訳(メタデータ) (2024-06-21T20:06:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。