論文の概要: Rethinking AI Evaluation in Education: The TEACH-AI Framework and Benchmark for Generative AI Assistants
- arxiv url: http://arxiv.org/abs/2512.04107v1
- Date: Fri, 28 Nov 2025 17:42:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-05 21:11:45.774806
- Title: Rethinking AI Evaluation in Education: The TEACH-AI Framework and Benchmark for Generative AI Assistants
- Title(参考訳): 教育におけるAI評価の再考: 生成型AIアシスタントのためのTEACH-AIフレームワークとベンチマーク
- Authors: Shi Ding, Brian Magerko,
- Abstract要約: TEACH-AIは、教育における生成AIシステムの設計、開発、評価を導くための、ドメインに依存しない、教育的に根ざした、利害関係者による枠組みである。
我々の研究は、コミュニティに教育において「効果的な」AIを構築するものを再考し、コクリエーション、インクリシティ、長期的な人間、社会、教育への影響を促進するモデル評価アプローチを設計するよう呼びかけている。
- 参考スコア(独自算出の注目度): 8.591535882390918
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: As generative artificial intelligence (AI) continues to transform education, most existing AI evaluations rely primarily on technical performance metrics such as accuracy or task efficiency while overlooking human identity, learner agency, contextual learning processes, and ethical considerations. In this paper, we present TEACH-AI (Trustworthy and Effective AI Classroom Heuristics), a domain-independent, pedagogically grounded, and stakeholder-aligned framework with measurable indicators and a practical toolkit for guiding the design, development, and evaluation of generative AI systems in educational contexts. Built on an extensive literature review and synthesis, the ten-component assessment framework and toolkit checklist provide a foundation for scalable, value-aligned AI evaluation in education. TEACH-AI rethinks "evaluation" through sociotechnical, educational, theoretical, and applied lenses, engaging designers, developers, researchers, and policymakers across AI and education. Our work invites the community to reconsider what constructs "effective" AI in education and to design model evaluation approaches that promote co-creation, inclusivity, and long-term human, social, and educational impact.
- Abstract(参考訳): 生成的人工知能(AI)は教育を変革し続けているため、既存のAI評価のほとんどは、人間のアイデンティティ、学習機関、文脈学習プロセス、倫理的考察を見越しながら、精度やタスク効率などの技術的パフォーマンス指標に依存している。
本稿では,ITACH-AI(Trustworthy and Effective AI Classroom Heuristics),ドメインに依存しない,教育的な文脈で生成するAIシステムの設計,開発,評価を導くための実践的ツールキットと,測定可能な指標を用いた利害関係者対応のフレームワークを提案する。
広範な文献レビューと合成に基づいて構築された10コンポーネント評価フレームワークとツールキットチェックリストは、教育におけるスケーラブルで価値に整合したAI評価の基礎を提供する。
TEACH-AIは、社会技術、教育、理論、応用レンズ、デザイナー、開発者、研究者、そしてAIと教育全体にわたる政策立案者を通じて「評価」を再考する。
我々の研究は、コミュニティに教育において「効果的な」AIを構築するものを再考し、コクリエーション、インクリシティ、長期的な人間、社会、教育への影響を促進するモデル評価アプローチを設計するよう呼びかけている。
関連論文リスト
- Pedagogy-driven Evaluation of Generative AI-powered Intelligent Tutoring Systems [15.954407353419258]
ジェネレーティブAI(GenAI)モデルは,大規模言語モデル(LLM)を利用したインテリジェントチューニングシステム(ITS)の開発を加速した
しかしながら、これらのシステムの進歩と影響は、信頼性があり、広く受け入れられ、教育主導の評価フレームワークやベンチマークが欠如しているため、ほとんど追跡できないままである。
既存の教育対話に基づくIT評価の多くは、主観的プロトコルと非標準ベンチマークに依存しており、矛盾と限定的な一般化性につながっている。
この研究は、AIED研究の注意とケアから現実のケーススタディを通じて、関連する課題を強調する、総合的な最先端の評価プラクティスを提供する。
論文 参考訳(メタデータ) (2025-10-26T08:44:21Z) - AI-Educational Development Loop (AI-EDL): A Conceptual Framework to Bridge AI Capabilities with Classical Educational Theories [8.500617875591633]
本研究では、古典的学習理論とAIを融合した理論駆動型フレームワークであるAI-Educational Development Loop(AI-EDL)を紹介する。
このフレームワークは透明性、自己統制型学習、教育的監視を強調している。
論文 参考訳(メタデータ) (2025-08-01T15:44:19Z) - A Review of Generative AI in Computer Science Education: Challenges and Opportunities in Accuracy, Authenticity, and Assessment [2.1891582280781634]
本稿では、コンピュータサイエンス教育におけるChatGPTやClaudeといったジェネレーティブAIツールの利用について調査する。
ジェネレーティブAIは、AI幻覚、エラーの伝播、バイアス、AI支援コンテンツと学生認可コンテンツの間のぼやけた線などの懸念を提起する。
論文 参考訳(メタデータ) (2025-06-17T19:20:58Z) - The AI Imperative: Scaling High-Quality Peer Review in Machine Learning [49.87236114682497]
AIによるピアレビューは、緊急の研究とインフラの優先事項になるべきだ、と私たちは主張する。
我々は、事実検証の強化、レビュアーのパフォーマンスの指導、品質改善における著者の支援、意思決定におけるAC支援におけるAIの具体的な役割を提案する。
論文 参考訳(メタデータ) (2025-06-09T18:37:14Z) - Methodological Foundations for AI-Driven Survey Question Generation [41.94295877935867]
本稿では,ジェネレーティブAIを教育調査に活用するための方法論的枠組みを提案する。
大規模言語モデルが適応的でコンテキスト対応のサーベイ質問を生成する方法について検討する。
偏見、プライバシー、透明性などの倫理的問題を考察する。
論文 参考訳(メタデータ) (2025-05-02T09:50:34Z) - Enhancing AI-Driven Education: Integrating Cognitive Frameworks, Linguistic Feedback Analysis, and Ethical Considerations for Improved Content Generation [0.0]
本稿では,4つの関連研究から洞察を合成し,AI駆動型教育ツールの強化のための包括的枠組みを提案する。
我々は、認知アセスメントフレームワーク、AI生成フィードバックの言語分析、倫理設計原則を統合し、効果的で責任のあるAIツールの開発を指導する。
論文 参考訳(メタデータ) (2025-05-01T06:36:21Z) - Generative AI Literacy: Twelve Defining Competencies [48.90506360377104]
本稿では、生成AIと対話するために必要なスキルと知識領域を網羅した、生成人工知能(AI)リテラシーの能力に基づくモデルを提案する。
能力は、基礎的なAIリテラシーから、倫理的および法的考慮を含むエンジニアリングとプログラミングのスキルの促進まで様々である。
これらの12の能力は、個人、政策立案者、政府高官、教育者が責任を持って生成AIの可能性をナビゲートし活用しようとするための枠組みを提供する。
論文 参考訳(メタデータ) (2024-11-29T14:55:15Z) - Comprehensive AI Assessment Framework: Enhancing Educational Evaluation with Ethical AI Integration [0.0]
本稿では、Perkins、Furze、Roe、MacVaughによるAIA(AIAS)の進化版である包括的AIアセスメントフレームワーク(CAIAF)について述べる。
CAIAFは厳格な倫理的ガイドラインを取り入れており、教育レベルと高度なAI能力に基づいて明確に区別されている。
このフレームワークは、より良い学習結果を保証するとともに、学術的完全性を維持し、AIの責任ある利用を促進する。
論文 参考訳(メタデータ) (2024-06-07T07:18:42Z) - An interdisciplinary conceptual study of Artificial Intelligence (AI)
for helping benefit-risk assessment practices: Towards a comprehensive
qualification matrix of AI programs and devices (pre-print 2020) [55.41644538483948]
本稿では,インテリジェンスの概念に対処するさまざまな分野の既存の概念を包括的に分析する。
目的は、AIシステムを評価するための共有概念や相違点を特定することである。
論文 参考訳(メタデータ) (2021-05-07T12:01:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。