論文の概要: Reliable Classroom AI via Neuro-Symbolic Multimodal Reasoning
- arxiv url: http://arxiv.org/abs/2603.22793v1
- Date: Tue, 24 Mar 2026 04:31:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-25 19:53:37.308214
- Title: Reliable Classroom AI via Neuro-Symbolic Multimodal Reasoning
- Title(参考訳): ニューロシンボリックマルチモーダル推論による信頼性クラスルームAI
- Authors: Sina Bagheri Nezhad,
- Abstract要約: NSCRは,授業分析を知覚的接地,象徴的抽象,実行可能推論,ガバナンスの4つの層に分解する,神経象徴的フレームワークである。
我々は,教室の状態推定,談話接地イベントリンク,時間的早期警告,協調分析,多言語教室推論の5つのタスクに,ベンチマークと評価プロトコルを投入した。
この論文は、新しい経験的成果を報告していない。その貢献は、より解釈しやすく、プライバシーに配慮し、教育的に基礎を置いている教室用マルチモーダルAIをサポートするための具体的なフレームワークと評価アジェンダである。
- 参考スコア(独自算出の注目度): 0.33842793760651557
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Classroom AI is rapidly expanding from low-level perception toward higher-level judgments about engagement, confusion, collaboration, and instructional quality. Yet classrooms are among the hardest real-world settings for multimodal vision: they are multi-party, noisy, privacy-sensitive, pedagogically diverse, and often multilingual. In this paper, we argue that classroom AI should be treated as a critical domain, where raw predictive accuracy is insufficient unless predictions are accompanied by verifiable evidence, calibrated uncertainty, and explicit deployment guardrails. We introduce NSCR, a neuro-symbolic framework that decomposes classroom analytics into four layers: perceptual grounding, symbolic abstraction, executable reasoning, and governance. NSCR adapts recent ideas from symbolic fact extraction and verifiable code generation to multimodal educational settings, enabling classroom observations from video, audio, ASR, and contextual metadata to be converted into typed facts and then composed by executable rules, programs, and policy constraints. Beyond the system design, we contribute a benchmark and evaluation protocol organized around five tasks: classroom state inference, discourse-grounded event linking, temporal early warning, collaboration analysis, and multilingual classroom reasoning. We further specify reliability metrics centered on abstention, calibration, robustness, construct alignment, and human usefulness. The paper does not report new empirical results; its contribution is a concrete framework and evaluation agenda intended to support more interpretable, privacy-aware, and pedagogically grounded multimodal AI for classrooms.
- Abstract(参考訳): クラスルームAIは、低レベルの認識から、エンゲージメント、混乱、コラボレーション、教育的品質に関するより高いレベルの判断へと急速に拡大しています。
しかし、教室はマルチモーダル・ビジョンにとって最も難しい現実の環境の一つだ。
本稿では,予測が検証された証拠,校正された不確実性,明示的な展開ガードレールを伴わない限り,生の予測精度が不十分な重要な領域として,授業用AIを扱うべきだと論じる。
NSCRは,授業分析を知覚的接地,象徴的抽象,実行可能推論,ガバナンスの4つの層に分解する,神経象徴的フレームワークである。
NSCRは、シンボリックな事実抽出と検証可能なコード生成から、マルチモーダルな教育環境に適応し、ビデオ、オーディオ、ASR、コンテキストメタデータを型付き事実に変換し、実行可能なルール、プログラム、ポリシー制約によって構成する。
システム設計の他に,教室の状態推論,談話接地イベントリンク,時間的早期警告,協調分析,多言語教室推論の5つのタスクを中心に構成されたベンチマークと評価プロトコルをコントリビュートする。
さらに, 留置, 校正, 堅牢性, コンストラクタアライメント, 人的有用性を中心に, 信頼性指標を規定する。
この論文は、新しい経験的成果を報告していない。その貢献は、より解釈しやすく、プライバシーに配慮し、教育的に基礎を置いている教室用マルチモーダルAIをサポートするための具体的なフレームワークと評価アジェンダである。
関連論文リスト
- Optimizing LLM Annotation of Classroom Discourse through Multi-Agent Orchestration [0.21410799064827235]
大規模言語モデル(LLM)は、教育データを注釈付けするためのスケーラブルなツールとしてますます位置づけられている。
しかし, シングルパスLCMの出力は, ハイテイクな教育施設では信頼性が低いことが示唆されている。
このスケールと妥当性の緊張は、現代の教育データ科学の核心にある。
論文 参考訳(メタデータ) (2026-03-08T16:51:03Z) - Visual Reasoning Benchmark: Evaluating Multimodal LLMs on Classroom-Authentic Visual Problems from Primary Education [0.0]
本稿では,視覚的推論ベンチマーク(VRB)を紹介する。
マルチモーダル大規模言語モデル (MLLM) を, 教室の視覚的問題に対処する能力に基づいて評価することを目的としている。
このベンチマークは、ザンビアとインドの小学校試験から得られた701の質問に基づいて構築されている。
論文 参考訳(メタデータ) (2026-02-12T17:29:03Z) - Scaling Equitable Reflection Assessment in Education via Large Language Models and Role-Based Feedback Agents [2.825140278227664]
形式的フィードバックは、学生学習の最も効果的な要因の1つである。
大規模または低リソースのコースでは、インストラクターは学生のリフレクションのレビューや応答に必要な時間、スタッフ、帯域幅を欠いていることが多い。
本稿では,5つの協調型ロールベースLLMエージェントを用いて学習者の反射をスコアリングする理論基底システムを提案する。
論文 参考訳(メタデータ) (2025-11-14T09:46:21Z) - Explain Before You Answer: A Survey on Compositional Visual Reasoning [74.27548620675748]
構成的視覚推論は、マルチモーダルAIにおける重要な研究フロンティアとして登場した。
本調査は,トップ会場(CVPR,ICCV,NeurIPS,ICML,ACLなど)から260以上の論文を体系的にレビューする。
次に60以上のベンチマークとそれに対応するメトリクスを、基底精度、連鎖忠実性、高分解能知覚などの次元に沿って探索する。
論文 参考訳(メタデータ) (2025-08-24T11:01:51Z) - Alignment and Safety in Large Language Models: Safety Mechanisms, Training Paradigms, and Emerging Challenges [47.14342587731284]
本調査では,大規模言語モデル(LLM)アライメントにおけるアライメント手法,トレーニングプロトコル,経験的発見について概観する。
我々は多種多様なパラダイムをまたいだアライメント手法の開発を分析し、コアアライメント目標間の基本的なトレードオフを特徴づける。
我々は、直接選好最適化(DPO)、構成AI、脳インスパイアされた方法、アライメント不確実性定量化(AUQ)など、最先端技術について議論する。
論文 参考訳(メタデータ) (2025-07-25T20:52:58Z) - Multimodal Assessment of Classroom Discourse Quality: A Text-Centered Attention-Based Multi-Task Learning Approach [7.273857543125784]
本研究は,GTI(Global Teaching InSights)観測プロトコルにおける3つの談話コンポーネントの品質を評価するために,テキスト中心のマルチモーダル融合アーキテクチャを提案する。
我々は、テキスト、オーディオ、ビデオストリームからのモーダル間相互作用とモーダル間相互作用をキャプチャするために注意機構を用いる。
本研究は,本課題へのアプローチにおけるテキストモダリティの優位性を強調した。
論文 参考訳(メタデータ) (2025-05-12T09:24:21Z) - MDK12-Bench: A Multi-Discipline Benchmark for Evaluating Reasoning in Multimodal Large Language Models [50.43793764203352]
実世界のK-12試験を通してMLLMの推論能力を評価する多分野ベンチマークであるMDK12-Benchを紹介する。
本ベンチマークは,小学校から12年生までの様々な難易度にまたがる140Kの推論事例からなる。
6,827のインスタンスレベルの知識ポイントアノテーションが,十分に整理された知識構造,詳細な回答説明,難易度ラベル,年次分割に基づいている。
論文 参考訳(メタデータ) (2025-04-08T08:06:53Z) - Hierarchical Decomposition of Prompt-Based Continual Learning:
Rethinking Obscured Sub-optimality [55.88910947643436]
大量のラベルのないデータを実際に扱うためには、自己教師付き事前トレーニングが不可欠である。
HiDe-Promptは、タスク固有のプロンプトと統計のアンサンブルで階層的なコンポーネントを明示的に最適化する革新的なアプローチである。
実験では,HiDe-Promptの優れた性能と,継続学習における事前学習パラダイムへの頑健さを実証した。
論文 参考訳(メタデータ) (2023-10-11T06:51:46Z) - Towards Quantifiable Dialogue Coherence Evaluation [126.55560816209756]
量的対話コヒーレンス評価(QuantiDCE)は,量的対話コヒーレンス尺度の学習を目的とした新しいフレームワークである。
QuantiDCEには、Multi-Level Ranking (MLR) pre-training (KD) fine-tuning (Multi-Level Ranking)とKD (KD) fine-tuning (KD) という2つの訓練段階が含まれている。
実験結果から,QuantiDCEによりトレーニングされたモデルは,他の最先端の指標に比べて,人間の判断と強い相関関係を示すことが示された。
論文 参考訳(メタデータ) (2021-06-01T14:11:17Z) - Concept Learners for Few-Shot Learning [76.08585517480807]
本研究では,人間の解釈可能な概念次元に沿って学習することで,一般化能力を向上させるメタ学習手法であるCOMETを提案する。
我々は,細粒度画像分類,文書分類,セルタイプアノテーションなど,さまざまな領域からの少数ショットタスクによるモデルの評価を行った。
論文 参考訳(メタデータ) (2020-07-14T22:04:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。