論文の概要: ANVIL: Analogies and Videos for Lecturers
- arxiv url: http://arxiv.org/abs/2605.16295v1
- Date: Wed, 15 Apr 2026 12:12:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-25 12:34:33.867734
- Title: ANVIL: Analogies and Videos for Lecturers
- Title(参考訳): ANVIL: 講師のためのアナロジーとビデオ
- Authors: Yuri Noviello, Anastasiia Birillo, Gosia Migut,
- Abstract要約: 本稿では,アナログに基づく指導アニメーションを自動生成するマルチモーダル生成システムANVILを提案する。
我々は,教師評価を用いて品質評価を基礎とし,その結果を自動スクリーニングのガイドに利用した。
以上の結果から,ANVILは適度に評価される材料を生産でき,教育者はその価値やユーザビリティに肯定的に反応することが示唆された。
- 参考スコア(独自算出の注目度): 0.6780086370528623
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present ANVIL, a multimodal generative system that automates the production of analogy-based instructional animations for computer science topics. Given a concept definition, ANVIL generates a textual analogy, compiles it into a structured visual screenplay, and produces executable manim code to render an animation, with an automated repair mechanism to improve robustness. Evaluating such systems at scale requires balancing pedagogical validity with scalability. We begin with a teacher evaluation to ground the quality assessment and use its findings to guide automated screening. For textual analogies, we introduce an LLM-based evaluator for scalable quality screening; for videos, where subjective judgments are difficult to automate, we instead assess fidelity to the intended screenplay using an automated proxy for auditing and error analysis. We further conduct a user study with educators to examine adoption requirements and risks. Our findings suggest that ANVIL can produce materials that are frequently rated as adequate, and that educators respond positively to its perceived value and usability.
- Abstract(参考訳): 本稿では,計算機科学のトピックを対象としたアナログベースの指導用アニメーションの自動生成システムANVILを提案する。
概念定義が与えられたら、ANVILはテキストのアナロジーを生成し、構造化された視覚画面にコンパイルし、アニメーションをレンダリングする実行可能なマニムコードを生成する。
このようなシステムを大規模に評価するには、教育的妥当性とスケーラビリティのバランスが必要だ。
まず,品質評価の基礎となる教師の評価から始め,その結果を自動スクリーニングの指針として活用する。
テキストの類似については,スケーラブルな品質検査のためのLCMベースの評価器を導入し,主観的判断を自動化し難いビデオに対しては,監査とエラー解析のための自動プロキシを用いて,目的の画面に対する忠実度を評価する。
さらに,導入要件とリスクを検討するために,教育者とのユーザスタディを実施している。
以上の結果から,ANVILは適度に評価される材料を生産でき,教育者はその価値やユーザビリティに肯定的に反応することが示唆された。
関連論文リスト
- Exploring Automated Recognition of Instructional Activity and Discourse from Multimodal Classroom Data [8.014320244550243]
本研究は,マルチモーダル・インストラクショナル・アクティビティと談話認識に着目した,授業記録のAIによる分析について考察する。
164時間のビデオと68のレッスン書き起こしの高密度な注釈付きデータセットを使用して、並列なモダリティ固有のパイプラインを設計する。
微調整されたモデルはプロンプトベースのアプローチを一貫して上回り、マクロF1スコアはビデオで0.577、書き起こしで0.460である。
論文 参考訳(メタデータ) (2025-11-26T11:57:22Z) - Stable Cinemetrics : Structured Taxonomy and Evaluation for Professional Video Generation [78.24409139109507]
フィルム製造制御を4つの非交叉階層制御ノードに形式化するフレームワークであるStable Cinemetricsを紹介する。
10以上のモデルと20Kビデオにまたがる大規模な人間研究を行い、80以上の映画専門家のプールで注釈を付けました。
SCINEは、ビデオ生成モデルのランドスケープにプロの動画生成を集中させる最初のアプローチである。
論文 参考訳(メタデータ) (2025-09-30T17:22:18Z) - VideoGen-Eval: Agent-based System for Video Generation Evaluation [54.662739174367836]
ビデオ生成は、最先端のモデルを評価するのに、既存の評価システムを不十分にしている。
本稿では,コンテンツ構造化,MLLMに基づくコンテンツ判断,時空間次元のパッチツールを統合したエージェント評価システムであるVideoGen-Evalを提案する。
我々は,既存の最先端モデルを評価するためのビデオ生成ベンチマークを導入し,評価システムの有効性を検証する。
論文 参考訳(メタデータ) (2025-03-30T14:12:21Z) - VACT: A Video Automatic Causal Testing System and a Benchmark [55.53300306960048]
VACTは、現実世界のシナリオにおけるVGMの因果的理解をモデル化、評価、測定するための**自動**フレームワークである。
マルチレベル因果評価指標を導入し、VGMの因果性能を詳細に分析する。
論文 参考訳(メタデータ) (2025-03-08T10:54:42Z) - An Automated Explainable Educational Assessment System Built on LLMs [12.970776782360366]
AERA Chatは、学生の反応をインタラクティブかつ視覚的に評価するための自動教育アセスメントシステムである。
本システムでは,ユーザが質問や学生の回答を入力し,評価精度に関する洞察を教育者や研究者に提供する。
論文 参考訳(メタデータ) (2024-12-17T23:29:18Z) - AutoBench-V: Can Large Vision-Language Models Benchmark Themselves? [65.92331309449015]
本稿では,モデル能力の特定の側面に基づいてLVLMをベンチマークする,オンデマンドで評価を行う自動フレームワークであるAutoBench-Vを紹介する。
5つの要求されたユーザ入力に対して9つの人気のあるLVLMを広範囲に評価することにより、このフレームワークの有効性と信頼性を示す。
論文 参考訳(メタデータ) (2024-10-28T17:55:08Z) - Automated Assessment of Students' Code Comprehension using LLMs [0.3293989832773954]
大規模言語モデル(LLM)とエンコーダベースのセマンティックテキスト類似(STS)モデルを評価する。
この結果から,LLMはプログラミング領域における生徒の短解評価において,微調整エンコーダモデルに匹敵する性能を示した。
論文 参考訳(メタデータ) (2023-12-19T20:39:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。