論文の概要: Hybrid E-Assessment in Higher Education: Semi-Automated Grading of Paper-Based Written Examinations
- arxiv url: http://arxiv.org/abs/2606.08855v1
- Date: Sun, 07 Jun 2026 21:50:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:06.48867
- Title: Hybrid E-Assessment in Higher Education: Semi-Automated Grading of Paper-Based Written Examinations
- Title(参考訳): 高等教育におけるハイブリッドE-アセスメント:紙ベースの筆記試験の半自動評価
- Authors: Hartwig Grabowski, Michael Canz,
- Abstract要約: 本稿では,半自動グルーピングを実現しつつ,紙ベースの問題指向試験タスクを継続するハイブリッドe-アセスメント手法を提案する。
最近の視覚対応型大規模言語モデルと2パスの検証原理と解鍵との比較を組み合わせることで、誤分類を減らすことができる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper examines the limitations of fully digital and partially digital e-assessment approaches in summative examinations in higher education. The analysis focuses on the didactic narrowing caused by closed question formats and on organizational, technical, and legal constraints that become particularly relevant in large student cohorts. As an alternative, the paper proposes a hybrid e-assessment approach that retains paper-based, problem-oriented examination tasks while enabling semi-automated grading. Assessment-relevant intermediate results are encoded in a structured answer format, entered by students by hand, and subsequently captured from table fields. The central technical bottleneck is reliable recognition of handwritten characters under realistic examination conditions. Recent vision-capable large language models, combined with a two-pass validation principle and comparison against a solution key, can reduce misclassifications and thereby improve the validity, fairness, and scalability of summative assessment.
- Abstract(参考訳): 本稿では,高等教育における要約試験における完全デジタル・部分デジタルe-アセスメントアプローチの限界について検討する。
この分析は、クローズドな質問形式によって引き起こされる実践的絞り込みと、大規模学生のコホートに特に関係する組織的、技術的、法的制約に焦点を当てている。
代替として,半自動グレーディングを実現しつつ,紙ベースの問題指向試験タスクを継続するハイブリッドe-アセスメント手法を提案する。
評価関連中間結果は、構造化された回答形式で符号化され、学生が手入力し、テーブルフィールドからキャプチャされる。
中心となる技術的ボトルネックは、現実的な検査条件下で手書き文字を確実に認識することである。
最近の視覚対応型大規模言語モデルと2パスの検証原理と解鍵との比較を組み合わせることで、誤分類を減らし、要約評価の妥当性、公平性、スケーラビリティを向上させることができる。
関連論文リスト
- Automated Grading of Handwritten Mathematics Using Vision-Capable LLMs [2.727845763576068]
視覚対応の大型言語モデル(LLM)は新しい機会を提供する。
インストラクター定義ルーブリックを用いた手書き数学書記作業のためのLLM-based graderの実証評価を行った。
論文 参考訳(メタデータ) (2026-05-18T19:06:15Z) - Evaluating AI Grading on Real-World Handwritten College Mathematics: A Large-Scale Study Toward a Benchmark [9.922581736690159]
カリフォルニア大学アーバイン校(UC Irvine)の実際の手書き電卓におけるAIのグルーピングに関する大規模な実証的研究について述べる。
OCR条件付き大規模言語モデルを用いて, 何千もの応答型クイズ入力に対して, スコアと形式的フィードバックを生成する。
本研究は,1つの基礎的ラベルを持たない環境下で,公的な指導助成学級,学生調査,独立人レビューに対する評価を行った。
論文 参考訳(メタデータ) (2026-03-01T03:32:51Z) - RPC-Bench: A Fine-grained Benchmark for Research Paper Comprehension [65.81339691942757]
RPC-Bench(RPC-Bench)は、高品質なコンピュータサイエンス論文のレビュー・リビューの交換から構築された大規模質問応答ベンチマークである。
我々は、科学研究の流れに沿ったきめ細かい分類を設計し、モデルがなぜ、何、どのように学術的な文脈で質問するかを理解し、答える能力を評価する。
論文 参考訳(メタデータ) (2026-01-14T11:37:00Z) - PaperAudit-Bench: Benchmarking Error Detection in Research Papers for Critical Automated Peer Review [54.141490756509306]
本稿では、エラーデータセットであるPaperAudit-Datasetと、自動レビューフレームワークであるPaperAudit-Reviewの2つのコンポーネントからなるPaperAudit-Benchを紹介する。
PaperAudit-Benchの実験では、モデルと検出深さの誤差検出可能性に大きなばらつきが示された。
本研究では,SFTおよびRLによる軽量LLM検出器のトレーニングをサポートし,計算コストの削減による効率的な誤り検出を実現する。
論文 参考訳(メタデータ) (2026-01-07T04:26:12Z) - TrueGradeAI: Retrieval-Augmented and Bias-Resistant AI for Transparent and Explainable Digital Assessments [0.0]
TrueGradeAIは、従来の紙ベースの評価の欠点を克服するために設計された、AI駆動のデジタル検査フレームワークである。
このシステムは、セキュアなタブレット上でスタイラス入力による自然な手書き文字のキャプチャと、トランスフォーマーベースの光文字認識を転写に応用する。
評価は、教員ソリューション、キャッシュ層、外部参照を統合した検索強化パイプラインを通じて行われる。
論文 参考訳(メタデータ) (2025-09-26T16:00:36Z) - SoK: Large Language Model Copyright Auditing via Fingerprinting [69.14570598973195]
既存の手法をホワイトボックスとブラックボックスのアプローチに分類する統一的な枠組みと形式的な分類法を導入する。
現実的な展開シナリオ下でのLDMフィンガープリント評価のための最初の体系的ベンチマークであるLeaFBenchを提案する。
論文 参考訳(メタデータ) (2025-08-27T12:56:57Z) - Document-Level Tabular Numerical Cross-Checking: A Coarse-to-Fine Approach [27.581678327762003]
情報開示文書の表間の数値的な一貫性は 正確性を確保し 信頼性を維持し 評判と経済のリスクを維持するために 不可欠です
本稿では,これら課題に対処する新しいフレームワークであるCoFiTCheckを紹介する。
CoFiTCheckは、実用効率を維持しながら、従来の方法よりも大幅に優れている。
論文 参考訳(メタデータ) (2025-06-16T10:17:21Z) - Ratas framework: A comprehensive genai-based approach to rubric-based marking of real-world textual exams [3.4132239125074206]
RATAS(Rubric Automated Tree-based Answer Scoring)は、テキスト応答のルーリックベースのグレーディングに最先端の生成AIモデルを活用する新しいフレームワークである。
RATASは、幅広いグレーディングルーリックをサポートし、主観的評価を可能にし、割り当てられたスコアに対して構造化された説明可能な論理を生成するように設計されている。
論文 参考訳(メタデータ) (2025-05-27T22:17:27Z) - Localizing Factual Inconsistencies in Attributable Text Generation [74.11403803488643]
本稿では,帰属可能なテキスト生成における事実の不整合をローカライズするための新しい形式であるQASemConsistencyを紹介する。
QASemConsistencyは、人間の判断とよく相関する事実整合性スコアを得られることを示す。
論文 参考訳(メタデータ) (2024-10-09T22:53:48Z) - SoftMatch: Addressing the Quantity-Quality Trade-off in Semi-supervised
Learning [101.86916775218403]
本稿では, サンプル重み付けを統一した定式化により, 一般的な擬似ラベル法を再検討する。
トレーニング中の擬似ラベルの量と質を両立させることでトレードオフを克服するSoftMatchを提案する。
実験では、画像、テキスト、不均衡な分類など、さまざまなベンチマークで大幅に改善されている。
論文 参考訳(メタデータ) (2023-01-26T03:53:25Z) - Investigating Fairness Disparities in Peer Review: A Language Model
Enhanced Approach [77.61131357420201]
我々は、大規模言語モデル(LM)の助けを借りて、ピアレビューにおける公平性格差の徹底した厳密な研究を行う。
我々は、2017年から現在までのICLR(International Conference on Learning Representations)カンファレンスで、包括的なリレーショナルデータベースを収集、組み立て、維持しています。
我々は、著作者性別、地理、著作者、機関的名声など、興味のある複数の保護属性に対する公平性の違いを仮定し、研究する。
論文 参考訳(メタデータ) (2022-11-07T16:19:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。