Fugu-MT 論文翻訳(概要): TrueGradeAI: Retrieval-Augmented and Bias-Resistant AI for Transparent and Explainable Digital Assessments

論文の概要: TrueGradeAI: Retrieval-Augmented and Bias-Resistant AI for Transparent and Explainable Digital Assessments

arxiv url: http://arxiv.org/abs/2509.22516v1
Date: Fri, 26 Sep 2025 16:00:36 GMT
ステータス: 翻訳完了
システム内更新日: 2025-09-29 20:57:54.56587
Title: TrueGradeAI: Retrieval-Augmented and Bias-Resistant AI for Transparent and Explainable Digital Assessments
Title（参考訳）: TrueGradeAI: 透明で説明可能なデジタルアセスメントのための検索とバイアス耐性AI
Authors: Rakesh Thakur, Shivaansh Kaushik, Gauri Chopra, Harsh Rohilla,
Abstract要約: TrueGradeAIは、従来の紙ベースの評価の欠点を克服するために設計された、AI駆動のデジタル検査フレームワークである。このシステムは、セキュアなタブレット上でスタイラス入力による自然な手書き文字のキャプチャと、トランスフォーマーベースの光文字認識を転写に応用する。評価は、教員ソリューション、キャッシュ層、外部参照を統合した検索強化パイプラインを通じて行われる。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: This paper introduces TrueGradeAI, an AI-driven digital examination framework designed to overcome the shortcomings of traditional paper-based assessments, including excessive paper usage, logistical complexity, grading delays, and evaluator bias. The system preserves natural handwriting by capturing stylus input on secure tablets and applying transformer-based optical character recognition for transcription. Evaluation is conducted through a retrieval-augmented pipeline that integrates faculty solutions, cache layers, and external references, enabling a large language model to assign scores with explicit, evidence-linked reasoning. Unlike prior tablet-based exam systems that primarily digitize responses, TrueGradeAI advances the field by incorporating explainable automation, bias mitigation, and auditable grading trails. By uniting handwriting preservation with scalable and transparent evaluation, the framework reduces environmental costs, accelerates feedback cycles, and progressively builds a reusable knowledge base, while actively working to mitigate grading bias and ensure fairness in assessment.
Abstract（参考訳）: 本稿では、従来の紙ベースの評価の欠点を克服するために設計された、AI駆動のデジタル検査フレームワークであるTrueGradeAIを紹介する。このシステムは、セキュアなタブレット上でスタイラス入力をキャプチャし、トランスフォーマーベースの光学文字認識を転写に適用することにより、自然な手書きを保ちます。評価は、教員ソリューション、キャッシュ層、外部参照を統合した検索拡張パイプラインを通じて行われ、大きな言語モデルが明示的でエビデンスにリンクした推論でスコアを割り当てることを可能にする。反応をデジタル化する従来のタブレットベースの試験システムとは異なり、TrueGradeAIは説明可能な自動化、バイアス軽減、監査可能なグレーティングトレイルを取り入れて分野を前進させる。このフレームワークは、手書きの保存をスケーラブルで透明な評価と組み合わせることで、環境コストを低減し、フィードバックサイクルを加速し、再利用可能な知識ベースを段階的に構築し、段階的バイアスを緩和し、評価の公正性を確保する。

関連論文リスト

Automatic Reviewers Fail to Detect Faulty Reasoning in Research Papers: A New Counterfactual Evaluation Framework [55.078301794183496]
我々は、高品質なピアレビューを支えるコアレビュースキル、すなわち欠陥のある研究ロジックの検出に注力する。これは、論文の結果、解釈、クレームの間の内部の一貫性を評価することを含む。本稿では,このスキルを制御条件下で分離し,テストする,完全自動対物評価フレームワークを提案する。
論文参考訳（メタデータ） (2025-08-29T08:48:00Z)
Reflective Paper-to-Code Reproduction Enabled by Fine-Grained Verification [46.845133190560375]
複雑なコードを効率的にデバッグするために、人間が体系的なチェックリストを使う方法に触発されて、textbfReflective Paper-to-Code textbfReproductionフレームワークである textbfReProを提案する。紙の指紋を自動的に抽出し、高品質な監視信号として機能する、正確で原子的な基準の包括的なセットを参照する。ベースラインよりも13.0%のパフォーマンスギャップを達成し、反射の複雑な論理的および数学的基準を正しく修正する。
論文参考訳（メタデータ） (2025-08-21T06:57:44Z)
Teaching at Scale: Leveraging AI to Evaluate and Elevate Engineering Education [3.557803321422781]
本稿では,大規模言語モデルを用いた定性的な学生フィードバックのためのスケーラブルなAI支援フレームワークを提案する。このシステムは階層的な要約、匿名化、例外処理を用いて、オープンなコメントから実行可能なテーマを抽出する。大規模な工学系大学への展開が成功したことを報告します。
論文参考訳（メタデータ） (2025-08-01T20:27:40Z)
Ratas framework: A comprehensive genai-based approach to rubric-based marking of real-world textual exams [3.4132239125074206]
RATAS(Rubric Automated Tree-based Answer Scoring)は、テキスト応答のルーリックベースのグレーディングに最先端の生成AIモデルを活用する新しいフレームワークである。 RATASは、幅広いグレーディングルーリックをサポートし、主観的評価を可能にし、割り当てられたスコアに対して構造化された説明可能な論理を生成するように設計されている。
論文参考訳（メタデータ） (2025-05-27T22:17:27Z)
Learning Interpretable Representations Leads to Semantically Faithful EEG-to-Text Generation [52.51005875755718]
我々は脳波からテキストへの復号に焦点をあて、後部崩壊のレンズを通して幻覚の問題に対処する。脳波とテキスト間の情報容量のミスマッチを認め、デコードタスクをコア意味のセマンティックな要約として再設計する。パブリックなZuCoデータセットの実験では、GLIMが一貫して、流動的なEEG基底文を生成することが示されている。
論文参考訳（メタデータ） (2025-05-21T05:29:55Z)
AutoRev: Automatic Peer Review System for Academic Research Papers [9.269282930029856]
AutoRevは学術研究論文の自動ピアレビューシステムである。私たちのフレームワークは学術文書をグラフとして表現し、最も重要なパスの抽出を可能にします。レビュー生成に適用すると、平均58.72%のSOTAベースラインを上回ります。
論文参考訳（メタデータ） (2025-05-20T13:59:58Z)
On the Role of Feedback in Test-Time Scaling of Agentic AI Workflows [71.92083784393418]
エージェントAI(自律的な計画と行動を行うシステム)は広く普及しているが、複雑なタスクにおけるタスクの成功率は低いままである。推論時のアライメントは、サンプリング、評価、フィードバックの3つのコンポーネントに依存します。本稿では,様々な形態の批判から抽出されたフィードバックを繰り返し挿入するIterative Agent Decoding(IAD)を紹介する。
論文参考訳（メタデータ） (2025-04-02T17:40:47Z)
End-to-End Page-Level Assessment of Handwritten Text Recognition [69.55992406968495]
HTRシステムは、文書のエンドツーエンドのページレベルの書き起こしに直面している。標準メトリクスは、現れる可能性のある不整合を考慮していない。本稿では、転写精度とROの良さを別々に検討する2つの評価法を提案する。
論文参考訳（メタデータ） (2023-01-14T15:43:07Z)
Toward Educator-focused Automated Scoring Systems for Reading and Writing [0.0]
本稿では,データとラベルの可用性,信頼性と拡張性,ドメインスコアリング,プロンプトとソースの多様性,伝達学習といった課題に対処する。モデルトレーニングコストを増大させることなく、エッセイの長さを重要な特徴として保持する技術を採用している。
論文参考訳（メタデータ） (2021-12-22T15:44:30Z)
Hierarchical Bi-Directional Self-Attention Networks for Paper Review Rating Recommendation [81.55533657694016]
本稿では,階層型双方向自己注意ネットワークフレームワーク(HabNet)を提案する。具体的には、文エンコーダ(レベル1)、レビュー内エンコーダ(レベル2)、レビュー間エンコーダ(レベル3)の3つのレベルで、論文レビューの階層構造を利用する。我々は、最終的な受理決定を行う上で有用な予測者を特定することができ、また、数値的なレビュー評価とレビュアーが伝えるテキストの感情の不整合を発見するのに役立てることができる。
論文参考訳（メタデータ） (2020-11-02T08:07:50Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。