論文の概要: Exploring Data Augmentation and Resampling Strategies for Transformer-Based Models to Address Class Imbalance in AI Scoring of Scientific Explanations in NGSS Classroom
- arxiv url: http://arxiv.org/abs/2604.19754v1
- Date: Sat, 21 Mar 2026 07:12:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-04 02:32:14.045609
- Title: Exploring Data Augmentation and Resampling Strategies for Transformer-Based Models to Address Class Imbalance in AI Scoring of Scientific Explanations in NGSS Classroom
- Title(参考訳): NGSS教室における科学的説明のAIスコーリングにおけるクラス不均衡に対応するトランスフォーマーモデルのためのデータ拡張と再サンプリング戦略の探索
- Authors: Prudence Djagba, Kevin Haudek, Clare G. C. Franovic, Leonora Kaldaras,
- Abstract要約: 本研究は,物理科学評価に対する学生反応のトランスフォーマーによるテキスト分類を改善するための強化戦略について検討する。
データセットは、11のバイナリコード分析カテゴリでスコアされた1,466人の高校の応答で構成されている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Automated scoring of students' scientific explanations offers the potential for immediate, accurate feedback, yet class imbalance in rubric categories particularly those capturing advanced reasoning remains a challenge. This study investigates augmentation strategies to improve transformer-based text classification of student responses to a physical science assessment based on an NGSS-aligned learning progression. The dataset consists of 1,466 high school responses scored on 11 binary-coded analytic categories. This rubric identifies six important components including scientific ideas needed for a complete explanation along with five common incomplete or inaccurate ideas. Using SciBERT as a baseline, we applied fine-tuning and test these augmentation strategies: (1) GPT-4--generated synthetic responses, (2) EASE, a word-level extraction and filtering approach, and (3) ALP (Augmentation using Lexicalized Probabilistic context-free grammar) phrase-level extraction. While fine-tuning SciBERT improved recall over baseline, augmentation substantially enhanced performance, with GPT data boosting both precision and recall, and ALP achieving perfect precision, recall, and F1 scores across most severe imbalanced categories (5,6,7 and 9). Across all rubric categories EASE augmentation substantially increased alignment with human scoring for both scientific ideas (Categories 1--6) and inaccurate ideas (Categories 7--11). We compared different augmentation strategies to a traditional oversampling method (SMOTE) in an effort to avoid overfitting and retain novice-level data critical for learning progression alignment. Findings demonstrate that targeted augmentation can address severe imbalance while preserving conceptual coverage, offering a scalable solution for automated learning progression-aligned scoring in science education.
- Abstract(参考訳): 学生の科学的説明の自動採点は、即時的かつ正確なフィードバックの可能性を秘めているが、特に先進的な推論を捉えた集団におけるクラス不均衡は、依然として課題である。
本研究は,NGSS対応学習の進展に基づく物理科学評価に対するトランスフォーマーによる学生反応のテキスト分類を改善するための強化戦略について検討する。
データセットは、11のバイナリコード分析カテゴリでスコアされた1,466人の高校の応答で構成されている。
このルーブリックは、完全な説明に必要な科学的概念を含む6つの重要な要素と5つの一般的な不完全または不正確なアイデアを識別する。
SciBERT をベースラインとして,(1) GPT-4 生成合成応答,(2) EASE, 単語レベルの抽出とフィルタリング,(3) ALP(Lexicalized Probabilistic context-free grammar) 句レベルの抽出を行った。
SciBERTはベースライン上のリコールを改善する一方で、GPTデータによって精度とリコールの両方が向上し、ALPは最も深刻な不均衡なカテゴリ(5,6,7,9)で完全精度、リコール、F1スコアを達成した。
EASE増強は科学的概念(カテゴリ1〜6)と不正確な概念(カテゴリ7〜11)の両方において、人間のスコアと大幅に一致した。
我々は,学習進行の調整に重要な初心者レベルのデータを維持するために,従来のオーバーサンプリング手法(SMOTE)と比較した。
目的の強化は、概念的カバレッジを維持しながら深刻な不均衡に対処し、科学教育における自動学習の進歩に整合したスコアリングのためのスケーラブルなソリューションを提供することを示す。
関連論文リスト
- REAL: Regression-Aware Reinforcement Learning for LLM-as-a-Judge [83.2858110368572]
回帰報酬を最適化するための原則的RLフレームワークである textbfREAL (underlineREgression-underlineAware Reinforcement underlineLThought) を提案する。
我々は,REALがレグレッション対応SFTベースラインと標準RL法の両方を一貫して上回ることを示す。
論文 参考訳(メタデータ) (2026-03-17T21:19:08Z) - Synthetic Data Augmentation for Medical Audio Classification: A Preliminary Evaluation [0.0]
医療オーディオの分類は、低信号対雑音比、微妙な識別特性、およびクラス内変動が原因で依然として困難である。
これらの制約を緩和するための潜在的戦略として、合成データ拡張が提案されている。
本研究では, 基線深部畳み込みニューラルネットワークを用いて, 適度に不均衡なデータセットをトレーニングし, 合成増幅が呼吸音の分類に及ぼす影響について検討した。
論文 参考訳(メタデータ) (2026-02-03T00:52:49Z) - Automated Analysis of Learning Outcomes and Exam Questions Based on Bloom's Taxonomy [0.0]
本稿では,ブルームの分類に基づく試験質問と学習結果の自動分類について検討する。
6つの認知カテゴリをラベル付けした600文の小さなデータセットを、従来の機械学習(ML)モデルを用いて処理した。
論文 参考訳(メタデータ) (2025-11-14T02:31:12Z) - Class-wise Balancing Data Replay for Federated Class-Incremental Learning [49.179631011790065]
FCIL(Federated Class Incremental Learning)のためのクラスワイドバランスデータ再生手法を提案する。
1)グローバル・パースペクティブ・データ・リプレイ・モジュールは,事前タスクのグローバルな表現をプライバシ保護方式で再構築し,その上で,クラス認識と重要度に敏感なサンプリング戦略を指導し,バランスの取れたリプレイを実現する。2)タスク間のクラス不均衡を処理するために,タスク対応温度スケーリングモジュールは,タスクダイナミクスに基づくクラスとインスタンスレベルのロジットの温度を適応的に調整し,多数クラスに対するモデルの過度さを低減し,マイノリティクラスへの感受性を高める。
論文 参考訳(メタデータ) (2025-07-10T12:46:31Z) - MindGYM: What Matters in Question Synthesis for Thinking-Centric Fine-Tuning? [51.85759493254735]
MindGYMは、質問合成のための構造化されスケーラブルなフレームワークである。
モデル合成の振る舞いを形作るために、高レベルの推論目的を注入する。
より深い推論のために、QAシードに基づいてより複雑なマルチホップ質問を構成する。
論文 参考訳(メタデータ) (2025-03-12T16:03:03Z) - Electroencephalogram Emotion Recognition via AUC Maximization [0.0]
不均衡データセットは神経科学、認知科学、医学診断などの分野で大きな課題を提起する。
本研究は,DEAPデータセットにおけるライキングラベルを例として,イシュークラスの不均衡に対処する。
論文 参考訳(メタデータ) (2024-08-16T19:08:27Z) - No Fear of Heterogeneity: Classifier Calibration for Federated Learning
with Non-IID Data [78.69828864672978]
実世界のフェデレーションシステムにおける分類モデルのトレーニングにおける中心的な課題は、非IIDデータによる学習である。
このアルゴリズムは, 近似されたssian混合モデルからサンプリングした仮想表現を用いて分類器を調整する。
実験の結果,CIFAR-10,CIFAR-100,CINIC-10など,一般的なフェデレーション学習ベンチマークにおけるCCVRの現状が示された。
論文 参考訳(メタデータ) (2021-06-09T12:02:29Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - Boost AI Power: Data Augmentation Strategies with unlabelled Data and
Conformal Prediction, a Case in Alternative Herbal Medicine Discrimination
with Electronic Nose [12.31253329379136]
電子鼻は代替医療の分類において有効であることが証明されているが、教師付き学習コストの性質のため、従来の研究はラベル付きトレーニングデータに依存していた。
本研究は,データ拡張戦略を用いて分類精度を向上させることを目的とする。
論文 参考訳(メタデータ) (2021-02-05T10:25:36Z) - A Simple but Tough-to-Beat Data Augmentation Approach for Natural
Language Understanding and Generation [53.8171136907856]
カットオフと呼ばれる、シンプルで効果的なデータ拡張戦略のセットを紹介します。
カットオフはサンプリング一貫性に依存しているため、計算オーバーヘッドが少なくなる。
cutoffは、敵のトレーニングを一貫して上回り、IWSLT2014 German- English データセットで最先端の結果を達成する。
論文 参考訳(メタデータ) (2020-09-29T07:08:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。