Fugu-MT 論文翻訳(概要): BRIDGE the Gap: Mitigating Bias Amplification in Automated Scoring of English Language Learners via Inter-group Data Augmentation

論文の概要: BRIDGE the Gap: Mitigating Bias Amplification in Automated Scoring of English Language Learners via Inter-group Data Augmentation

arxiv url: http://arxiv.org/abs/2602.23580v1
Date: Fri, 27 Feb 2026 01:11:05 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-02 19:48:24.192567
Title: BRIDGE the Gap: Mitigating Bias Amplification in Automated Scoring of English Language Learners via Inter-group Data Augmentation
Title（参考訳）: BRIDGE the Gap:グループ間データ拡張による英語学習者の自動スコーリングにおけるバイアス増幅の軽減
Authors: Yun Wang, Xuansheng Wu, Jingyuan Huang, Lei Liu, Xiaoming Zhai, Ninghao Liu,
Abstract要約: 低リソース・アセスメント・セッティングのための Bias-Reducing Inter-group Data GEneration フレームワークBRIDGE を提案する。 BRIDGEは,総合的なスコアリング性能を維持しつつ,ハイスコアのELL学生の予測バイアスを効果的に低減することを示す。
参考スコア（独自算出の注目度）: 33.11188827947722
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: In the field of educational assessment, automated scoring systems increasingly rely on deep learning and large language models (LLMs). However, these systems face significant risks of bias amplification, where model prediction gaps between student groups become larger than those observed in training data. This issue is especially severe for underrepresented groups such as English Language Learners (ELLs), as models may inherit and further magnify existing disparities in the data. We identify that this issue is closely tied to representation bias: the scarcity of minority (high-scoring ELL) samples makes models trained with empirical risk minimization favor majority (non-ELL) linguistic patterns. Consequently, models tend to under-predict ELL students who even demonstrate comparable domain knowledge but use different linguistic patterns, thereby undermining the fairness of automated scoring outcomes. To mitigate this, we propose BRIDGE, a Bias-Reducing Inter-group Data GEneration framework designed for low-resource assessment settings. Instead of relying on the limited minority samples, BRIDGE synthesizes high-scoring ELL samples by "pasting" construct-relevant (i.e., rubric-aligned knowledge and evidence) content from abundant high-scoring non-ELL samples into authentic ELL linguistic patterns. We further introduce a discriminator model to ensure the quality of synthetic samples. Experiments on California Science Test (CAST) datasets demonstrate that BRIDGE effectively reduces prediction bias for high-scoring ELL students while maintaining overall scoring performance. Notably, our method achieves fairness gains comparable to using additional real human data, offering a cost-effective solution for ensuring equitable scoring in large-scale assessments.
Abstract（参考訳）: 教育評価の分野では、自動スコアリングシステムはますますディープラーニングと大規模言語モデル(LLM)に依存している。しかし、これらのシステムはバイアス増幅の重大なリスクに直面しており、学生グループ間のモデル予測ギャップはトレーニングデータよりも大きくなる。この問題は、モデルが既存のデータ格差を継承し、さらに拡大する可能性があるため、英語学習者 (ELL) のような表現の浅いグループにとって特に深刻である。少数派(高評価のELL)サンプルの不足は、経験的リスク最小化でトレーニングされたモデルに、多数派(非ELL)言語パターンを優先させる。その結果、モデルは、同等のドメイン知識を示しながら異なる言語パターンを使用する ELL の学生を過小評価する傾向があり、それによって自動採点結果の公平性を損なう。 BRIDGEは,低リソース・アセスメント・セッティング用に設計されたBIS-Reduce Inter-group Data GEnerationフレームワークである。 BRIDGEは、限られた少数派のサンプルに頼る代わりに、豊富な高水準の非ELLサンプルから高水準のELサンプルを「ペースト」構築関連性(すなわち、ルーリックに整合した知識と証拠)のコンテンツから真正なELL言語パターンに合成する。さらに, 合成試料の品質を確保するために, 判別器モデルを導入する。 California Science Test (CAST)データセットの実験では、BRIDGEは総合的なスコアリング性能を維持しながら、ハイスコアのELL学生の予測バイアスを効果的に低減することを示した。特に,本手法は実データに匹敵する公平性向上を実現し,大規模評価において適切なスコアを確保できるコスト効率の高いソリューションを提供する。

関連論文リスト

A Comprehensive Study of Implicit and Explicit Biases in Large Language Models [1.0555164678638427]
この研究は、生成的AIが増大する中で、大規模言語モデルにおけるバイアスに対処する必要があることを強調する。我々は, StereoSet や CrowSPairs などのバイアス特異的ベンチマークを用いて,BERT や GPT 3.5 といった複数の生成モデルにおける様々なバイアスの存在を評価する。その結果、微調整されたモデルでは性別バイアスに悩まされるが、人種バイアスの特定と回避には優れていた。
論文参考訳（メタデータ） (2025-11-18T05:27:17Z)
Breaking the Benchmark: Revealing LLM Bias via Minimal Contextual Augmentation [12.56588481992456]
大規模言語モデルは、その表現と振舞いにステレオタイプ的バイアスを示すことが示されている。 3つのプラグ・アンド・プレイステップを含む,新規で汎用的な拡張フレームワークを提案する。大規模言語モデルは入力の摂動に影響を受けやすいことが分かり、ステレオタイプに振る舞う可能性が高くなる。
論文参考訳（メタデータ） (2025-10-27T23:05:12Z)
Detecting Prefix Bias in LLM-based Reward Models [4.596249232904721]
選好データセットに基づいて訓練された報酬モデルにおいて,プレフィックスバイアスを検知し,評価するための新しい手法を提案する。これらの指標を活用して、人種と性別の異なる嗜好モデルにおける大きなバイアスを明らかにします。本研究は,公正かつ信頼性の高い報酬モデルを開発する上で,バイアス対応データセットの設計と評価を重要視するものである。
論文参考訳（メタデータ） (2025-05-13T21:50:03Z)
Improving Group Fairness in Knowledge Distillation via Laplace Approximation of Early Exits [0.0]
そこで本研究では,Laplace近似法を用いて精度の高い不確実性推定値を得る手法を提案する。我々の主張を検証するために、MultiNLIデータセット上のBertベースのモデルを用いて、我々のアプローチをベンチマークする。
論文参考訳（メタデータ） (2025-05-02T07:18:52Z)
Tackling Diverse Minorities in Imbalanced Classification [80.78227787608714]
不均衡データセットは、様々な現実世界のアプリケーションで一般的に見られ、分類器の訓練において重要な課題が提示されている。マイノリティクラスとマイノリティクラスの両方のデータサンプルを混合することにより、反復的に合成サンプルを生成することを提案する。提案するフレームワークの有効性を,7つの公開ベンチマークデータセットを用いて広範な実験により実証する。
論文参考訳（メタデータ） (2023-08-28T18:48:34Z)
Non-Invasive Fairness in Learning through the Lens of Data Drift [88.37640805363317]
データや学習アルゴリズムを変更することなく、機械学習モデルの公平性を向上する方法を示す。異なる集団間の傾向のばらつきと、学習モデルと少数民族間の連続的な傾向は、データドリフトと類似している。このドリフトを解決するための2つの戦略(モデル分割とリウィーディング)を探索し、基礎となるデータに対するモデル全体の適合性を改善することを目的としている。
論文参考訳（メタデータ） (2023-03-30T17:30:42Z)
Delving into Identify-Emphasize Paradigm for Combating Unknown Bias [52.76758938921129]
同定精度を高めるため,有効バイアス強調スコアリング法(ECS)を提案する。また, マイニングされたバイアスアライメントとバイアスコンプリケート試料のコントリビューションのバランスをとるために, 勾配アライメント(GA)を提案する。様々な環境で複数のデータセットで実験を行い、提案されたソリューションが未知のバイアスの影響を軽減することを実証した。
論文参考訳（メタデータ） (2023-02-22T14:50:24Z)
Debiasing Vision-Language Models via Biased Prompts [79.04467131711775]
本稿では,テキスト埋め込みにおけるバイアスのある方向を投影することで,視覚言語基盤モデルを疎外する一般的な手法を提案する。偏平投影行列を組み込んだテキストのみをデバイアスすることで、ロバストな分類器と公正な生成モデルが得られることを示す。
論文参考訳（メタデータ） (2023-01-31T20:09:33Z)
General Greedy De-bias Learning [163.65789778416172]
本稿では,関数空間における勾配降下のような偏りのあるモデルとベースモデルを優雅に訓練する一般グリーディ・デバイアス学習フレームワーク(GGD)を提案する。 GGDは、事前知識を持つタスク固有バイアスモデルと、事前知識を持たない自己アンサンブルバイアスモデルの両方の設定の下で、より堅牢なベースモデルを学ぶことができる。
論文参考訳（メタデータ） (2021-12-20T14:47:32Z)
Few-shot Instruction Prompts for Pretrained Language Models to Detect Social Biases [55.45617404586874]
我々は、事前訓練された言語モデル(LM)を誘導する数ショットの命令ベース手法を提案する。大規模なLMは、微調整モデルとよく似た精度で、異なる種類の細粒度バイアスを検出できることを示す。
論文参考訳（メタデータ） (2021-12-15T04:19:52Z)
An Investigation of Why Overparameterization Exacerbates Spurious Correlations [98.3066727301239]
この動作を駆動するトレーニングデータの2つの重要な特性を特定します。モデルの"記憶"に対する帰納的バイアスが,パラメータ化の超過を損なう可能性を示す。
論文参考訳（メタデータ） (2020-05-09T01:59:13Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。