論文の概要: Recovering Stranded Discrimination in Knowledge Tracing: Per-Item Bias Correction via Empirical-Bayes Shrinkage
- arxiv url: http://arxiv.org/abs/2606.14123v1
- Date: Fri, 12 Jun 2026 05:07:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-15 16:00:42.756849
- Title: Recovering Stranded Discrimination in Knowledge Tracing: Per-Item Bias Correction via Empirical-Bayes Shrinkage
- Title(参考訳): 知識追跡におけるストランド識別の復元:経験的ベイズ収縮による個人バイアス補正
- Authors: Xiaoran Yan, Cheng Tang, Atsushi Shimada,
- Abstract要約: State-space Logit Correctionは、バイナリ観測をLaplace/IRLS経由で擬似観測に変換する。
状態空間の定式化はベルヌーイの情報フロアを特徴づける検出性境界を与える。
クロスドメインコントロールは、デプロイされたバックボーンがエンティティレベルのバイアスを残すと、同じ現象が教育を超えて起こることを示唆している。
- 参考スコア(独自算出の注目度): 5.965959604603513
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deployed knowledge-tracing models are typically frozen after training, yet systematic per-item logit bias arises, from limited per-item expressivity in backbone architectures and from post-deployment shifts in item properties, degrading prediction quality. Global post-hoc calibrators such as Platt scaling, temperature scaling, and isotonic regression improve probability estimates but leave discriminative ability, as measured by AUC, unchanged. This AUC invariance is a structural consequence of monotone score-only transforms; recovering the stranded discrimination requires conditioning on item identity. We propose SLC (State-space Logit Correction), which converts binary observations to Gaussian pseudo-observations via Laplace/IRLS, applies empirical-Bayes shrinkage through a Kalman smoother, and fits an offset-Platt link. The state-space formulation also yields a detectability bound that characterizes the Bernoulli information floor, explaining why temporal tracking provides no benefit at current data densities. Across four datasets, five backbones, and three seeds, SLC improves AUC on all four datasets and NLL on three, with the advantage concentrating on sparse items. Cross-domain controls suggest that the same phenomenon can arise beyond education when the deployed backbone leaves entity-level bias.
- Abstract(参考訳): デプロイされた知識追跡モデルは、トレーニング後に凍結されるのが一般的だが、バックボーンアーキテクチャにおける各項目ごとの表現率の制限や、アイテム特性のデプロイ後のシフト、予測品質の低下など、体系的な1項目ごとのロジットバイアスが発生する。
プラッツスケーリング、温度スケーリング、等調回帰のようなグローバルなポストホックキャリブレータは確率推定を改善するが、AUCが測定した判別能力は変わらない。
このAUC不変性は、単調スコアのみの変換の構造的な結果であり、ストランド型識別を回復するには、アイテムアイデンティティの条件付けが必要である。
本稿では,2値観測をLaplace/IRLSによるガウス観測に変換するSLC(State-space Logit Correction)を提案する。
状態空間の定式化はまた、バーヌーイ情報床を特徴づける検出可能性をもたらし、なぜ時間的追跡が現在のデータ密度に利益をもたらすのかを説明する。
4つのデータセット、5つのバックボーン、3つのシードにまたがって、SLCは4つのデータセットのAUCを改善し、3つのデータセットのNLLを改善する。
クロスドメインコントロールは、デプロイされたバックボーンがエンティティレベルのバイアスを残すと、同じ現象が教育を超えて起こることを示唆している。
関連論文リスト
- When Attribution Patching Lies: Diagnosis and a Second-Order Correction [9.338965648455238]
本研究は, 下流ネットワークの非直線性に起因する誤差が, パッチ成分の局所曲率よりも大きいことを示す。
この洞察は、(i)信頼できない見積もりを検出するための信頼性スコア、(ii)エラー境界がポテンシャル属性の誤特定を定量化すること、(iii)Hessian-vector-product correctが1つの後進パスで先行エラーを除去すること、の3つの実用的なツールをもたらす。
論文 参考訳(メタデータ) (2026-06-05T05:20:32Z) - Clipping Bottleneck: Stabilizing RLVR via Stochastic Recovery of Near-Boundary Signals [83.0127582612634]
Near-boundary Rescue (NSR) は最小限のプラグ・アンド・プレイの修正であり、失った信号を回復するために、アウト・オブ・バウンドトークンを保持する。
NSRはトレーニングの安定性を大幅に改善し、DAPOやGSPOといった強力なベースライン上で一貫したゲインを提供する。
論文 参考訳(メタデータ) (2026-05-21T16:45:31Z) - IV-ICL: Bounding Causal Effects with Instrumental Variables via In-Context Learning [11.804716294874018]
IV-ICLは、因果効果の限界後部分布を直接学習し、その量子化として境界を導出するアモータイズされたベイズ内文脈学習法である。
合成および半合成IVベンチマーク上でIV-ICLを評価し,より信頼性が高く,より情報性の高い間隔を生成することを示す。
論文 参考訳(メタデータ) (2026-05-13T03:00:08Z) - Channel-Level Relation to Attentive Aggregation with Neighborhood-Homogeneity Constraint for Point Cloud Analysis [14.63838637349137]
3Dポイントのクラウド理解では、複雑な地区内の差別的特徴を正確に捉えることが課題である。
既存の手法では特徴相関の識別を探索するが、点レベルの空間分布やチャネル応答に制限される。
本稿では,チャネルレベルのメートル法に基づく拡張機構を備えた新しいネットワークであるPointCRAを提案する。
論文 参考訳(メタデータ) (2026-05-04T08:59:36Z) - Perturb and Correct: Post-Hoc Ensembles using Affine Redundancy [0.0]
P&C(Perturb-and-Correct)は,1つの事前学習ネットワークから多様な予測器を構築する手法である。
P&Cは後続のアフィン層に最小二乗補正を施したランダムな隠れ層摂動を適用し、キャリブレーションデータに同意する予測器を発生させる。
実証的には、P&C は MuJoCo の動的予測と CIFAR-10 OOD 検出にまたがる強力な ID/OOD トレードオフを実現している。
論文 参考訳(メタデータ) (2026-05-02T22:48:11Z) - Learning Uncertainty from Sequential Internal Dispersion in Large Language Models [52.29267172760918]
不確実性推定は、大規模言語モデルにおける幻覚を検出するための有望なアプローチである。
最近の手法は一般に不確実性を推定するために内部状態のモデルに依存する。
本稿では,教師付き幻覚検出フレームワークであるシークエンシャル内部変数表現(SIVR)を提案する。
論文 参考訳(メタデータ) (2026-04-17T06:31:29Z) - Dual-Stage Invariant Continual Learning under Extreme Visual Sparsity [8.16821029459195]
背景駆動の勾配は、連続的なドメインシフトの間、機能のバックボーンを不安定にすることを示す。
連成蒸留による二段階不変連続学習フレームワークを提案する。
高分解能空間ベース RSO 検出データセットの実験は、確立された連続物体検出法よりも一貫した改善を示す。
論文 参考訳(メタデータ) (2026-03-27T09:03:49Z) - A Unified View of Attention and Residual Sinks: Outlier-Driven Rescaling is Essential for Transformer Training [86.64715217940274]
外接線は正規化と共に機能する。
アウトリーチは、コントリビュータではなく、再スケール要因として役立ちます。
外乱は学習可能なパラメータに吸収されるか、明示的なゲート再スケーリングによって緩和される。
論文 参考訳(メタデータ) (2026-01-30T13:29:45Z) - Revisiting Multivariate Time Series Forecasting with Missing Values [65.30332997607141]
現実の時系列では欠落値が一般的である。
現在のアプローチでは、計算モジュールを使用して、不足した値を補う、計算済みの予測フレームワークが開発されている。
このフレームワークは、致命的な問題を見落としている: 欠落した値に対して基礎的な真理は存在せず、予測精度を劣化させる可能性のあるエラーの影響を受けやすいようにしている。
本稿では,Information Bottleneck原則に基づく新しいフレームワークであるConsistency-Regularized Information Bottleneck(CRIB)を紹介する。
論文 参考訳(メタデータ) (2025-09-27T20:57:48Z) - Imbalanced Aircraft Data Anomaly Detection [103.01418862972564]
航空シナリオ下でのセンサーからの時間データの異常検出は実用的だが難しい課題である。
本稿では,グラフィカル・テンポラル・データ分析フレームワークを提案する。
シリーズ・トゥ・イメージ (S2I) と呼ばれる3つのモジュール、ユークリッド距離 (CRD) を用いたクラスタ・ベース・リサンプリング・アプローチ、変数・ベース・ロス (VBL) から構成される。
論文 参考訳(メタデータ) (2023-05-17T09:37:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。