論文の概要: The "Astonishing Regularity'' Revisited: Sensitivity of Learning-Rate Estimates to Practice-Sequence Length
- arxiv url: http://arxiv.org/abs/2605.01690v1
- Date: Sun, 03 May 2026 03:07:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:49.885252
- Title: The "Astonishing Regularity'' Revisited: Sensitivity of Learning-Rate Estimates to Practice-Sequence Length
- Title(参考訳): Astonishing regularity': Revisited: Sensitivity of Learning-Rate Estimates to Practice-Sequence長
- Authors: Hansol Lee, Guilherme Lichand, Cristina Barnard, Lucas Klotz, Candace Thille, Yunsung Kim, Benjamin W. Domingue,
- Abstract要約: 学生ログデータの観察長は混合効果推定では無視できないという不測の仮定を探索する。
学生スキルペアあたりの最初の10回の捕獲は、学生の学習率の平均的なICCを75%に膨らませることを示した。
実例列長分布は,観測学習データに対する混合効果推定の未検討特性である,と我々は主張する。
- 参考スコア(独自算出の注目度): 0.7966335996690441
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: A 2023 \textit{PNAS} study by Koedinger et al. (2023) fit the individual Additive Factors Model (iAFM) to 27 educational datasets and reported an ``astonishing regularity'' in student learning rates: students vary substantially in initial knowledge but learn at remarkably similar rates with practice. We probe a largely unexamined assumption underlying this finding -- that observation length in student log data is ignorable for mixed-effects estimation -- by refitting the iAFM on 26 of the original datasets while systematically truncating practice sequences at various depths, holding the set of students and knowledge components constant. Capping at the first ten opportunities per student-skill pair inflates the median estimated IQR of student learning rates by 75\%; capping at five inflates it by 205\%, with individual datasets ranging from negligible to 17-fold. The magnitude of this sensitivity diverges from what standard estimation theory predicts under ignorable truncation, and the dataset-specific heterogeneity is substantial. Three candidate mechanisms from adjacent literatures could account for the pattern -- informative observation length, functional-form misspecification, and identification weakness from sparse per-pair data -- but observational analysis on these data alone cannot adjudicate among them. We argue that practice sequence length distributions are an unexamined property of mixed-effects estimation on observational learning data, deserving explicit reporting before conclusions about learning-rate heterogeneity are drawn.
- Abstract(参考訳): Koedinger et al (2023)による2023年の「textit{PNAS}」研究は、個別の追加因子モデル(iAFM)を27の教育データセットに適合させ、学生の学習率の「アスタニッシュ・レギュニティ」を報告した。
学生のログデータの観察長は混合効果推定では無視できないというこの発見の根拠を,元データセット26のiAFMを再構成し,学生と知識コンポーネントのセットを一定に保ちながら,様々な深さで実践シーケンスを体系的に切り詰める,という,ほぼ不明瞭な仮定を考察する。
学生スキルペアあたりの最初の10の機会でキャッピングすることは、学生の学習率の平均的なIQRを75\%、そして5つのキャッピングは205\%、個々のデータセットは無視できないから17倍に膨らませる。
この感度の大きさは、標準推定理論が無知な乱れの下で予測するものと大きく異なり、データセット固有の不均一性は相当である。
隣接する文献からの候補となる3つのメカニズムは、情報的観察の長さ、機能的形態の誤識別、ペアごとのスパースデータからの識別の弱点など、このパターンを説明することができる。
我々は,学習速度の不均一性に関する結論が提示される前に明示的な報告を保ちながら,実践シーケンスの長さ分布が観察的学習データに対する混合効果推定の未検討特性であると主張している。
関連論文リスト
- Robust Molecular Property Prediction via Densifying Scarce Labeled Data [53.24886143129006]
薬物発見において、研究を進める上で最も重要な化合物は、しばしば訓練セットを越えている。
本稿では, ラベル付きデータを利用して, 分布内データ(ID)と分布外データ(OOD)を補間する2段階最適化手法を提案する。
論文 参考訳(メタデータ) (2025-06-13T15:27:40Z) - Leveraging Per-Instance Privacy for Machine Unlearning [43.55855852029299]
我々は、微調整による未学習の難しさを定量化するための原則的、インスタンスごとのアプローチを提案する。
我々の発見は、個々のデータポイントのユニークな性質に合わせて、より効率的で適応的な未学習戦略の基礎を提供する。
論文 参考訳(メタデータ) (2025-05-24T16:55:57Z) - Learning Invariant Representations with Missing Data [18.307438471163774]
相関誘導型テクトニュアンス変数を含む特定の依存性を満たすモデルでは、テスト性能が保証される。
欠損したニュアンスの下での非分散目的のためのアクロルトムド推定器を導出する。
シミュレーションと臨床データについて、これらの推定を最適化すると、全データを利用する推定器と同様のテスト性能が得られる。
論文 参考訳(メタデータ) (2021-12-01T23:14:34Z) - OR-Net: Pointwise Relational Inference for Data Completion under Partial
Observation [51.083573770706636]
この作業はリレーショナル推論を使って不完全なデータを埋めます。
本稿では,2つの点での相対性理論をモデル化するために,全関係ネットワーク (or-net) を提案する。
論文 参考訳(メタデータ) (2021-05-02T06:05:54Z) - Correct block-design experiments mitigate temporal correlation bias in
EEG classification [68.85562949901077]
[1]の主主張は極めて過大評価されており、他の分析は間違った方法論的選択によって深刻な欠陥を負っていることを示す。
脳波の時間相関が2つの実験環境で同じモデルをテストすることによって分類精度に及ぼす影響について検討した。
論文 参考訳(メタデータ) (2020-11-25T22:25:21Z) - On Disentangled Representations Learned From Correlated Data [59.41587388303554]
相関データに対する最も顕著な絡み合うアプローチの挙動を解析することにより、現実のシナリオにギャップを埋める。
本研究では,データセットの体系的相関が学習され,潜在表現に反映されていることを示す。
また、トレーニング中の弱い監督や、少数のラベルで事前訓練されたモデルを修正することで、これらの潜伏相関を解消する方法を実証する。
論文 参考訳(メタデータ) (2020-06-14T12:47:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。