論文の概要: A Leakage-Aware Data Layer For Student Analytics: The Capire Framework For Multilevel Trajectory Modeling
- arxiv url: http://arxiv.org/abs/2511.11866v1
- Date: Fri, 14 Nov 2025 20:52:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-18 14:36:23.349858
- Title: A Leakage-Aware Data Layer For Student Analytics: The Capire Framework For Multilevel Trajectory Modeling
- Title(参考訳): 学生分析のための漏洩認識データ層:多段階軌跡モデリングのためのキャプライアフレームワーク
- Authors: H. R. Paz,
- Abstract要約: 本稿では,学生軌跡分析のための漏洩認識データ層を提案する。
N1(個人的・社会経済的属性)、N2(エントリーモーメントと学術的歴史)、N3(曲的摩擦と性能)、N4(制度的・マクロコンテキスト変数)の4つのレベルに予測者を編成する特徴工学設計を提案する。
長期サイクルエンジニアリングプログラム(学生1,343人、57%のドロップアウト)における実証的な応用は、VOT制限されたマルチレベル特徴が堅牢な考古学的発見をサポートすることを示している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Predictive models for student dropout, while often accurate, frequently rely on opportunistic feature sets and suffer from undocumented data leakage, limiting their explanatory power and institutional usefulness. This paper introduces a leakage-aware data layer for student trajectory analytics, which serves as the methodological foundation for the CAPIRE framework for multilevel modelling. We propose a feature engineering design that organizes predictors into four levels: N1 (personal and socio-economic attributes), N2 (entry moment and academic history), N3 (curricular friction and performance), and N4 (institutional and macro-context variables)As a core component, we formalize the Value of Observation Time (VOT) as a critical design parameter that rigorously separates observation windows from outcome horizons, preventing data leakage by construction. An illustrative application in a long-cycle engineering program (1,343 students, ~57% dropout) demonstrates that VOT-restricted multilevel features support robust archetype discovery. A UMAP + DBSCAN pipeline uncovers 13 trajectory archetypes, including profiles of "early structural crisis," "sustained friction," and "hidden vulnerability" (low friction but high dropout). Bootstrap and permutation tests confirm these archetypes are statistically robust and temporally stable. We argue that this approach transforms feature engineering from a technical step into a central methodological artifact. This data layer serves as a disciplined bridge between retention theory, early-warning systems, and the future implementation of causal inference and agent-based modelling (ABM) within the CAPIRE program.
- Abstract(参考訳): 学生のドロップアウトの予測モデルは、しばしば正確であるが、機会論的特徴セットに頼り、説明力と制度上の有用性を制限し、文書化されていないデータ漏洩に悩まされる。
本稿では,マルチレベルモデリングのためのCAPIREフレームワークの方法論基盤として機能する,学生軌跡解析のためのリーク対応データ層を提案する。
N1(個人的・社会経済的属性)、N2(エントリーモーメントと学術的歴史)、N3(分子的摩擦と性能)、N4(制度的・マクロコンテキスト変数)の4つのレベルに予測者を編成する機能エンジニアリング設計を提案する。
長期サイクルエンジニアリングプログラム(学生1,343人、ドロップアウト57%)のイラストでは、VOT制限されたマルチレベル機能は堅牢な考古学的発見をサポートすることが示されている。
UMAP + DBSCANパイプラインは、"初期の構造的危機"、"持続的な摩擦"、"隠れた脆弱性"(摩擦が低いが高い落下)のプロファイルを含む13の軌道のアーチタイプを明らかにする。
ブートストラップと置換試験はこれらのアーチタイプが統計的に堅牢で時間的に安定であることを確認した。
このアプローチは、機能エンジニアリングを技術的なステップから中心的な方法論的アーティファクトに変換するものだ、と私たちは主張する。
このデータレイヤは、保持理論、早期警戒システム、およびCAPIREプログラムにおける因果推論とエージェントベースモデリング(ABM)の将来の実装の間の規律あるブリッジとして機能する。
関連論文リスト
- Empowering Bridge Digital Twins by Bridging the Data Gap with a Unified Synthesis Framework [6.238251307666132]
本稿では,3次元ブリッジデータを生成するための体系的枠組みを提案する。
コンポーネントレベルのインスタンスアノテーション、高忠実度カラー、正確な正規ベクトルを特徴とするポイントクラウドを自動的に生成できる。
実世界のブリッジセマンティックセマンティックセグメンテーションにおいて,合成データを用いてトレーニングしたPointNet++モデルにより,平均的なmIoU(Intersection over Union)が84.2%に達することを示す。
論文 参考訳(メタデータ) (2025-07-08T09:34:55Z) - Instance-Prototype Affinity Learning for Non-Exemplar Continual Graph Learning [7.821213342456415]
グラフニューラルネットワークは破滅的な忘れを耐え、以前獲得した知識を保持する能力を損なう。
非現代連続グラフ学習(NECGL)のための新しいパラダイムであるインスタンス型親和性学習(IPAL)を提案する。
我々は,PCL内に決定境界知覚機構を組み込み,クラス間識別性を向上する。
論文 参考訳(メタデータ) (2025-05-15T07:35:27Z) - From Correctness to Comprehension: AI Agents for Personalized Error Diagnosis in Education [24.970741456147447]
大規模言語モデル(LLM)は、GSM8Kのようなベンチマークでほぼ完璧なパフォーマンスを達成し、驚くべき数学的推論能力を示している。
しかし、誤り診断やフィードバック生成よりも正確さが過大評価されているため、パーソナライズされた教育への応用は依然として限られている。
textbfMathCCSは,システム的エラー解析と修正されたフィードバックのためのベンチマークである。
第2に、過去のデータを利用してトレンドを追跡し、診断精度を向上させるシーケンシャルなエラー解析フレームワークを開発する。
第3に、歴史的分析のための時系列エージェントと実時間のためのMLLMエージェントを組み合わせたマルチエージェント協調フレームワークを提案する。
論文 参考訳(メタデータ) (2025-02-19T14:57:51Z) - TopoFR: A Closer Look at Topology Alignment on Face Recognition [58.45515807380505]
PTSAと呼ばれるトポロジカル構造アライメント戦略とSDEという硬質試料マイニング戦略を利用する新しいFRモデルであるTopoFRを提案する。
PTSAは永続ホモロジーを用いて入力空間と潜在空間の位相構造を整列し、構造情報を効果的に保存し、FRモデルの一般化性能を向上させる。
一般的な顔のベンチマーク実験の結果は、最先端の手法よりもTopoFRの方が優れていることを示している。
論文 参考訳(メタデータ) (2024-10-14T14:58:30Z) - FILP-3D: Enhancing 3D Few-shot Class-incremental Learning with Pre-trained Vision-Language Models [59.13757801286343]
クラス増分学習(class-incremental learning)は、モデルが限られたデータで漸進的にトレーニングされている場合、破滅的な忘れの問題を軽減することを目的としている。
本稿では,特徴空間の不整合のための冗長特徴除去器 (RFE) と,重要な雑音に対する空間ノイズ補償器 (SNC) の2つの新しいコンポーネントを備えたFILP-3Dフレームワークを紹介する。
論文 参考訳(メタデータ) (2023-12-28T14:52:07Z) - Geometric Deep Learning for Structure-Based Drug Design: A Survey [83.87489798671155]
構造に基づく薬物設計(SBDD)は、タンパク質の3次元幾何学を利用して、潜在的な薬物候補を特定する。
近年の幾何学的深層学習の進歩は、3次元幾何学的データを効果的に統合・処理し、この分野を前進させてきた。
論文 参考訳(メタデータ) (2023-06-20T14:21:58Z) - Enhancing Multiple Reliability Measures via Nuisance-extended
Information Bottleneck [77.37409441129995]
トレーニングデータに制限がある現実的なシナリオでは、データ内の多くの予測信号は、データ取得のバイアスからより多く得る。
我々は,相互情報制約の下で,より広い範囲の摂動をカバーできる敵の脅威モデルを考える。
そこで本研究では,その目的を実現するためのオートエンコーダベーストレーニングと,提案したハイブリッド識別世代学習を促進するための実用的なエンコーダ設計を提案する。
論文 参考訳(メタデータ) (2023-03-24T16:03:21Z) - ROME: Robustifying Memory-Efficient NAS via Topology Disentanglement and
Gradient Accumulation [106.04777600352743]
微分可能なアーキテクチャサーチ(DARTS)は、スーパーネット全体がメモリに格納されているため、メモリコストが大幅に低下する。
シングルパスのDARTSが登場し、各ステップでシングルパスのサブモデルのみを選択する。
メモリフレンドリーだが、計算コストも低い。
RObustifying Memory-Efficient NAS (ROME) と呼ばれる新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-11-23T06:34:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。