論文の概要: Multi-Method Analysis of Mathematics Placement Assessments: Classical, Machine Learning, and Clustering Approaches
- arxiv url: http://arxiv.org/abs/2511.04667v1
- Date: Thu, 06 Nov 2025 18:53:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-07 20:17:53.57567
- Title: Multi-Method Analysis of Mathematics Placement Assessments: Classical, Machine Learning, and Clustering Approaches
- Title(参考訳): 数学配置評価のマルチメソッド分析:古典的, 機械学習, クラスタリング的アプローチ
- Authors: Julian D. Allagan, Dasia A. Singleton, Shanae N. Perry, Gabrielle C. Morgan, Essence A. Morgan,
- Abstract要約: 本研究は,198名の学生を対象に,40項目の数学配置試験を評価する。
古典的テスト理論、機械学習、教師なしクラスタリングを組み合わせたマルチメソッドフレームワークを使用している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This study evaluates a 40-item mathematics placement examination administered to 198 students using a multi-method framework combining Classical Test Theory, machine learning, and unsupervised clustering. Classical Test Theory analysis reveals that 55\% of items achieve excellent discrimination ($D \geq 0.40$) while 30\% demonstrate poor discrimination ($D < 0.20$) requiring replacement. Question 6 (Graph Interpretation) emerges as the examination's most powerful discriminator, achieving perfect discrimination ($D = 1.000$), highest ANOVA F-statistic ($F = 4609.1$), and maximum Random Forest feature importance (0.206), accounting for 20.6\% of predictive power. Machine learning algorithms demonstrate exceptional performance, with Random Forest and Gradient Boosting achieving 97.5\% and 96.0\% cross-validation accuracy. K-means clustering identifies a natural binary competency structure with a boundary at 42.5\%, diverging from the institutional threshold of 55\% and suggesting potential overclassification into remedial categories. The two-cluster solution exhibits exceptional stability (bootstrap ARI = 0.855) with perfect lower-cluster purity. Convergent evidence across methods supports specific refinements: replace poorly discriminating items, implement a two-stage assessment, and integrate Random Forest predictions with transparency mechanisms. These findings demonstrate that multi-method integration provides a robust empirical foundation for evidence-based mathematics placement optimization.
- Abstract(参考訳): 本研究では,古典的テスト理論,機械学習,教師なしクラスタリングを組み合わせたマルチメソッドフレームワークを用いて,198名の学生を対象に40項目の数学配置試験を行った。
古典的テスト理論分析では、55\%の項目が優れた差別(D \geq 0.40$)を達成する一方、30\%は代替を必要とする差別(D < 0.20$)を示す。
質問6(Graph Interpretation)は、試験の最も強力な差別者として現れ、完全な差別(D = 1.000$)、最高のANOVA F統計(F = 4609.1$)、最大ランダムフォレスト特徴重要度(0.206)を達成し、予測力の20.6%を占める。
機械学習アルゴリズムは、ランダムフォレスト(Random Forest)とグラディエント・ブースティング(Gradient Boosting)の97.5\%と96.0\%のクロスバリデーション精度を達成している。
K平均クラスタリングは、境界が42.5\%の自然二分的能力構造を識別し、55\%の制度的しきい値から分岐し、潜在的過大分類を修復カテゴリーに導く。
2クラスター溶液は、完全な低クラスター純度を持つ例外的な安定性(ブートストラップARI = 0.855)を示す。
厳密な証拠は、未分化なアイテムの代替、二段階評価の実装、ランダムフォレスト予測と透明性メカニズムの統合など、特定の改善を支持する。
これらの結果から,マルチメソッド統合はエビデンスに基づく数学配置最適化のための堅牢な経験的基礎を提供することが示された。
関連論文リスト
- Feature Selection and Regularization in Multi-Class Classification: An Empirical Study of One-vs-Rest Logistic Regression with Gradient Descent Optimization and L1 Sparsity Constraints [0.0]
マルチクラスのワイン分類は、モデル精度、特徴次元、解釈可能性の基本的なトレードオフを示す。
本稿では,UCIワインデータセット上での1-vs-Restロジスティック回帰に関する総合的研究について述べる。
論文 参考訳(メタデータ) (2025-10-16T08:47:05Z) - Rethinking LLM Evaluation: Can We Evaluate LLMs with 200x Less Data? [82.09573568241724]
EssenceBenchは反復遺伝的アルゴリズム(GA)を利用した粗粒度フレームワーク
提案手法は, 再構成誤差が低く, 効率が著しく向上した, 優れた圧縮結果が得られる。
HellaSwagベンチマーク(10Kサンプル)では,25倍少ないサンプルを用いて,全モデルが5%以内の順位を保ち,わずか200倍少ないサンプルを用いて,95%未満のランキング保持シフトを達成している。
論文 参考訳(メタデータ) (2025-10-12T05:38:10Z) - Semiparametric Learning from Open-Set Label Shift Data [14.537408547515627]
オープンセットラベルシフト問題について検討し、テストデータにはトレーニングに欠席した新しいクラスが含まれる可能性がある。
この設定は、クラス比率と新しいクラスの分布の両方が余分な仮定なしでは識別できないため、難しい。
本稿では,新しいクラスと既知のクラス間の重なりを許容しながら,識別可能性を保証する半パラメトリック密度比モデルフレームワークを提案する。
論文 参考訳(メタデータ) (2025-09-18T01:32:29Z) - How does promoting the minority fraction affect generalization? A theoretical study of the one-hidden-layer neural network on group imbalance [64.1656365676171]
グループ不均衡は経験的リスク最小化において既知の問題である。
本稿では,個々の集団がサンプルの複雑さ,収束率,平均および群レベルの試験性能に与える影響を定量化する。
論文 参考訳(メタデータ) (2024-03-12T04:38:05Z) - Beyond Expectations: Learning with Stochastic Dominance Made Practical [88.06211893690964]
支配は、不確実な結果で意思決定を行うためのリスク-逆の選好をモデル化する。
理論上は魅力的だが、機械学習における優位性の応用は乏しい。
まず支配の概念を一般化し、任意の確率変数の任意のペア間の比較を可能にする。
次に、優位性の観点から最適解を見つけるための単純で効率的なアプローチを開発する。
論文 参考訳(メタデータ) (2024-02-05T03:21:23Z) - Analysis of Diagnostics (Part I): Prevalence, Uncertainty Quantification, and Machine Learning [0.0]
この写本は、分類理論と有病率のより深い関係を研究する二部作の最初のものである。
そこで本稿では,有病率重み付き経験誤差を最小化することにより,Bstar (q)$を推定する数値ホモトピーアルゴリズムを提案する。
合成データとSARS-CoV-2酵素結合免疫測定法(ELISA)を用いて本法の有効性を検証した。
論文 参考訳(メタデータ) (2023-08-30T13:26:49Z) - ProBoost: a Boosting Method for Probabilistic Classifiers [55.970609838687864]
ProBoostは確率的分類器のための新しいブースティングアルゴリズムである。
各トレーニングサンプルの不確実性を使用して、最も困難で不確実なものを決定する。
これは、最も不確実性が高いと判明したサンプルに徐々に焦点をあてる配列を生成する。
論文 参考訳(メタデータ) (2022-09-04T12:49:20Z) - Minimax Pareto Fairness: A Multi Objective Perspective [24.600419295290504]
グループフェアネスは多目的最適化問題であり、各敏感なグループリスクは別個の目的である。
これらの制約を満たすために、ディープニューラルネットワークと互換性のある単純なアルゴリズムを提供する。
提案手法は,収入予測,ICU患者死亡率,皮膚病変分類,信用リスク評価の実際のケーススタディについて検証した。
論文 参考訳(メタデータ) (2020-11-03T16:21:53Z) - Causal Feature Selection for Algorithmic Fairness [61.767399505764736]
データ管理の統合コンポーネントにおける公平性について検討する。
本稿では,データセットの公平性を保証する特徴のサブコレクションを同定する手法を提案する。
論文 参考訳(メタデータ) (2020-06-10T20:20:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。