論文の概要: PEAK SHIFT ESTIMATION A novel method to estimate ranking of selectively
omitted examination data
- arxiv url: http://arxiv.org/abs/2103.05479v1
- Date: Tue, 9 Mar 2021 15:11:00 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-08 16:01:01.841873
- Title: PEAK SHIFT ESTIMATION A novel method to estimate ranking of selectively
omitted examination data
- Title(参考訳): PEAKShift推定 : 省略試験データのランク付けを推定する新しい手法
- Authors: Satoshi Takahashi and Masaki Kitazawa and Ryoma Aoki and Atsushi
Yoshikawa
- Abstract要約: 結果データを「選択的に省略された検査データ」と呼ぶ。
この種の試験の例としては、大学入学試験、認定試験、学生の就職活動の結果がある。
選択的に省略された試験データに基づいて,試験の難易度を推定する新しい手法,ピークシフト推定法を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we focus on examination results when examinees selectively
skip examinations, to compare the difficulty levels of these examinations. We
call the resultant data 'selectively omitted examination data' Examples of this
type of examination are university entrance examinations, certification
examinations, and the outcome of students' job-hunting activities. We can learn
the number of students accepted for each examination and organization but not
the examinees' identity. No research has focused on this type of data. When we
know the difficulty level of these examinations, we can obtain a new index to
assess organization ability, how many students pass, and the difficulty of the
examinations. This index would reflect the outcomes of their education
corresponding to perspectives on examinations. Therefore, we propose a novel
method, Peak Shift Estimation, to estimate the difficulty level of an
examination based on selectively omitted examination data. First, we apply Peak
Shift Estimation to the simulation data and demonstrate that Peak Shift
Estimation estimates the rank order of the difficulty level of university
entrance examinations very robustly. Peak Shift Estimation is also suitable for
estimating a multi-level scale for universities, that is, A, B, C, and D rank
university entrance examinations. We apply Peak Shift Estimation to real data
of the Tokyo metropolitan area and demonstrate that the rank correlation
coefficient between difficulty level ranking and true ranking is 0.844 and that
the difference between 80 percent of universities is within 25 ranks. The
accuracy of Peak Shift Estimation is thus low and must be improved; however,
this is the first study to focus on ranking selectively omitted examination
data, and therefore, one of our contributions is to shed light on this method.
- Abstract(参考訳): 本稿では,検査を選択的にスキップした場合の検査結果に着目し,これらの検査の難易度を比較した。
このタイプの試験の例として,大学入試,受験,学生の就職活動の結果を「選択的に省略した試験データ」と呼ぶ。
試験・組織ごとに受講した学生の数を学習できるが、受験者の身元は把握できない。
この種のデータに注目する研究はない。
これらの試験の難易度を知ると、組織能力、学生数、試験の難易度を評価するための新しい指標を得ることができる。
この指標は、試験の観点に応じた教育の結果を反映する。
そこで我々は,選択的に省略された試験データに基づいて,試験の難易度を推定する新しい手法,ピークシフト推定法を提案する。
まず、ピークシフト推定をシミュレーションデータに適用し、ピークシフト推定が大学入試の難易度のランク順を非常に頑健に推定することを示した。
ピークシフト推定は、a、b、c、dランクの大学入試の多段階尺度を推定するのにも適している。
首都圏の実データにピークシフト推定を適用し,難易度レベルのランクと真のランクとのランク相関係数が0.844であり,大学の80%の差が25位以内であることを実証する。
このように、ピークシフト推定の精度は低く、改善されなければならないが、これは選択的に省略された検査データのランク付けに焦点を合わせる最初の研究であり、この方法に光を当てることに貢献する。
関連論文リスト
- How to quantify an examination? Evidence from physics examinations via complex networks [1.8976969643491577]
試験のナレッジポイントネットワーク(KPN)は、ナレッジポイント(概念、法律等)をノードとして表現し、これらのポイントが同じ質問に現れるとリンクを追加することにより構成される。
構築されたKPNは、ほとんどの場合、強いアソシティと小さな世界効果を示すスケールフリーネットワークであることが判明した。
KPN内のコミュニティは明らかであり、キーノードは主に力学と電磁磁気に関係している。
論文 参考訳(メタデータ) (2024-07-18T05:06:18Z) - Beyond human subjectivity and error: a novel AI grading system [67.410870290301]
オープンエンドの質問の格付けは、教育における高い努力と高いインパクトの課題である。
AI技術の最近のブレークスルーは、このような自動化を促進するかもしれないが、大規模に実証されていない。
本稿では,新しい自動短解階調システム(ASAG)を提案する。
論文 参考訳(メタデータ) (2024-05-07T13:49:59Z) - On Pixel-level Performance Assessment in Anomaly Detection [87.7131059062292]
異常検出法は様々な応用において顕著な成功を収めている。
しかし、特にピクセルレベルでのパフォーマンスを評価することは複雑な課題である。
本稿では,視覚的エビデンスと統計的分析により,この課題の複雑さを解明する。
論文 参考訳(メタデータ) (2023-10-25T08:02:27Z) - SPOT: Sequential Predictive Modeling of Clinical Trial Outcome with
Meta-Learning [67.8195828626489]
臨床試験は薬物開発に不可欠であるが、時間を要する、費用がかかる、失敗する傾向がある。
本稿では,まず,複数ソースの臨床試験データを関連するトライアルトピックにクラスタリングするために,臨床トライアル結果の逐次予測mOdeling(SPOT)を提案する。
タスクとして各トライアルシーケンスを考慮して、メタ学習戦略を使用して、モデルが最小限のアップデートで新しいタスクに迅速に適応できるポイントを達成する。
論文 参考訳(メタデータ) (2023-04-07T23:04:27Z) - Predicting article quality scores with machine learning: The UK Research
Excellence Framework [6.582887504429817]
正確性は、医学・物理科学ユニット・オブ・アセスメント(UoAs)と経済学で最も高い。
社会科学、数学、工学、芸術、人文科学、そしてUoAsの基準の上の予測精度は、より低いかゼロに近いものであった。
提案手法は,能動的学習戦略による精度の向上と,予測確率の高い記事の選択により,アルゴリズムによって推定される結果の予測回数を大幅に削減する。
論文 参考訳(メタデータ) (2022-12-11T05:45:12Z) - Statistical and Computational Phase Transitions in Group Testing [73.55361918807883]
本研究の目的は、希少な疾患を患っているk人の集団を同定することである。
個々人のテストを割り当てるための2つの異なる単純なランダムな手順を考える。
論文 参考訳(メタデータ) (2022-06-15T16:38:50Z) - Abnormal-aware Multi-person Evaluation System with Improved Fuzzy
Weighting [0.0]
粗スクリーニングとスコア重み付きKendall-$tau$ Distanceからなる2段階スクリーニング法を選択する。
ファジィ・シンセティック・アセスメント・メソッド(FSE)を用いて、レビュアーによるスコアの重要度と信頼性を判定する。
論文 参考訳(メタデータ) (2022-05-01T03:42:43Z) - Catch Me if I Can: Detecting Strategic Behaviour in Peer Assessment [61.24399136715106]
我々は、試験やホームワークの査定や採用・昇進の査定など、様々な査定課題における戦略的行動の課題について考察する。
我々はこのような操作を検出する方法の設計に重点を置いている。
具体的には、エージェントがピアのサブセットを評価し、後に集約されたランキングを最終的な順序付けとして出力する設定について検討する。
論文 参考訳(メタデータ) (2020-10-08T15:08:40Z) - Refining Student Marks based on Enrolled Modules Assessment Methods
using Data Mining Techniques [0.0]
スコア作成のために,230万以上の学生記録を調査し,異なるデータ作成プロセスを提案する。
モジュール評価指標がランダム林とナイーブベイズ分類技術を用いた予測過程に及ぼす影響について検討した。
論文 参考訳(メタデータ) (2020-08-30T19:47:45Z) - Formulating Module Assessment for Improved Academic Performance
Predictability in Higher Education [0.0]
本稿では,230万以上の学生記録を調査し,異なるデータ作成プロセスを提案する。
ランダム森林分類手法を用いた予測過程におけるCARの影響について検討した。
論文 参考訳(メタデータ) (2020-08-30T19:42:31Z) - Cross-validation Confidence Intervals for Test Error [83.67415139421448]
この研究は、クロスバリデーションのための中心極限定理と、学習アルゴリズムの弱い安定性条件下での分散の一貫した推定器を開発する。
結果は、一般的な1対1のクロスバリデーションの選択にとって、初めてのものだ。
論文 参考訳(メタデータ) (2020-07-24T17:40:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。