論文の概要: Balancing Test Accuracy and Security in Computerized Adaptive Testing
- arxiv url: http://arxiv.org/abs/2305.18312v1
- Date: Thu, 18 May 2023 18:32:51 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-04 11:41:07.138812
- Title: Balancing Test Accuracy and Security in Computerized Adaptive Testing
- Title(参考訳): コンピュータ適応テストにおけるテスト精度とセキュリティのバランス
- Authors: Wanyong Feng, Aritra Ghosh, Stephen Sireci, Andrew S. Lan
- Abstract要約: 双方向最適化ベースのCAT(BOBCAT)は、データ駆動型質問選択アルゴリズムを学習するフレームワークである。
高い質問の露出とテストの重複率に悩まされ、テストのセキュリティに影響を及ぼす可能性がある。
C-BOBCATは、2つの実世界のアダルトテストデータセットに対する広範な実験を通じて有効であることを示す。
- 参考スコア(独自算出の注目度): 18.121437613260618
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Computerized adaptive testing (CAT) is a form of personalized testing that
accurately measures students' knowledge levels while reducing test length.
Bilevel optimization-based CAT (BOBCAT) is a recent framework that learns a
data-driven question selection algorithm to effectively reduce test length and
improve test accuracy. However, it suffers from high question exposure and test
overlap rates, which potentially affects test security. This paper introduces a
constrained version of BOBCAT to address these problems by changing its
optimization setup and enabling us to trade off test accuracy for question
exposure and test overlap rates. We show that C-BOBCAT is effective through
extensive experiments on two real-world adult testing datasets.
- Abstract(参考訳): computerized adaptive testing (cat) は、学生の知識レベルを正確に測定し、テスト期間を短縮するパーソナライズドテストの一種である。
双方向最適化ベースのCAT(BOBCAT)は、データ駆動型質問選択アルゴリズムを学習し、テスト長を効果的に削減し、テスト精度を向上させる。
しかし、高い質問の露出とテスト重複率に悩まされており、テストのセキュリティに影響を及ぼす可能性がある。
本稿では,BOBCATの制約付きバージョンを導入し,最適化設定を変更し,テストの精度を問題露出とテスト重複率のトレードオフを可能にする。
C-BOBCATは、2つの実世界のアダルトテストデータセットに対する広範な実験を通じて有効であることを示す。
関連論文リスト
- Active Test-Time Adaptation: Theoretical Analyses and An Algorithm [51.84691955495693]
テスト時間適応(TTA)は、教師なし設定でストリーミングテストデータの分散シフトに対処する。
完全TTA設定内に能動学習を統合する能動テスト時間適応(ATTA)の新たな問題設定を提案する。
論文 参考訳(メタデータ) (2024-04-07T22:31:34Z) - Survey of Computerized Adaptive Testing: A Machine Learning Perspective [66.26687542572974]
コンピュータ適応テスト (Computerized Adaptive Testing, CAT) は、試験の熟練度を評価するための効率的で調整された方法である。
本稿では,この適応テスト手法に対する新たな視点を提示し,機械学習に着目したCATに関する調査を行うことを目的とする。
論文 参考訳(メタデータ) (2024-03-31T15:09:47Z) - Fine-Grained Assertion-Based Test Selection [6.9290255098776425]
回帰テスト選択技術は、コードの変更によって影響を受けるテストのみを選択することで、テスト実行時間を短縮することを目的としている。
本稿では,文レベルでのテストコードを分析し,テストアサーションを選択の単位として扱うことによって,選択精度を高める新しい手法を提案する。
論文 参考訳(メタデータ) (2024-03-24T04:07:30Z) - FlaKat: A Machine Learning-Based Categorization Framework for Flaky
Tests [3.0846824529023382]
不安定なテストは、ソフトウェアシステムに変更を加えることなく、非決定的に通過または失敗する可能性がある。
State-of-the-art Researchは、機械学習ソリューションを不安定なテスト検出に取り入れ、合理的に優れた精度を達成する。
論文 参考訳(メタデータ) (2024-03-01T22:00:44Z) - Precise Error Rates for Computationally Efficient Testing [75.63895690909241]
本稿では,計算複雑性に着目した単純な対数-単純仮説テストの問題を再考する。
線形スペクトル統計に基づく既存の試験は、I型とII型の誤差率の間の最良のトレードオフ曲線を達成する。
論文 参考訳(メタデータ) (2023-11-01T04:41:16Z) - Addressing Selection Bias in Computerized Adaptive Testing: A User-Wise
Aggregate Influence Function Approach [14.175555669521987]
本稿では,選択バイアス問題に対処するユーザ・ワイド・アグリゲート・インフルエンス関数法を提案する。
私たちの直感は、レスポンスデータが集約的に大きく偏っているユーザをフィルタリングすることです。
論文 参考訳(メタデータ) (2023-08-23T04:57:21Z) - A Comprehensive Survey on Test-Time Adaptation under Distribution Shifts [143.14128737978342]
新たなパラダイムであるテスト時適応は、事前トレーニングされたモデルをテスト中にラベルのないデータに適用し、予測を行う可能性がある。
このパラダイムの最近の進歩は、推論に先立って自己適応モデルのトレーニングにラベルのないデータを活用するという大きな利点を浮き彫りにしている。
論文 参考訳(メタデータ) (2023-03-27T16:32:21Z) - DELTA: degradation-free fully test-time adaptation [59.74287982885375]
テスト時間バッチ正規化(BN)や自己学習といった,一般的な適応手法では,2つの好ましくない欠陥が隠されていることがわかった。
まず、テスト時間BNにおける正規化統計は、現在受信されているテストサンプルに完全に影響され、その結果、不正確な推定結果が得られることを明らかにする。
第二に、テスト時間適応中にパラメータ更新が支配的なクラスに偏っていることを示す。
論文 参考訳(メタデータ) (2023-01-30T15:54:00Z) - BOBCAT: Bilevel Optimization-Based Computerized Adaptive Testing [3.756550107432323]
コンピュータ適応テスト (Computerized Adaptive Testing, CAT) は、学生/試験受験者全員にパーソナライズされたテストの一種である。
我々は、データ駆動型質問選択アルゴリズムをトレーニングデータから直接学習するための、双方向最適化ベースのCATフレームワークであるBOBCATを提案する。
論文 参考訳(メタデータ) (2021-08-17T00:40:23Z) - Noisy Adaptive Group Testing using Bayesian Sequential Experimental
Design [63.48989885374238]
病気の感染頻度が低い場合、Dorfman氏は80年前に、人のテストグループは個人でテストするよりも効率が良いことを示した。
本研究の目的は,ノイズの多い環境で動作可能な新しいグループテストアルゴリズムを提案することである。
論文 参考訳(メタデータ) (2020-04-26T23:41:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。