論文の概要: $\beta^{4}$-IRT: A New $\beta^{3}$-IRT with Enhanced Discrimination
Estimation
- arxiv url: http://arxiv.org/abs/2303.17731v1
- Date: Thu, 30 Mar 2023 22:13:11 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-03 15:47:29.413837
- Title: $\beta^{4}$-IRT: A New $\beta^{3}$-IRT with Enhanced Discrimination
Estimation
- Title(参考訳): $\beta^{4}$-irt:新しい$\beta^{3}$-irt
- Authors: Manuel Ferreira-Junior, Jessica T.S. Reinaldo, Telmo M. Silva Filho,
Eufrasio A. Lima Neto, Ricardo B.C. Prudencio
- Abstract要約: モデルパラメータを推定するために勾配降下法を用いる$beta3$-IRTの新バージョンである$beta4$-IRTを提案する。
そこで、$beta4$-IRT を制約なしの勾配降下プロセスに変換するために、リンク関数を使用します。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Item response theory aims to estimate respondent's latent skills from their
responses in tests composed of items with different levels of difficulty.
Several models of item response theory have been proposed for different types
of tasks, such as binary or probabilistic responses, response time, multiple
responses, among others. In this paper, we propose a new version of
$\beta^3$-IRT, called $\beta^{4}$-IRT, which uses the gradient descent method
to estimate the model parameters. In $\beta^3$-IRT, abilities and difficulties
are bounded, thus we employ link functions in order to turn $\beta^{4}$-IRT
into an unconstrained gradient descent process. The original $\beta^3$-IRT had
a symmetry problem, meaning that, if an item was initialised with a
discrimination value with the wrong sign, e.g. negative when the actual
discrimination should be positive, the fitting process could be unable to
recover the correct discrimination and difficulty values for the item. In order
to tackle this limitation, we modelled the discrimination parameter as the
product of two new parameters, one corresponding to the sign and the second
associated to the magnitude. We also proposed sensible priors for all
parameters. We performed experiments to compare $\beta^{4}$-IRT and
$\beta^3$-IRT regarding parameter recovery and our new version outperformed the
original $\beta^3$-IRT. Finally, we made $\beta^{4}$-IRT publicly available as
a Python package, along with the implementation of $\beta^3$-IRT used in our
experiments.
- Abstract(参考訳): 項目応答理論は, 難易度が異なる項目からなるテストにおいて, 回答者の潜伏スキルを推定することを目的としている。
項目応答理論のいくつかのモデルは、二進的または確率的応答、応答時間、複数応答など、様々な種類のタスクに対して提案されている。
本稿では,モデルパラメータの推定に勾配降下法を用いる$\beta^3$-IRTの新バージョンである$\beta^{4}$-IRTを提案する。
しかし、$\beta^3$-irt では、能力と難易度は限定されており、$\beta^{4}$-irt を制約のない勾配降下プロセスに変換するためにリンク関数を用いる。
もともとの$\beta^3$-IRTは対称性の問題であり、もしアイテムが間違った符号で識別値で初期化されていれば、例えば、実際の識別が正のときに負の値となると、そのアイテムの正しい識別と難易度を回復できない。
この制限に対処するため、我々は識別パラメータを2つの新しいパラメータの積としてモデル化した。
また,すべてのパラメータに対する有意義な事前設定も提案した。
我々はパラメータリカバリに関して$\beta^{4}$-IRTと$\beta^3$-IRTを比較する実験を行い、我々の新バージョンはオリジナルの$\beta^3$-IRTよりも優れていた。
最後に、実験で使われる$\beta^3$-IRTの実装とともに、$\beta^{4}$-IRTをPythonパッケージとして公開しました。
関連論文リスト
- Active Subsampling for Measurement-Constrained M-Estimation of Individualized Thresholds with High-Dimensional Data [3.1138411427556445]
測定制約のある問題では、大きなデータセットが利用可能であるにもかかわらず、大きなデータセットのごく一部でラベルを観測するのに手頃な価格にしかならない。
このことは、どのデータポイントが予算制約のあるラベルに最も有益であるかという重要な疑問を引き起こします。
本稿では,測定制約付きM推定フレームワークにおける最適個別化しきい値の推定に焦点をあてる。
論文 参考訳(メタデータ) (2024-11-21T00:21:17Z) - Contextual Combinatorial Bandits with Probabilistically Triggered Arms [55.9237004478033]
確率的に誘発される腕(C$2$MAB-T)を様々な滑らかさ条件下で検討した。
トリガー変調 (TPM) 条件の下では、C$2$-UC-Tアルゴリズムを考案し、後悔すべき$tildeO(dsqrtT)$を導出する。
論文 参考訳(メタデータ) (2023-03-30T02:51:00Z) - Revisiting Weighted Strategy for Non-stationary Parametric Bandits [82.1942459195896]
本稿では,非定常パラメトリックバンディットの重み付け戦略を再考する。
より単純な重みに基づくアルゴリズムを生成する改良された分析フレームワークを提案する。
我々の新しいフレームワークは、他のパラメトリックバンディットの後悔の限界を改善するのに使える。
論文 参考訳(メタデータ) (2023-03-05T15:11:14Z) - Smooth Non-Stationary Bandits [49.19728527803684]
本研究では、各アームの平均報酬シーケンスを$beta$-H"older関数に埋め込むことができる非定常包帯問題について検討する。
スムース(つまり$betage 2$)と非スムース(つまり$beta=1$)との最初の分離は、$tilde O(k4/5 T3/5)$ regret on any $k$-armed, $2-H"older instanceでポリシーを提示することで示します。
論文 参考訳(メタデータ) (2023-01-29T06:03:20Z) - Horizon-Free and Variance-Dependent Reinforcement Learning for Latent
Markov Decision Processes [62.90204655228324]
我々は,後期マルコフ決定過程(LMDP)における強化学習(RL)の文脈を考慮した後悔の最小化について検討した。
我々は,モデル最適化と値最適化の両手法でインスタンス化できる,新しいモデルベースアルゴリズムフレームワークを設計する。
論文 参考訳(メタデータ) (2022-10-20T21:32:01Z) - Optimistic Posterior Sampling for Reinforcement Learning with Few
Samples and Tight Guarantees [43.13918072870693]
強化学習(OPSRL)のための楽観的後部サンプリングアルゴリズムを提案する。
殆どの$widetildemathcalO(sqrtH3SAT)$ ignoring $textpolylog(HSAT)$ termsにおいて、高い確率で再帰的な順序境界を保証する。
我々の境界は位数$Omega(sqrtH3SAT)$の下位境界と一致し、Agrawal と Jia が提起した開問題に答える。
論文 参考訳(メタデータ) (2022-09-28T20:49:34Z) - Provably Breaking the Quadratic Error Compounding Barrier in Imitation
Learning, Optimally [58.463668865380946]
状態空間 $mathcalS$ を用いたエピソードマルコフ決定過程 (MDPs) における模擬学習の統計的限界について検討する。
rajaraman et al (2020) におけるmdアルゴリズムを用いた準最適性に対する上限 $o(|mathcals|h3/2/n)$ を定式化する。
Omega(H3/2/N)$ $mathcalS|geq 3$ であるのに対して、未知の遷移条件はよりシャープレートに悩まされる。
論文 参考訳(メタデータ) (2021-02-25T15:50:19Z) - A New Framework for Variance-Reduced Hamiltonian Monte Carlo [88.84622104944503]
分散還元型ハミルトン・モンテカルロ法 (HMC) の新たなフレームワークを提案し,$L$-smooth および $m$-strongly log-concave 分布からサンプリングする。
本研究では,SAGA法やSVRG法をベースとした非バイアス勾配推定器を用いて,バッチサイズを小さくすることで,高い勾配効率が得られることを示す。
総合的および実世界のベンチマークデータによる実験結果から、我々の新しいフレームワークは、完全な勾配と勾配HMCアプローチを著しく上回っていることが示された。
論文 参考訳(メタデータ) (2021-02-09T02:44:24Z) - Outlier-robust sparse/low-rank least-squares regression and robust
matrix completion [1.0878040851637998]
ヘテロジニアス雑音を伴う統計的学習フレームワークにおける高次元最小二乗回帰について検討する。
また, 製品プロセスの新たな応用に基づいて, 行列分解を伴う新しいトレーサリグレス理論を提案する。
論文 参考訳(メタデータ) (2020-12-12T07:42:47Z) - Learning to extrapolate using continued fractions: Predicting the
critical temperature of superconductor materials [5.905364646955811]
人工知能(AI)と機械学習(ML)の分野では、未知のターゲット関数 $y=f(mathbfx)$ の近似が共通の目的である。
トレーニングセットとして$S$を参照し、新しいインスタンス$mathbfx$に対して、このターゲット関数を効果的に近似できる低複雑さの数学的モデルを特定することを目的としている。
論文 参考訳(メタデータ) (2020-11-27T04:57:40Z) - How isotropic kernels perform on simple invariants [0.5729426778193397]
等方性カーネル手法のトレーニング曲線は、学習すべきタスクの対称性に依存するかを検討する。
大規模な帯域幅では、$beta = fracd-1+xi3d-3+xi$, where $xiin (0,2)$ がカーネルのストライプを原点とする指数であることを示す。
論文 参考訳(メタデータ) (2020-06-17T09:59:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。