論文の概要: IRTCI: Item Response Theory for Categorical Imputation
- arxiv url: http://arxiv.org/abs/2302.04165v1
- Date: Wed, 8 Feb 2023 16:17:20 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-09 15:33:28.723108
- Title: IRTCI: Item Response Theory for Categorical Imputation
- Title(参考訳): IRTCI:カテゴリー計算における項目応答理論
- Authors: Adrienne Kline and Yuan Luo
- Abstract要約: 欠落したデータをスタンドイン値に置き換えるために、いくつかの計算手法が設計されている。
ここで紹介された作品は、アイテム応答理論(IRT)に基づく分類論的計算の新しい手段を提供する。
これらの手法を比較した分析は、3つの異なるデータセットで行われた。
- 参考スコア(独自算出の注目度): 5.9952530228468754
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Most datasets suffer from partial or complete missing values, which has
downstream limitations on the available models on which to test the data and on
any statistical inferences that can be made from the data. Several imputation
techniques have been designed to replace missing data with stand in values. The
various approaches have implications for calculating clinical scores, model
building and model testing. The work showcased here offers a novel means for
categorical imputation based on item response theory (IRT) and compares it
against several methodologies currently used in the machine learning field
including k-nearest neighbors (kNN), multiple imputed chained equations (MICE)
and Amazon Web Services (AWS) deep learning method, Datawig. Analyses comparing
these techniques were performed on three different datasets that represented
ordinal, nominal and binary categories. The data were modified so that they
also varied on both the proportion of data missing and the systematization of
the missing data. Two different assessments of performance were conducted:
accuracy in reproducing the missing values, and predictive performance using
the imputed data. Results demonstrated that the new method, Item Response
Theory for Categorical Imputation (IRTCI), fared quite well compared to
currently used methods, outperforming several of them in many conditions. Given
the theoretical basis for the new approach, and the unique generation of
probabilistic terms for determining category belonging for missing cells, IRTCI
offers a viable alternative to current approaches.
- Abstract(参考訳): ほとんどのデータセットは部分的あるいは完全的欠落値に苦しんでおり、データをテストするための利用可能なモデルや、データから作成可能な任意の統計推論に限界がある。
欠落したデータをスタンドインの値に置き換えるために、いくつかのインプテーション技術が設計されている。
様々なアプローチは、臨床スコア、モデル構築、モデルテストの計算に影響を及ぼす。
ここで紹介された研究は、アイテム応答理論(IRT)に基づいた分類論的計算の新しい手段を提供し、k-nearest neighbors(kNN)、MICE(Multiple Imputed chained equation)、Amazon Web Services(AWS)ディープラーニングメソッドDatawigなどの機械学習分野で現在使用されている方法論と比較する。
これらの手法を比較する分析は、順序、名目、二項のカテゴリを表す3つの異なるデータセット上で行われた。
データは、データの欠落率と欠落データの体系化の両方で変化するように修正された。
性能評価には, 欠落値の再現精度, インデュートデータを用いた予測性能の2つの異なる評価結果が得られた。
その結果,新しい手法であるIRTCI(Item Response Theory for Categorical Imputation)が,現在使用されている手法と比較して非常に優れており,多くの条件においてそのいくつかを上回る結果が得られた。
新たなアプローチの理論的基礎と、欠損細胞に属するカテゴリを決定するための一意の確率的項を考えると、IRTCIは現在のアプローチの代替となる。
関連論文リスト
- On the Performance of Imputation Techniques for Missing Values on Healthcare Datasets [0.0]
値やデータの欠落は、実世界のデータセット、特に医療データの一般的な特徴のひとつだ。
本研究は, 平均計算法, 中間計算法, 最終観測法 (LOCF) 計算法, K-Nearest Neighbor (KNN) 計算法, 補間計算法, ミスフォレスト計算法, 連鎖方程式による多重計算法の比較である。
その結果,ミスフォレスト・インキュベーションが最善であり,MICEインキュベーションが最善であることがわかった。
論文 参考訳(メタデータ) (2024-03-13T18:07:17Z) - Measuring and Improving Attentiveness to Partial Inputs with Counterfactuals [91.59906995214209]
我々は,新しい評価手法であるCAT(Facterfactual Attentiveness Test)を提案する。
CATは、入力の一部を別の例から別の例に置き換えることで、予測を変更する注意深いモデルを期待することで、反事実を使用する。
実験データの精度が向上する一方, GPT3 は実演回数の増加により注意力の低下がみられた。
論文 参考訳(メタデータ) (2023-11-16T06:27:35Z) - Evaluating Graph Neural Networks for Link Prediction: Current Pitfalls
and New Benchmarking [66.83273589348758]
リンク予測は、グラフのエッジの一部のみに基づいて、目に見えないエッジが存在するかどうかを予測しようとする。
近年,この課題にグラフニューラルネットワーク(GNN)を活用すべく,一連の手法が導入されている。
これらの新しいモデルの有効性をよりよく評価するために、新しい多様なデータセットも作成されている。
論文 参考訳(メタデータ) (2023-06-18T01:58:59Z) - Machine Learning Based Missing Values Imputation in Categorical Datasets [2.5611256859404983]
この研究では、分類データセットのギャップを埋めるための機械学習アルゴリズムの使用について検討した。
Error Correction Output Codesフレームワークを使用して構築されたアンサンブルモデルに重点が置かれた。
大量のラベル付きデータの要求を含む、これらの奨励的な結果にもかかわらず、データ計算の欠如に対する深い学習には障害がある。
論文 参考訳(メタデータ) (2023-06-10T03:29:48Z) - Diffusion models for missing value imputation in tabular data [10.599563005836066]
機械学習における値計算の欠落は、利用可能な情報を用いてデータセットの欠落値を正確に推定するタスクである。
本稿では,タブラルデータに対する連続スコアベース拡散モデル (CSDI_T) と呼ばれる拡散モデル手法を提案する。
分類変数と数値変数を同時に処理するために, ワンホット符号化, アナログビット符号化, 特徴トークン化という3つの手法を検討した。
論文 参考訳(メタデータ) (2022-10-31T08:13:26Z) - MACE: An Efficient Model-Agnostic Framework for Counterfactual
Explanation [132.77005365032468]
MACE(Model-Agnostic Counterfactual Explanation)の新たな枠組みを提案する。
MACE法では, 優れた反実例を見つけるための新しいRL法と, 近接性向上のための勾配のない降下法を提案する。
公開データセットの実験は、有効性、空間性、近接性を向上して検証する。
論文 参考訳(メタデータ) (2022-05-31T04:57:06Z) - RIFLE: Imputation and Robust Inference from Low Order Marginals [10.082738539201804]
我々は,不備なデータの存在下での回帰と分類のための統計的推論フレームワークを開発する。
我々のフレームワークであるRIFLEは、基礎となるデータ分布の低次モーメントを対応する信頼区間で推定し、分布的に堅牢なモデルを学ぶ。
実験の結果,RIFLEは,欠落値の割合が高い場合や,データポイント数が比較的小さい場合には,他のベンチマークアルゴリズムよりも優れていることがわかった。
論文 参考訳(メタデータ) (2021-09-01T23:17:30Z) - Doing Great at Estimating CATE? On the Neglected Assumptions in
Benchmark Comparisons of Treatment Effect Estimators [91.3755431537592]
もっとも単純な設定であっても、無知性仮定に基づく推定は誤解を招く可能性があることを示す。
異種処理効果評価のための機械学習ベンチマークデータセットを2つ検討した。
ベンチマークデータセットの固有の特性が、他のものよりもいくつかのアルゴリズムを好んでいる点を強調します。
論文 参考訳(メタデータ) (2021-07-28T13:21:27Z) - Few-Shot Named Entity Recognition: A Comprehensive Study [92.40991050806544]
マルチショット設定のモデル一般化能力を向上させるための3つの手法を検討する。
ラベル付きデータの比率の異なる10の公開nerデータセットについて経験的比較を行う。
マルチショットとトレーニングフリーの両方の設定で最新の結果を作成します。
論文 参考訳(メタデータ) (2020-12-29T23:43:16Z) - Machine learning with incomplete datasets using multi-objective
optimization models [1.933681537640272]
分類モデルが学習されている間、欠落した値を扱うオンラインアプローチを提案する。
命令とモデル選択のための2つの目的関数を持つ多目的最適化モデルを開発する。
NSGA IIに基づく進化的アルゴリズムを用いて最適解を求める。
論文 参考訳(メタデータ) (2020-12-04T03:44:33Z) - Meta-Learned Confidence for Few-shot Learning [60.6086305523402]
数ショットのメトリックベースのアプローチのための一般的なトランスダクティブ推論手法は、最も確実なクエリ例の平均で、各クラスのプロトタイプを更新することである。
本稿では,各クエリの信頼度をメタラーニングして,ラベルのないクエリに最適な重みを割り当てる手法を提案する。
4つのベンチマークデータセットに対してメタ学習の信頼度で、少数ショットの学習モデルを検証した。
論文 参考訳(メタデータ) (2020-02-27T10:22:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。