論文の概要: EPEM: Efficient Parameter Estimation for Multiple Class Monotone Missing
Data
- arxiv url: http://arxiv.org/abs/2009.11360v1
- Date: Wed, 23 Sep 2020 20:07:53 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-15 15:34:09.491881
- Title: EPEM: Efficient Parameter Estimation for Multiple Class Monotone Missing
Data
- Title(参考訳): EPEM:マルチクラスモノトン欠落データの効率的なパラメータ推定
- Authors: Thu Nguyen, Duy H. M. Nguyen, Huy Nguyen, Binh T. Nguyen, Bruce A.
Wade
- Abstract要約: 本稿では,複数のクラス,モノトン欠落データセットの最大推定値(MLE)を計算するための新しいアルゴリズムを提案する。
計算が正確であるので、我々のEPEMアルゴリズムは、他の計算法と同様に、データを通して複数のイテレーションを必要としない。
- 参考スコア(独自算出の注目度): 3.801859210248944
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The problem of monotone missing data has been broadly studied during the last
two decades and has many applications in different fields such as
bioinformatics or statistics. Commonly used imputation techniques require
multiple iterations through the data before yielding convergence. Moreover,
those approaches may introduce extra noises and biases to the subsequent
modeling. In this work, we derive exact formulas and propose a novel algorithm
to compute the maximum likelihood estimators (MLEs) of a multiple class,
monotone missing dataset when all the covariance matrices of all categories are
assumed to be equal, namely EPEM. We then illustrate an application of our
proposed methods in Linear Discriminant Analysis (LDA). As the computation is
exact, our EPEM algorithm does not require multiple iterations through the data
as other imputation approaches, thus promising to handle much less
time-consuming than other methods. This effectiveness was validated by
empirical results when EPEM reduced the error rates significantly and required
a short computation time compared to several imputation-based approaches. We
also release all codes and data of our experiments in one GitHub repository to
contribute to the research community related to this problem.
- Abstract(参考訳): モノトーン欠落データの問題は過去20年間に広く研究され、バイオインフォマティクスや統計学といった様々な分野に応用されている。
一般的に使われる計算技法は収束をもたらす前にデータを通して複数の反復を必要とする。
さらに、これらのアプローチは、その後のモデリングに余分なノイズやバイアスをもたらす可能性がある。
本研究では,各カテゴリの共分散行列がすべて等しいと仮定された場合,複数のクラス,単調欠落データセットの最大極大推定器(MLE)を計算する新しいアルゴリズムを提案する。
次に,線形判別分析(lda)における提案手法の適用例を示す。
計算が正確であるので、epemアルゴリズムはデータを通して複数のイテレーションを必要としないので、他の方法よりもはるかに少ない時間消費を処理できる。
この効果は、EPEMが誤り率を大幅に削減し、いくつかの計算法と比較して計算時間を短縮した経験的な結果によって検証された。
また、この問題に関連する研究コミュニティに貢献するために、実験のすべてのコードとデータをGitHubリポジトリにリリースしています。
関連論文リスト
- An Efficient Algorithm for Clustered Multi-Task Compressive Sensing [60.70532293880842]
クラスタ化マルチタスク圧縮センシングは、複数の圧縮センシングタスクを解決する階層モデルである。
このモデルに対する既存の推論アルゴリズムは計算コストが高く、高次元ではうまくスケールしない。
本稿では,これらの共分散行列を明示的に計算する必要をなくし,モデル推論を大幅に高速化するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-09-30T15:57:14Z) - IRTCI: Item Response Theory for Categorical Imputation [5.9952530228468754]
欠落したデータをスタンドイン値に置き換えるために、いくつかの計算手法が設計されている。
ここで紹介された作品は、アイテム応答理論(IRT)に基づく分類論的計算の新しい手段を提供する。
これらの手法を比較した分析は、3つの異なるデータセットで行われた。
論文 参考訳(メタデータ) (2023-02-08T16:17:20Z) - Learning to Bound Counterfactual Inference in Structural Causal Models
from Observational and Randomised Data [64.96984404868411]
我々は、従来のEMベースのアルゴリズムを拡張するための全体的なデータの特徴付けを導出する。
新しいアルゴリズムは、そのような混合データソースからモデルパラメータの(不特定性)領域を近似することを学ぶ。
反実的な結果に間隔近似を与え、それが特定可能な場合の点に崩壊する。
論文 参考訳(メタデータ) (2022-12-06T12:42:11Z) - Active Learning with Expected Error Reduction [4.506537904404427]
期待される誤り低減(EER)は,能動的学習に有効な方法であることが示されている。
EERは、モデルを候補サンプル毎に再トレーニングする必要がある。
本稿ではベイジアンアクティブラーニングのレンズの下でEERを再構成する。
論文 参考訳(メタデータ) (2022-11-17T01:02:12Z) - An Application of a Multivariate Estimation of Distribution Algorithm to
Cancer Chemotherapy [59.40521061783166]
癌に対する化学療法治療は、多数の相互作用する変数と制約を持つ複雑な最適化問題である。
より洗練されたアルゴリズムは、このような複雑な問題に対してより良いパフォーマンスをもたらすことが示される。
我々は、この問題における多数の相互作用によって、より洗練されたアルゴリズムが妨げられていることが原因であると仮定する。
論文 参考訳(メタデータ) (2022-05-17T15:28:46Z) - Information-Theoretic Generalization Bounds for Iterative
Semi-Supervised Learning [81.1071978288003]
特に,情報理論の原理を用いて,反復型SSLアルゴリズムのエミュレータ一般化誤差の振る舞いを理解することを目的とする。
我々の理論的結果は、クラス条件分散があまり大きくない場合、一般化誤差の上限は反復数とともに単調に減少するが、すぐに飽和することを示している。
論文 参考訳(メタデータ) (2021-10-03T05:38:49Z) - Memory-Based Optimization Methods for Model-Agnostic Meta-Learning and
Personalized Federated Learning [56.17603785248675]
モデルに依存しないメタラーニング (MAML) が人気のある研究分野となっている。
既存のMAMLアルゴリズムは、イテレーション毎にメタモデルを更新するためにいくつかのタスクとデータポイントをサンプリングすることで、エピソードのアイデアに依存している。
本稿では,MAMLのメモリベースアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-06-09T08:47:58Z) - DPER: Efficient Parameter Estimation for Randomly Missing Data [0.24466725954625884]
本稿では,1クラス・複数クラスのランダムに欠落したデータセットに対して,最大推定値(MLE)を求めるアルゴリズムを提案する。
我々のアルゴリズムは、データを通して複数のイテレーションを必要としないので、他の方法よりも時間のかかることを約束します。
論文 参考訳(メタデータ) (2021-06-06T16:37:48Z) - A Method for Handling Multi-class Imbalanced Data by Geometry based
Information Sampling and Class Prioritized Synthetic Data Generation (GICaPS) [15.433936272310952]
本稿では,多ラベル分類問題における不均衡データ処理の問題について考察する。
特徴ベクトル間の幾何学的関係を利用する2つの新しい手法が提案されている。
提案手法の有効性は,汎用的なマルチクラス認識問題を解くことによって解析する。
論文 参考訳(メタデータ) (2020-10-11T04:04:26Z) - A Robust Functional EM Algorithm for Incomplete Panel Count Data [66.07942227228014]
完全無作為な仮定(MCAR)の下での数え上げ過程の平均関数を推定する機能的EMアルゴリズムを提案する。
提案アルゴリズムは、いくつかの一般的なパネル数推定手法をラップし、不完全数にシームレスに対処し、ポアソン過程の仮定の誤特定に頑健である。
本稿では, 数値実験による提案アルゴリズムの有用性と喫煙停止データの解析について述べる。
論文 参考訳(メタデータ) (2020-03-02T20:04:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。