Fugu-MT 論文翻訳(概要): Robust Variable Selection for High-dimensional Regression with Missing Data and Measurement Errors

論文の概要: Robust Variable Selection for High-dimensional Regression with Missing Data and Measurement Errors

arxiv url: http://arxiv.org/abs/2410.16722v1
Date: Tue, 22 Oct 2024 06:07:01 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:38.903552
Title: Robust Variable Selection for High-dimensional Regression with Missing Data and Measurement Errors
Title（参考訳）: 欠測データと測定誤差を有する高次元回帰に対するロバスト可変選択
Authors: Zhenhao Zhang, Yunquan Song,
Abstract要約: そこで本研究では、ミスや測定誤差データに適用するために、チューニングパラメータを持つ指数損失関数を提案する。逆確率重み付けと加算率誤差モデルを用いて、不足データや測定誤差に対処する。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: In our paper, we focus on robust variable selection for missing data and measurement error.Missing data and measurement errors can lead to confusing data distribution.We propose an exponential loss function with tuning parameter to apply to Missing and measurement errors data.By adjusting the parameter,the loss function can be better and more robust under various different data distributions.We use inverse probability weighting and additivity error models to address missing data and measurement errors. Also, we find that the Atan punishment method works better.We used Monte Carlo simulations to assess the validity of robust variable selection and validated our findings with the breast cancer dataset
Abstract（参考訳）: 本稿では,データの欠落と測定誤差に対するロバストな変数選択に着目し,データと測定誤差のミスはデータの分散を混乱させる可能性があり,パラメータの調整により,様々なデータ分布において損失関数がより良好で堅牢になり,逆確率重み付けと加算誤差モデルを用いて,データと測定誤差に対処する。また,Atan罰法が有効であることが判明した。モンテカルロシミュレーションを用いて,ロバストな変数選択の有効性を評価し,乳がんデータセットを用いて検討した。

関連論文リスト

Linear Regression under Missing or Corrupted Coordinates [58.9213131489513]
我々は,コーディネート的な予算の下で,敵によってデータの破損や消去を行う方法について検討する。不完全なデータ設定では、敵はデータセットを検査し、最大1座標あたりのサンプルの$eta$-fractionのエントリを削除することができる。破損したデータ設定では、敵は代わりに任意に値を置換し、その汚職位置は学習者にとって未知である。
論文参考訳（メタデータ） (2025-09-23T17:01:43Z)
Estimating detector error models from syndrome data [0.0]
本稿では,個別のDEMイベントの確率,およびDEMイベントの集合クラスを,複数のシンドローム抽出サイクルのデータを用いて推定する方法を示す。本稿では,個別のDEMイベントの確率,およびDEMイベントの集合クラスを,複数のシンドローム抽出サイクルのデータを用いて推定する方法を示す。
論文参考訳（メタデータ） (2025-04-20T14:56:56Z)
Beyond the Norms: Detecting Prediction Errors in Regression Models [26.178065248948773]
本稿では,回帰アルゴリズムにおける信頼できない振る舞いを検出するという課題に取り組む。回帰器の出力が特定の不一致(または誤り)を超えた場合、回帰における不確実性の概念を導入する。複数の回帰タスクに対する誤り検出の実証的改善を示す。
論文参考訳（メタデータ） (2024-06-11T05:51:44Z)
Uncertainty Quantification Metrics for Deep Regression [1.1999555634662633]
スカラー化誤差, 誤差, スピアマンランク相関, 負対数類似度について検討した。これらの指標が4つの典型的な不確実性の下でどのように振る舞うかを考察する。以上の結果から,Errorは最も安定かつ解釈可能な指標であるが,AUSEとNLLにもそれぞれのユースケースが存在することが示唆された。
論文参考訳（メタデータ） (2024-05-07T12:46:45Z)
Detecting Errors in a Numerical Response via any Regression Model [21.651775224356214]
ノイズは多くの数値データセットを悩ませ、データ中の記録された値が真の基礎となる値と一致しない可能性がある。真の誤りと自然データゆらぎを区別する妥当性スコアを導入する。また,実世界の数値誤差を伴う5つの回帰データセットを含む新しいエラー検出ベンチマークも提案する。
論文参考訳（メタデータ） (2023-05-26T02:15:26Z)
On Calibrating Diffusion Probabilistic Models [78.75538484265292]
拡散確率モデル(DPM)は様々な生成タスクにおいて有望な結果を得た。そこで本研究では,任意の事前学習DPMを校正する簡単な方法を提案する。キャリブレーション法は1回だけ行い, 得られたモデルをサンプリングに繰り返し使用することができる。
論文参考訳（メタデータ） (2023-02-21T14:14:40Z)
Information FOMO: The unhealthy fear of missing out on information. A method for removing misleading data for healthier models [0.0]
ミスリーディングや不要なデータは、マシンラーニング(ML)モデルの健全性や正確性に大きく影響します。本稿では,データセット内の重要な情報を特定するシーケンシャルな選択法を提案する。これらの不安定性は、基礎となるマップの複雑さの結果であり、極端な事象や重い尾と結びついている。
論文参考訳（メタデータ） (2022-08-27T19:43:53Z)
To Impute or not to Impute? -- Missing Data in Treatment Effect Estimation [84.76186111434818]
我々は,MCM(Mixed Con founded missingness)と呼ばれる新しい欠損機構を同定し,ある欠損度が治療選択を判断し,他の欠損度が治療選択によって決定されることを示した。本研究は,全てのデータを因果的に入力すると,不偏推定を行うために必要な情報を効果的に除去するので,処理効果のモデルが貧弱になることを示す。私たちのソリューションは選択的計算であり、CMMからの洞察を使って、どの変数をインプットすべきで、どの変数をインプットすべきでないかを正確に知らせる。
論文参考訳（メタデータ） (2022-02-04T12:08:31Z)
RIFLE: Imputation and Robust Inference from Low Order Marginals [10.082738539201804]
我々は,不備なデータの存在下での回帰と分類のための統計的推論フレームワークを開発する。我々のフレームワークであるRIFLEは、基礎となるデータ分布の低次モーメントを対応する信頼区間で推定し、分布的に堅牢なモデルを学ぶ。実験の結果,RIFLEは,欠落値の割合が高い場合や,データポイント数が比較的小さい場合には,他のベンチマークアルゴリズムよりも優れていることがわかった。
論文参考訳（メタデータ） (2021-09-01T23:17:30Z)
Predicting Disease Progress with Imprecise Lab Test Results [8.70310158726824]
既存のディープラーニング手法では、ほとんど全ての損失関数は、予測されたサンプルデータ値が正しい唯一のものであると仮定する。本稿では,病状進行予測のための命令範囲損失(IR損失)法を提案し,それをLong Short Term Memory(LSTM)モデルに組み込む。実データを用いた実験結果から,IR損失に基づく予測手法により,より安定かつ一貫した予測結果が得られることが示された。
論文参考訳（メタデータ） (2021-07-08T06:03:44Z)
Tail-to-Tail Non-Autoregressive Sequence Prediction for Chinese Grammatical Error Correction [49.25830718574892]
本稿では,Tail-to-Tail (textbfTtT) という新しいフレームワークを提案する。ほとんどのトークンが正しいので、ソースからターゲットに直接転送でき、エラー位置を推定して修正することができる。標準データセット、特に可変長データセットに関する実験結果は、文レベルの精度、精度、リコール、F1-Measureの観点からTtTの有効性を示す。
論文参考訳（メタデータ） (2021-06-03T05:56:57Z)
Multi-Source Causal Inference Using Control Variates [81.57072928775509]
本稿では,複数のデータソースから因果効果を推定するアルゴリズムを提案する。理論的には、これはATE推定値の分散を減少させる。このフレームワークを結果選択バイアスの下で観測データからの推論に適用する。
論文参考訳（メタデータ） (2021-03-30T21:20:51Z)
Evaluating representations by the complexity of learning low-loss predictors [55.94170724668857]
下流タスクの解決に使用されるデータの表現を評価することの問題点を考察する。本稿では,関心のあるタスクにおける低損失を実現する表現の上に,予測器を学習する複雑性によって表現の質を測定することを提案する。
論文参考訳（メタデータ） (2020-09-15T22:06:58Z)
Graph Embedding with Data Uncertainty [113.39838145450007]
スペクトルベースのサブスペース学習は、多くの機械学習パイプラインにおいて、一般的なデータ前処理ステップである。ほとんどの部分空間学習法は、不確実性の高いデータにつながる可能性のある測定の不正確さやアーティファクトを考慮していない。
論文参考訳（メタデータ） (2020-09-01T15:08:23Z)
Matrix Completion with Quantified Uncertainty through Low Rank Gaussian Copula [30.84155327760468]
本稿では,不確かさを定量化した値計算の欠如に対する枠組みを提案する。モデルに適合するために必要な時間は、データセット内の行数や列数と線形にスケールする。実験結果から,本手法は様々な種類のデータに対して最先端の計算精度が得られることがわかった。
論文参考訳（メタデータ） (2020-06-18T19:51:42Z)
Uncertainty Estimation Using a Single Deep Deterministic Neural Network [66.26231423824089]
本稿では,1回のフォワードパスで,テスト時に分布データポイントの発見と拒否が可能な決定論的ディープモデルを訓練する手法を提案する。我々は,新しい損失関数とセントロイド更新方式を用いて,これらをスケールトレーニングし,ソフトマックスモデルの精度に適合させる。
論文参考訳（メタデータ） (2020-03-04T12:27:36Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。