論文の概要: RIGID: Robust Linear Regression with Missing Data
- arxiv url: http://arxiv.org/abs/2205.13635v1
- Date: Thu, 26 May 2022 21:10:17 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-30 15:19:38.210244
- Title: RIGID: Robust Linear Regression with Missing Data
- Title(参考訳): RIGID: 欠測データ付きロバスト線形回帰
- Authors: Alireza Aghasi, MohammadJavad Feizollahi, Saeed Ghadimi
- Abstract要約: 機能に欠落したエントリで線形回帰を行うための堅牢なフレームワークを提案する。
本稿では,変数間の依存性を自然に考慮した定式化が,凸プログラムに還元されることを示す。
詳細な分析に加えて,提案するフレームワークの挙動を分析し,技術的議論を行う。
- 参考スコア(独自算出の注目度): 7.638042073679073
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a robust framework to perform linear regression with missing
entries in the features. By considering an elliptical data distribution, and
specifically a multivariate normal model, we are able to conditionally
formulate a distribution for the missing entries and present a robust
framework, which minimizes the worst case error caused by the uncertainty about
the missing data. We show that the proposed formulation, which naturally takes
into account the dependency between different variables, ultimately reduces to
a convex program, for which a customized and scalable solver can be delivered.
In addition to a detailed analysis to deliver such solver, we also asymptoticly
analyze the behavior of the proposed framework, and present technical
discussions to estimate the required input parameters. We complement our
analysis with experiments performed on synthetic, semi-synthetic, and real
data, and show how the proposed formulation improves the prediction accuracy
and robustness, and outperforms the competing techniques.
- Abstract(参考訳): 機能に欠落したエントリで線形回帰を行うための堅牢なフレームワークを提案する。
楕円データ分布、特に多変量正規モデルを考えることで、欠落したエントリの分布を条件付きで定式化し、欠落したデータに対する不確実性に起因する最悪のケースエラーを最小限に抑えるロバストなフレームワークを提供することができる。
本稿では,変数間の依存性を自然に考慮して提案した定式化が,最終的に凸プログラムに還元され,カスタマイズされたスケーラブルな解法が実現可能であることを示す。
このような解法を提供するための詳細な分析に加えて,提案フレームワークの挙動を漸近的に解析し,必要な入力パラメータを推定するための技術的議論を行う。
本研究では, 合成, 半合成, 実データを用いて行った実験を補完し, 予測精度とロバスト性を向上し, 競合技術より優れていることを示す。
関連論文リスト
- Probabilistic Iterative Hard Thresholding for Sparse Learning [2.5782973781085383]
本稿では,基本性制約を用いた予測目標最適化問題の解法を提案する。
基礎となるプロセスの収束を証明し、2つの機械学習問題における性能を実証する。
論文 参考訳(メタデータ) (2024-09-02T18:14:45Z) - Unveiling the Statistical Foundations of Chain-of-Thought Prompting Methods [59.779795063072655]
CoT(Chain-of-Thought)の促進とその変種は、多段階推論問題を解決する効果的な方法として人気を集めている。
統計的推定の観点からCoTのプロンプトを解析し,その複雑さを包括的に評価する。
論文 参考訳(メタデータ) (2024-08-25T04:07:18Z) - An Inexact Halpern Iteration with Application to Distributionally Robust
Optimization [9.529117276663431]
決定論的および決定論的収束設定におけるスキームの不正確な変種について検討する。
不正確なスキームを適切に選択することにより、(予想される)剰余ノルムの点において$O(k-1)収束率を許容することを示す。
論文 参考訳(メタデータ) (2024-02-08T20:12:47Z) - Robust Regression over Averaged Uncertainty [7.4489490661717355]
この定式化は隆起回帰を正確に回復し、既存の回帰問題に対するロバスト最適化と平均二乗誤差アプローチの欠落するリンクを確立する。
正確な閉形式、場合によっては $ell_p$ norm, Schatten $p$-norm, and general polytopes によって誘導される不確実集合の下での同値な正則化強度に対する解析的解を提供する。
論文 参考訳(メタデータ) (2023-11-12T20:57:30Z) - Data-Driven Sample Average Approximation with Covariate Information [0.0]
我々は、コパラメトリックの同時観測とともに、最適化モデル内の不確実なパラメータの観測を行う際に、データ駆動意思決定のための最適化について検討する。
本稿では,機械学習予測モデルをプログラムサンプル平均近似(SAA)に組み込んだ3つのデータ駆動フレームワークについて検討する。
論文 参考訳(メタデータ) (2022-07-27T14:45:04Z) - Extension of Dynamic Mode Decomposition for dynamic systems with
incomplete information based on t-model of optimal prediction [69.81996031777717]
動的モード分解は、動的データを研究するための非常に効率的な手法であることが証明された。
このアプローチの適用は、利用可能なデータが不完全である場合に問題となる。
本稿では,森-Zwanzig分解の1次近似を考察し,対応する最適化問題を記述し,勾配に基づく最適化法を用いて解く。
論文 参考訳(メタデータ) (2022-02-23T11:23:59Z) - Heavy-tailed Streaming Statistical Estimation [58.70341336199497]
ストリーミング$p$のサンプルから重み付き統計推定の課題を考察する。
そこで我々は,傾きの雑音に対して,よりニュアンスな条件下での傾きの傾きの低下を設計し,より詳細な解析を行う。
論文 参考訳(メタデータ) (2021-08-25T21:30:27Z) - Robust Bayesian Inference for Discrete Outcomes with the Total Variation
Distance [5.139874302398955]
離散的に評価された結果のモデルは、データがゼロインフレーション、過分散または汚染を示す場合、容易に誤特定される。
ここでは、Ttal Variation Distance (TVD) を用いた頑健な相違に基づくベイズ的アプローチを提案する。
我々は、我々のアプローチが堅牢で、シミュレーションおよび実世界のデータの範囲で予測性能を著しく改善していることを実証的に実証した。
論文 参考訳(メタデータ) (2020-10-26T09:53:06Z) - Accounting for Unobserved Confounding in Domain Generalization [107.0464488046289]
本稿では,データセットの組み合わせから頑健で一般化可能な予測モデルを学習する際の問題点について検討する。
堅牢なモデルを学ぶことの課題の一部は、保存されていない共同設立者の影響にある。
異なるモダリティの医療データに対するアプローチの実証的性能を実証する。
論文 参考訳(メタデータ) (2020-07-21T08:18:06Z) - Good Classifiers are Abundant in the Interpolating Regime [64.72044662855612]
補間分類器間のテストエラーの完全な分布を正確に計算する手法を開発した。
テストエラーは、最悪の補間モデルのテストエラーから大きく逸脱する、小さな典型的な$varepsilon*$に集中する傾向にある。
以上の結果から,統計的学習理論における通常の解析手法は,実際に観測された優れた一般化性能を捉えるのに十分な粒度にはならない可能性が示唆された。
論文 参考訳(メタデータ) (2020-06-22T21:12:31Z) - Asymptotic Analysis of an Ensemble of Randomly Projected Linear
Discriminants [94.46276668068327]
[1]では、ランダムに投影された線形判別式のアンサンブルを用いてデータセットを分類する。
我々は,計算コストのかかるクロスバリデーション推定器の代替として,誤分類確率の一貫した推定器を開発する。
また、実データと合成データの両方で投影次元を調整するための推定器の使用を実証する。
論文 参考訳(メタデータ) (2020-04-17T12:47:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。