論文の概要: Data Augmentation for Imbalanced Regression
- arxiv url: http://arxiv.org/abs/2302.09288v1
- Date: Sat, 18 Feb 2023 11:23:34 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-21 19:21:13.395168
- Title: Data Augmentation for Imbalanced Regression
- Title(参考訳): 不均衡回帰のためのデータ拡張
- Authors: Samuel Stocksieker and Denys Pommeret and Arthur Charpentier
- Abstract要約: 本稿では、重み付け再サンプリング(WR)とデータ拡張(DA)処理を組み合わせたデータ拡張アルゴリズムを提案する。
本稿では,このアプローチの利点を示す数値的研究を通じて,DA手法の選択について論じる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this work, we consider the problem of imbalanced data in a regression
framework when the imbalanced phenomenon concerns continuous or discrete
covariates. Such a situation can lead to biases in the estimates. In this case,
we propose a data augmentation algorithm that combines a weighted resampling
(WR) and a data augmentation (DA) procedure. In a first step, the DA procedure
permits exploring a wider support than the initial one. In a second step, the
WR method drives the exogenous distribution to a target one. We discuss the
choice of the DA procedure through a numerical study that illustrates the
advantages of this approach. Finally, an actuarial application is studied.
- Abstract(参考訳): 本研究では,不均衡現象が連続的あるいは離散的共変量に関する場合の回帰フレームワークにおける不均衡データの問題を考える。
このような状況は見積もりのバイアスにつながる可能性がある。
本稿では、重み付き再サンプリング(WR)とデータ拡張(DA)処理を組み合わせたデータ拡張アルゴリズムを提案する。
最初のステップでは、DAプロシージャは、最初のステップよりも広いサポートを探索することができる。
第2のステップでは、wr法は、ターゲットに外因性分布を駆動する。
本稿では,このアプローチの利点を示す数値的研究を通じて,DA手法の選択について論じる。
最後に、アクチュエータ応用について研究する。
関連論文リスト
- Distributed High-Dimensional Quantile Regression: Estimation Efficiency and Support Recovery [0.0]
我々は高次元線形量子レグレッションのための分散推定とサポート回復に焦点をあてる。
元の量子レグレッションを最小二乗最適化に変換する。
効率的なアルゴリズムを開発し、高い計算と通信効率を享受する。
論文 参考訳(メタデータ) (2024-05-13T08:32:22Z) - Anchor Data Augmentation [53.39044919864444]
非線形過パラメータ回帰におけるデータ拡張のための新しいアルゴリズムを提案する。
我々のデータ拡張アルゴリズムは、因果関係に関する文献から借用し、最近提案されたデータ拡張のためのアンカー回帰(AR)法を拡張した。
論文 参考訳(メタデータ) (2023-11-12T21:08:43Z) - Refining Amortized Posterior Approximations using Gradient-Based Summary
Statistics [0.9176056742068814]
逆問題の文脈における後部分布の補正近似を改善するための反復的枠組みを提案する。
そこで我々は,本手法をスタイリング問題に適用して制御条件で検証し,改良された後部近似を各繰り返しで観察する。
論文 参考訳(メタデータ) (2023-05-15T15:47:19Z) - The Power and Limitation of Pretraining-Finetuning for Linear Regression
under Covariate Shift [127.21287240963859]
本研究では,対象データに基づく事前学習と微調整を併用した伝達学習手法について検討する。
大規模な線形回帰インスタンスの場合、$O(N2)$ソースデータによる転送学習は、$N$ターゲットデータによる教師あり学習と同じくらい効果的である。
論文 参考訳(メタデータ) (2022-08-03T05:59:49Z) - Equivariance Discovery by Learned Parameter-Sharing [153.41877129746223]
データから解釈可能な等価性を発見する方法について検討する。
具体的には、モデルのパラメータ共有方式に対する最適化問題として、この発見プロセスを定式化する。
また,ガウスデータの手法を理論的に解析し,研究された発見スキームとオラクルスキームの間の平均2乗ギャップを限定する。
論文 参考訳(メタデータ) (2022-04-07T17:59:19Z) - Dimensionality Reduction and Wasserstein Stability for Kernel Regression [1.3812010983144802]
まず,入力変数の次元を小さくし,第2に削減された入力変数を用いて,カーネル回帰による出力変数の予測を行う。
結果の回帰誤差を分析するために、ワッサーシュタイン距離に対するカーネル回帰の新しい安定性結果が導出される。
論文 参考訳(メタデータ) (2022-03-17T14:26:28Z) - Decoupling Shrinkage and Selection for the Bayesian Quantile Regression [0.0]
本稿では,ベイジアン量子回帰(BQR)に対する連続前処理における縮小と疎結合の概念を拡張した。
第1段階では、連続した先行状態の状態での量子的回帰を縮小し、第2段階では適応ラッソの効率的な変種によって後方を分散させる。
我々の手続きは、変数がマクロ経済に下方リスクをもたらす政策立案者とのコミュニケーションに利用できる。
論文 参考訳(メタデータ) (2021-07-18T17:22:33Z) - On the Convergence of Stochastic Extragradient for Bilinear Games with
Restarted Iteration Averaging [96.13485146617322]
本稿では, ステップサイズが一定であるSEG法の解析を行い, 良好な収束をもたらす手法のバリエーションを示す。
平均化で拡張した場合、SEGはナッシュ平衡に確実に収束し、スケジュールされた再起動手順を組み込むことで、その速度が確実に加速されることを証明した。
論文 参考訳(メタデータ) (2021-06-30T17:51:36Z) - SLOE: A Faster Method for Statistical Inference in High-Dimensional
Logistic Regression [68.66245730450915]
実用データセットに対する予測の偏見を回避し、頻繁な不確実性を推定する改善された手法を開発している。
私たちの主な貢献は、推定と推論の計算時間をマグニチュードの順序で短縮する収束保証付き信号強度の推定器SLOEです。
論文 参考訳(メタデータ) (2021-03-23T17:48:56Z) - Benign Overfitting of Constant-Stepsize SGD for Linear Regression [122.70478935214128]
帰納バイアスは 経験的に過剰フィットを防げる中心的存在です
この研究は、この問題を最も基本的な設定として考慮している: 線形回帰に対する定数ステップサイズ SGD。
我々は、(正規化されていない)SGDで得られるアルゴリズム正則化と、通常の最小二乗よりも多くの顕著な違いを反映する。
論文 参考訳(メタデータ) (2021-03-23T17:15:53Z) - Online Robust and Adaptive Learning from Data Streams [22.319483572757097]
オンライン学習では、アウトレーヤにしっかりと学習し、基盤となるデータ生成メカニズムの変化に迅速に適応する必要がある。
本稿では,従来のオンライン学習アルゴリズムの属性をロバスト性,後者を適応性と呼ぶ。
本稿では,このトレードオフを評価するために,近似に基づくロバスト性適応アルゴリズム(SRA)を提案する。
論文 参考訳(メタデータ) (2020-07-23T17:49:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。