論文の概要: Machine Learning Panel Data Regressions with Heavy-tailed Dependent
Data: Theory and Application
- arxiv url: http://arxiv.org/abs/2008.03600v2
- Date: Mon, 22 Nov 2021 15:35:00 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-01 12:21:34.236127
- Title: Machine Learning Panel Data Regressions with Heavy-tailed Dependent
Data: Theory and Application
- Title(参考訳): 重み付き依存データを用いた機械学習パネルデータ回帰:理論と応用
- Authors: Andrii Babii and Ryan T. Ball and Eric Ghysels and Jonas Striaukas
- Abstract要約: 本稿では、重み付き依存パネルデータに対して、異なる周波数でサンプリング可能な構造化機械学習レグレッションを提案する。
我々は, 疎水層群 LASSO パネルデータ推定装置において, 財務・経済データに脂肪尾が存在することを認識したオラクルの不等式を求める。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The paper introduces structured machine learning regressions for heavy-tailed
dependent panel data potentially sampled at different frequencies. We focus on
the sparse-group LASSO regularization. This type of regularization can take
advantage of the mixed frequency time series panel data structures and improve
the quality of the estimates. We obtain oracle inequalities for the pooled and
fixed effects sparse-group LASSO panel data estimators recognizing that
financial and economic data can have fat tails. To that end, we leverage on a
new Fuk-Nagaev concentration inequality for panel data consisting of
heavy-tailed $\tau$-mixing processes.
- Abstract(参考訳): 本稿では、異なる周波数でサンプリング可能な重み付き依存パネルデータに対する構造化機械学習回帰を提案する。
スパースグループLASSO正則化に着目した。
このタイプの正規化は、混合周波数時系列パネルデータ構造を利用し、見積もりの品質を向上させることができる。
我々は, 疎水層群 LASSO パネルデータ推定器を用いて, 財務・経済データに脂肪尾が存在することを認識する。
そこで我々は,ヘビーテールの$\tau$-mixingプロセスからなるパネルデータに対して,新たなfuk-nagaev濃度不等式を利用する。
関連論文リスト
- Distributionally robust self-supervised learning for tabular data [2.942619386779508]
エラースライスの存在下での堅牢な表現の学習は、高い濃度特徴とエラーセットの構築の複雑さのために困難である。
従来の堅牢な表現学習手法は、コンピュータビジョンにおける教師付き設定における最悪のグループパフォーマンスの改善に主に焦点をあてている。
提案手法は,Masked Language Modeling (MLM) の損失を学習したエンコーダ・デコーダモデルを用いて,頑健な潜在表現を学習する。
論文 参考訳(メタデータ) (2024-10-11T04:23:56Z) - The Data Addition Dilemma [4.869513274920574]
医療タスクのための多くの機械学習では、標準データセットは、多くの、基本的に異なるソースにまたがるデータを集約することによって構築される。
しかし、いつより多くのデータを追加することが助けになるのか、いつ、実際の設定で望ましいモデル結果の進行を妨げるのか?
この状況をtextitData Addition Dilemma と認識し、このマルチソーススケーリングコンテキストにトレーニングデータを追加すると、全体的な精度が低下し、不確実なフェアネスの結果が減少し、最悪のサブグループのパフォーマンスが低下することを示した。
論文 参考訳(メタデータ) (2024-08-08T01:42:31Z) - Panel Data Nowcasting: The Case of Price-Earnings Ratios [0.0]
本論文は、異なる周波数でサンプリングされたシリーズからなるパネルデータを用いて、構造化された機械学習レグレッションを用いて、ストリームキャストを行う。
大企業の企業業績予測の問題から、スパースグループのLASSOレギュラー化に焦点をあてる。
論文 参考訳(メタデータ) (2023-07-05T22:04:46Z) - Temperature Schedules for Self-Supervised Contrastive Methods on
Long-Tail Data [87.77128754860983]
本稿では,ロングテールデータ上での自己教師付き学習(SSL)の行動分析を行う。
大きな$tau$はグループ的な差別を強調するのに対し、小さな$tau$はより高いインスタンスの差別をもたらす。
動的$tau$を用いて、簡単なコサインスケジュールが学習表現に大きな改善をもたらすことを示す。
論文 参考訳(メタデータ) (2023-03-23T20:37:25Z) - Chasing Fairness Under Distribution Shift: A Model Weight Perturbation
Approach [72.19525160912943]
まず,分布シフト,データ摂動,モデルウェイト摂動の関連性を理論的に検証した。
次に、ターゲットデータセットの公平性を保証するのに十分な条件を分析します。
これらの十分な条件により、ロバストフェアネス正則化(RFR)を提案する。
論文 参考訳(メタデータ) (2023-03-06T17:19:23Z) - Grouped self-attention mechanism for a memory-efficient Transformer [64.0125322353281]
天気予報、電力消費、株式市場などの現実世界のタスクには、時間とともに変化するデータの予測が含まれる。
時系列データは通常、その周期的特性と時間的長期依存性のために、長いシーケンスで長い観察期間にわたって記録される。
我々はGSA(Grouped Self-Attention)とCCA(Compressed Cross-Attention)の2つの新しいモジュールを提案する。
提案モデルでは,既存の手法に匹敵する計算量と性能の低減が効果的に示された。
論文 参考訳(メタデータ) (2022-10-02T06:58:49Z) - Class Balancing GAN with a Classifier in the Loop [58.29090045399214]
本稿では,GANを学習するための理論的動機付けクラスバランス正則化器を提案する。
我々の正規化器は、訓練済みの分類器からの知識を利用して、データセット内のすべてのクラスのバランスの取れた学習を確実にします。
複数のデータセットにまたがる既存手法よりも優れた性能を達成し,長期分布の学習表現における正規化器の有用性を実証する。
論文 参考訳(メタデータ) (2021-06-17T11:41:30Z) - Examining and Combating Spurious Features under Distribution Shift [94.31956965507085]
我々は、最小限の統計量という情報理論の概念を用いて、ロバストで刺激的な表現を定義し、分析する。
入力分布のバイアスしか持たない場合でも、モデルはトレーニングデータから急激な特徴を拾い上げることができることを証明しています。
分析から着想を得た結果,グループDROは,グループ同士の相関関係を直接考慮しない場合に失敗する可能性が示唆された。
論文 参考訳(メタデータ) (2021-06-14T05:39:09Z) - Time-Series Imputation with Wasserstein Interpolation for Optimal
Look-Ahead-Bias and Variance Tradeoff [66.59869239999459]
ファイナンスでは、ポートフォリオ最適化モデルをトレーニングする前に、損失の計算を適用することができる。
インキュベーションのために全データセットを使用するルックアヘッドバイアスと、トレーニングデータのみを使用することによるインキュベーションの大きなばらつきとの間には、本質的にトレードオフがある。
提案手法は,提案法における差分とルックアヘッドバイアスのトレードオフを最適に制御するベイズ後部コンセンサス分布である。
論文 参考訳(メタデータ) (2021-02-25T09:05:35Z) - Fairness in Forecasting and Learning Linear Dynamical Systems [10.762748665074794]
時系列予測問題において、そのような表現不足に対処するために、サブグループフェアネスと即時フェアネスという2つの自然な概念を導入する。
特に,長さの異なる複数の軌跡から線形力学系のサブグループフェアおよびインスタントフェア学習を考える。
論文 参考訳(メタデータ) (2020-06-12T16:53:27Z) - Machine Learning Time Series Regressions with an Application to
Nowcasting [0.0]
本稿では、異なる周波数でサンプリング可能な高次元時系列データに対して、構造化された機械学習レグレッションを提案する。
スパース群LASSO推定器は、このような時系列データ構造を活用でき、非構造LASSOより優れる。
論文 参考訳(メタデータ) (2020-05-28T14:42:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。