論文の概要: Survey on Imbalanced Data, Representation Learning and SEP Forecasting
- arxiv url: http://arxiv.org/abs/2310.07598v1
- Date: Wed, 11 Oct 2023 15:38:53 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-12 21:58:49.257320
- Title: Survey on Imbalanced Data, Representation Learning and SEP Forecasting
- Title(参考訳): 不均衡データ・表現学習・SEP予測に関する調査
- Authors: Josias Moukpe
- Abstract要約: ディープラーニング手法は、回帰、分類、予測といった様々なデータ駆動タスクを著しく進歩させてきた。
これらの進歩の多くは、トレーニングデータセットがそれらが含むターゲットに対してバランスが取れているという強い前提に基づいているが、しばしば非現実的な仮定に基づいている。
この不整合は、データが頻繁に不均衡である現実世界の状況と混同され、実用的な応用においてそのようなモデルの有効性を損なう。
我々は、実世界の不均衡をよりよく近似するために、表現学習のような戦略を用いて、バランスの取れたデータ前提から離れる深層学習の成果を提示する。
- 参考スコア(独自算出の注目度): 0.9065034043031668
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deep Learning methods have significantly advanced various data-driven tasks
such as regression, classification, and forecasting. However, much of this
progress has been predicated on the strong but often unrealistic assumption
that training datasets are balanced with respect to the targets they contain.
This misalignment with real-world conditions, where data is frequently
imbalanced, hampers the effectiveness of such models in practical applications.
Methods that reconsider that assumption and tackle real-world imbalances have
begun to emerge and explore avenues to address this challenge. One such
promising avenue is representation learning, which enables models to capture
complex data characteristics and generalize better to minority classes. By
focusing on a richer representation of the feature space, these techniques hold
the potential to mitigate the impact of data imbalance. In this survey, we
present deep learning works that step away from the balanced-data assumption,
employing strategies like representation learning to better approximate
real-world imbalances. We also highlight a critical application in SEP
forecasting where addressing data imbalance is paramount for success.
- Abstract(参考訳): ディープラーニングでは,回帰や分類,予測など,さまざまなデータ駆動タスクが大幅に進歩している。
しかしながら、この進歩の多くは、トレーニングデータセットが保持するターゲットに対してバランスが取れているという強固だが非現実的な仮定に基づいて予測されている。
データが頻繁に不均衡である現実の状況とのこの不一致は、実用的応用におけるそのようなモデルの有効性を阻害する。
仮定を再考し、現実世界の不均衡に取り組む手法が出現し始め、この課題に対処するための道を探究している。
モデルが複雑なデータ特性をキャプチャし、マイノリティクラスへの一般化を可能にする。
機能空間のより豊かな表現に焦点を当てることで、これらの技術はデータ不均衡の影響を軽減する可能性を秘めている。
本稿では,実世界の不均衡をよりよく近似するために,表現学習のような戦略を用いて,バランスの取れたデータ前提から脱却する深層学習について述べる。
また、データ不均衡に対処することが成功にとって最重要となるSEP予測における重要な応用についても強調する。
関連論文リスト
- Restoring balance: principled under/oversampling of data for optimal classification [0.0]
実世界のデータのクラス不均衡は、機械学習タスクに共通のボトルネックをもたらす。
データのアンダーやオーバーサンプリングといった緩和戦略は、定期的に提案され、実証的にテストされる。
我々は、クラス不均衡、データの第1、第2モーメント、考慮されたパフォーマンスの指標に依存するアンダー/オーバーサンプリング戦略の効果を鋭く予測する。
論文 参考訳(メタデータ) (2024-05-15T17:45:34Z) - Pessimistic Causal Reinforcement Learning with Mediators for Confounded Offline Data [17.991833729722288]
我々は新しいポリシー学習アルゴリズム PESsimistic CAusal Learning (PESCAL) を提案する。
我々のキーとなる観察は、システム力学における作用の効果を媒介する補助変数を組み込むことで、Q-関数の代わりに媒介物分布関数の下位境界を学習することは十分であるということである。
提案するアルゴリズムの理論的保証とシミュレーションによる有効性の実証、および主要な配車プラットフォームからのオフラインデータセットを利用した実世界の実験を提供する。
論文 参考訳(メタデータ) (2024-03-18T14:51:19Z) - Is augmentation effective to improve prediction in imbalanced text
datasets? [3.1690891866882236]
データ拡張なしでカットオフを調整することは、オーバーサンプリング手法と同じような結果をもたらすと我々は主張する。
この結果は、不均衡なデータを扱うための様々なアプローチの長所と短所の理解に寄与する。
論文 参考訳(メタデータ) (2023-04-20T13:07:31Z) - CMW-Net: Learning a Class-Aware Sample Weighting Mapping for Robust Deep
Learning [55.733193075728096]
現代のディープニューラルネットワークは、破損したラベルやクラス不均衡を含むバイアス付きトレーニングデータに容易に適合する。
サンプル再重み付け手法は、このデータバイアス問題を緩和するために一般的に使用されている。
本稿では,データから直接明示的な重み付け方式を適応的に学習できるメタモデルを提案する。
論文 参考訳(メタデータ) (2022-02-11T13:49:51Z) - Self-Damaging Contrastive Learning [92.34124578823977]
ラベルのないデータは一般に不均衡であり、長い尾の分布を示す。
本稿では,クラスを知らずに表現学習を自動的にバランスをとるための,自己学習コントラスト学習という原則的枠組みを提案する。
実験の結果,SDCLRは全体としての精度だけでなく,バランス性も著しく向上することがわかった。
論文 参考訳(メタデータ) (2021-06-06T00:04:49Z) - Supercharging Imbalanced Data Learning With Energy-based Contrastive
Representation Transfer [72.5190560787569]
コンピュータビジョンにおいて、長い尾のデータセットからの学習は、特に自然画像データセットの繰り返しのテーマである。
本稿では,データ生成機構がラベル条件と特徴分布の間で不変であるメタ分散シナリオを提案する。
これにより、因果データインフレーションの手順を利用してマイノリティクラスの表現を拡大できる。
論文 参考訳(メタデータ) (2020-11-25T00:13:11Z) - Counterfactual Representation Learning with Balancing Weights [74.67296491574318]
観察データによる因果推論の鍵は、それぞれの治療タイプに関連する予測的特徴のバランスを達成することである。
近年の文献では、この目標を達成するために表現学習を探求している。
因果効果を柔軟かつスケーラブルかつ正確に推定するアルゴリズムを開発した。
論文 参考訳(メタデータ) (2020-10-23T19:06:03Z) - Accurate and Robust Feature Importance Estimation under Distribution
Shifts [49.58991359544005]
PRoFILEは、新しい特徴重要度推定法である。
忠実さと頑健さの両面で、最先端のアプローチよりも大幅に改善されていることを示す。
論文 参考訳(メタデータ) (2020-09-30T05:29:01Z) - Long-Tailed Recognition Using Class-Balanced Experts [128.73438243408393]
本稿では,多様な分類器の強度を組み合わせたクラスバランスの専門家のアンサンブルを提案する。
私たちのクラスバランスの専門家のアンサンブルは、最先端に近い結果に到達し、長い尾の認識のための2つのベンチマークで新たな最先端のアンサンブルを確立します。
論文 参考訳(メタデータ) (2020-04-07T20:57:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。