論文の概要: Handling Out-of-Distribution Data: A Survey
- arxiv url: http://arxiv.org/abs/2507.21160v1
- Date: Fri, 25 Jul 2025 04:29:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-30 17:08:55.007271
- Title: Handling Out-of-Distribution Data: A Survey
- Title(参考訳): アウト・オブ・ディストリビューションデータの処理:サーベイ
- Authors: Lakpa Tamang, Mohamed Reda Bouadjenek, Richard Dazeley, Sunil Aryal,
- Abstract要約: 本稿では,2種類の分散シフトを扱うためのメカニズムについて概説する。
我々は,既存の調査で見落とされていたOODデータに着目し,分散シフトにおける文献の振り返りのシナプスを提供する。
- 参考スコア(独自算出の注目度): 2.373572816573706
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In the field of Machine Learning (ML) and data-driven applications, one of the significant challenge is the change in data distribution between the training and deployment stages, commonly known as distribution shift. This paper outlines different mechanisms for handling two main types of distribution shifts: (i) Covariate shift: where the value of features or covariates change between train and test data, and (ii) Concept/Semantic-shift: where model experiences shift in the concept learned during training due to emergence of novel classes in the test phase. We sum up our contributions in three folds. First, we formalize distribution shifts, recite on how the conventional method fails to handle them adequately and urge for a model that can simultaneously perform better in all types of distribution shifts. Second, we discuss why handling distribution shifts is important and provide an extensive review of the methods and techniques that have been developed to detect, measure, and mitigate the effects of these shifts. Third, we discuss the current state of distribution shift handling mechanisms and propose future research directions in this area. Overall, we provide a retrospective synopsis of the literature in the distribution shift, focusing on OOD data that had been overlooked in the existing surveys.
- Abstract(参考訳): 機械学習(ML)とデータ駆動アプリケーションの分野において、大きな課題の1つは、トレーニングとデプロイメントステージ間のデータ分散の変化である。
本稿では,2種類の分散シフトを扱うためのメカニズムについて概説する。
一 共変量シフト 機能又は共変量の価値が列車と試験データの間で変化する場合
(ii)概念/セマンティックシフト:モデル体験が、テストフェーズに新しいクラスが出現することによって、トレーニング中に学んだ概念にシフトする。
コントリビューションを3倍にまとめる。
まず, 分散シフトを形式化し, 従来の手法が適切に扱えないこと, そして, 分散シフトのすべてのタイプにおいて, 同時に実行可能なモデルを提案する。
第2に,分散シフトの処理が重要である理由を論じ,これらのシフトを検知し,測定し,緩和するために開発された手法や手法を幅広く検討する。
第3に,分布シフト処理機構の現状について考察し,今後の研究方向性を提案する。
全体として、既存の調査で見落とされたOODデータに着目し、分散シフトにおける文献の振り返りのシナプスを提供する。
関連論文リスト
- Out-of-Distribution Detection on Graphs: A Survey [58.47395497985277]
グラフアウト・オブ・ディストリビューション(GOOD)検出は、トレーニング中に見られる分布から逸脱するグラフデータを特定することに焦点を当てる。
既存の手法を,拡張ベース,再構築ベース,情報伝達ベース,分類ベースという4つのタイプに分類する。
本稿では,グラフデータによるユニークな課題を浮き彫りにして,実践的応用と理論的基礎について論じる。
論文 参考訳(メタデータ) (2025-02-12T04:07:12Z) - Transfer Learning for High-dimensional Quantile Regression with Distribution Shift [0.28927500190704564]
本稿では,3種類の分布シフトの下での知識伝達を伴う高次元量子レグレッションに着目した。
本稿では,これら3つの相違点に対処する新しい転送可能集合と新しい転送フレームワークを提案する。
本手法の有効性と優位性を検証するため,非漸近的推定誤差境界とソース検出整合性を確立した。
論文 参考訳(メタデータ) (2024-11-29T18:49:55Z) - A Survey of Deep Graph Learning under Distribution Shifts: from Graph Out-of-Distribution Generalization to Adaptation [59.14165404728197]
我々は,分散シフト下での深層グラフ学習について,最新かつ先見的なレビューを行う。
具体的には,グラフ OOD 一般化,トレーニング時グラフ OOD 適応,テスト時グラフ OOD 適応の3つのシナリオについて述べる。
文献をよりよく理解するために,既存の手法をモデル中心およびデータ中心のアプローチに分類する系統分類を導入した。
論文 参考訳(メタデータ) (2024-10-25T02:39:56Z) - Proxy Methods for Domain Adaptation [78.03254010884783]
プロキシ変数は、遅延変数を明示的にリカバリしたりモデル化したりすることなく、分散シフトへの適応を可能にする。
両設定の複雑な分散シフトに適応する2段階のカーネル推定手法を開発した。
論文 参考訳(メタデータ) (2024-03-12T09:32:41Z) - Supervised Algorithmic Fairness in Distribution Shifts: A Survey [17.826312801085052]
現実世界のアプリケーションでは、機械学習モデルは特定のデータセットでトレーニングされることが多いが、データ分散がシフトする可能性のある環境にデプロイされる。
この変化は、人種や性別などのセンシティブな属性によって特徴づけられる特定のグループに不公平な予測をもたらす可能性がある。
論文 参考訳(メタデータ) (2024-02-02T11:26:18Z) - ShiftKD: Benchmarking Knowledge Distillation under Distribution Shift [7.256448072529497]
知識蒸留(KD)は、大きなモデルから小さなモデルに知識を伝達し、近年顕著な成功を収めている。
しかし、実世界のアプリケーションにおける既存のKD手法の信頼性は、特に分布シフト下では、未解明のままである。
KDを2つの分散シフトに対してベンチマークするために,統一的かつ体系的なフレームワークtextscShiftKDを提案する。
論文 参考訳(メタデータ) (2023-12-25T10:43:31Z) - Class Distribution Shifts in Zero-Shot Learning: Learning Robust Representations [3.8980564330208662]
本研究では,前もって変化の原因となる属性が不明であると仮定したモデルを提案し,解析する。
提案アルゴリズムは,実世界のデータセット上でのシミュレーションと実験の両方において,多様なクラス分布への一般化を改善する。
論文 参考訳(メタデータ) (2023-11-30T14:14:31Z) - Distribution Shift Inversion for Out-of-Distribution Prediction [57.22301285120695]
本稿では,OoD(Out-of-Distribution)予測のためのポータブル分布シフト変換アルゴリズムを提案する。
提案手法は,OoDアルゴリズムを広範囲に接続した場合に,一般的な性能向上をもたらすことを示す。
論文 参考訳(メタデータ) (2023-06-14T08:00:49Z) - An Empirical Study on Distribution Shift Robustness From the Perspective
of Pre-Training and Data Augmentation [91.62129090006745]
本稿では,事前学習とデータ拡張の観点から分布シフト問題を考察する。
我々は,事前学習とデータ拡張に焦点を当てた,最初の総合的な実証的研究を行った。
論文 参考訳(メタデータ) (2022-05-25T13:04:53Z) - Robust Generalization despite Distribution Shift via Minimum
Discriminating Information [46.164498176119665]
我々は、トレーニングデータに加えて、シフトしたテスト分布に関する部分的な構造的知識を持つモデリングフレームワークを導入する。
我々は、利用可能な事前知識を埋め込むために、最小限の識別情報の原則を用いる。
未知のシフト分布に関する明示的な一般化境界を得る。
論文 参考訳(メタデータ) (2021-06-08T15:25:35Z) - WILDS: A Benchmark of in-the-Wild Distribution Shifts [157.53410583509924]
分散シフトは、ワイルドにデプロイされた機械学習システムの精度を実質的に低下させることができる。
分散シフトの多様な範囲を反映した8つのベンチマークデータセットのキュレーションコレクションであるWILDSを紹介します。
本研究は, 標準訓練の結果, 分布性能よりも, 分布域外性能が有意に低下することを示す。
論文 参考訳(メタデータ) (2020-12-14T11:14:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。