論文の概要: Multiple Descents in Unsupervised Learning: The Role of Noise, Domain Shift and Anomalies
- arxiv url: http://arxiv.org/abs/2406.11703v1
- Date: Mon, 17 Jun 2024 16:24:23 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-18 13:53:20.907267
- Title: Multiple Descents in Unsupervised Learning: The Role of Noise, Domain Shift and Anomalies
- Title(参考訳): 教師なし学習における複数の未熟児:騒音, ドメインシフト, 異常の役割
- Authors: Kobi Rahimi, Tom Tirer, Ofir Lindenbaum,
- Abstract要約: 教師なし学習における二重の子孫の存在について検討するが、これはほとんど注目されず、まだ完全には理解されていない領域である。
我々は、合成データと実データを用いて、様々なアプリケーションに対してモデルワイド、エポックワイド、サンプルワイドの二重降下を識別する。
- 参考スコア(独自算出の注目度): 14.399035468023161
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The phenomenon of double descent has recently gained attention in supervised learning. It challenges the conventional wisdom of the bias-variance trade-off by showcasing a surprising behavior. As the complexity of the model increases, the test error initially decreases until reaching a certain point where the model starts to overfit the train set, causing the test error to rise. However, deviating from classical theory, the error exhibits another decline when exceeding a certain degree of over-parameterization. We study the presence of double descent in unsupervised learning, an area that has received little attention and is not yet fully understood. We conduct extensive experiments using under-complete auto-encoders (AEs) for various applications, such as dealing with noisy data, domain shifts, and anomalies. We use synthetic and real data and identify model-wise, epoch-wise, and sample-wise double descent for all the aforementioned applications. Finally, we assessed the usability of the AEs for detecting anomalies and mitigating the domain shift between datasets. Our findings indicate that over-parameterized models can improve performance not only in terms of reconstruction, but also in enhancing capabilities for the downstream task.
- Abstract(参考訳): 二重降下現象は近年,教師あり学習において注目されている。
これは、予想外の振る舞いを示すことによって、従来の偏差トレードオフの知恵に挑戦する。
モデルの複雑さが増大するにつれて、テストエラーは、モデルが列車セットに過度に適合し始める特定の時点に到達するまで減少し、テストエラーが上昇する。
しかし、古典理論から逸脱して、この誤差はある種の過度なパラメータ化を超えると別の減少を示す。
教師なし学習における二重の子孫の存在について検討するが、これはほとんど注目されず、まだ完全には理解されていない領域である。
我々は、ノイズデータ、ドメインシフト、異常などの様々なアプリケーションに対して、未完成のオートエンコーダ(AE)を用いて広範な実験を行う。
合成データと実データを用いて、上記のすべてのアプリケーションに対して、モデルワイド、エポックワイド、サンプルワイドの二重降下を識別する。
最後に、異常を検出し、データセット間のドメインシフトを軽減するためのAEのユーザビリティを評価した。
以上の結果から, 過パラメータ化モデルでは, 再構成だけでなく, 下流タスクの能力向上にも有効であることが示唆された。
関連論文リスト
- Data Duplication: A Novel Multi-Purpose Attack Paradigm in Machine Unlearning [19.229039345631406]
データ重複が未学習のプロセスに与える影響は、まだ明らかにされていない。
対象モデルのトレーニングセットのサブセットを複製し,それをトレーニングセットに組み込む敵を提案する。
次に,非重複手法を適用した場合の学習プロセスへの影響について検討する。
論文 参考訳(メタデータ) (2025-01-28T02:52:51Z) - Self-supervised Feature Adaptation for 3D Industrial Anomaly Detection [59.41026558455904]
具体的には,大規模ビジュアルデータセット上で事前学習されたモデルを利用した初期のマルチモーダルアプローチについて検討する。
本研究では,アダプタを微調整し,異常検出に向けたタスク指向の表現を学習するためのLSFA法を提案する。
論文 参考訳(メタデータ) (2024-01-06T07:30:41Z) - Generating and Reweighting Dense Contrastive Patterns for Unsupervised
Anomaly Detection [59.34318192698142]
我々は、先行のない異常発生パラダイムを導入し、GRADと呼ばれる革新的な教師なし異常検出フレームワークを開発した。
PatchDiffは、様々な種類の異常パターンを効果的に公開する。
MVTec ADとMVTec LOCOデータセットの両方の実験も、前述の観測をサポートする。
論文 参考訳(メタデータ) (2023-12-26T07:08:06Z) - Video Anomaly Detection via Spatio-Temporal Pseudo-Anomaly Generation : A Unified Approach [49.995833831087175]
本研究は,画像のマスキング領域にペンキを塗布することにより,汎用的な映像時間PAを生成する手法を提案する。
さらに,OCC設定下での現実世界の異常を検出するための単純な統合フレームワークを提案する。
提案手法は,OCC設定下での既存のPAs生成および再構築手法と同等に動作する。
論文 参考訳(メタデータ) (2023-11-27T13:14:06Z) - A U-turn on Double Descent: Rethinking Parameter Counting in Statistical
Learning [68.76846801719095]
二重降下がいつどこで起こるのかを正確に示し、その位置が本質的に閾値 p=n に結び付けられていないことを示す。
これは二重降下と統計的直観の間の緊張を解消する。
論文 参考訳(メタデータ) (2023-10-29T12:05:39Z) - Unraveling the Enigma of Double Descent: An In-depth Analysis through the Lens of Learned Feature Space [12.907949196758565]
二重降下は、機械学習領域内の反直観的な側面を示す。
ノイズの多いデータで訓練された不完全なモデルに二重降下が生じると我々は主張する。
論文 参考訳(メタデータ) (2023-10-20T15:10:16Z) - Learning from few examples with nonlinear feature maps [68.8204255655161]
我々はこの現象を探求し、AIモデルの特徴空間の次元性、データ分散の非退化、モデルの一般化能力の間の重要な関係を明らかにする。
本分析の主な推力は、元のデータを高次元および無限次元空間にマッピングする非線形特徴変換が結果のモデル一般化能力に与える影響である。
論文 参考訳(メタデータ) (2022-03-31T10:36:50Z) - Multi-scale Feature Learning Dynamics: Insights for Double Descent [71.91871020059857]
一般化誤差の「二重降下」現象について検討する。
二重降下は、異なるスケールで学習される異なる特徴に起因する可能性がある。
論文 参考訳(メタデータ) (2021-12-06T18:17:08Z) - Analytic Study of Double Descent in Binary Classification: The Impact of
Loss [34.100845063076534]
DD現象は持続するが,ロジスティックな損失と比較していくつかの相違点が認められた。
さらに,DD曲線のトレーニングセットのサイズ依存性について検討した。
論文 参考訳(メタデータ) (2020-01-30T21:29:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。