論文の概要: Implicit Data Synthesis for Contrastive Unsupervised Data Augmentation
- arxiv url: http://arxiv.org/abs/2606.07498v1
- Date: Fri, 05 Jun 2026 17:52:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-08 14:33:29.880743
- Title: Implicit Data Synthesis for Contrastive Unsupervised Data Augmentation
- Title(参考訳): 競合的教師なしデータ拡張のためのインプシットデータ合成
- Authors: Patrick Kage, Trevor Hedges, N. Siddharth, Pavlos Andreadis,
- Abstract要約: ネットワーク重みを基礎データではなく摂動することで、コントラスト的なサンプルを生成する方法を示す。
隕石のレーダー観測に応用したSimCLRベースのパイプラインを用いて,この手法を実証する。
- 参考スコア(独自算出の注目度): 4.011518112865689
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Scientific observations generate large quantities of unlabeled data which is laborious to hand-label, making unsupervised learning techniques valuable for processing datasets. Among these approaches, contrastive learning provides a convenient mechanism for extracting structural representations from unannotated datasets. For natural imagery, the general approach is to use a variety of data-space augmentation methods in order to generate synthetic samples; however, for scientific observations data-space perturbations can fundamentally alter the underlying data. Our proposed method is to generate contrastive samples by perturbing the network weights rather than the underlying data, thus more closely preserving the structure of the data. We demonstrate this technique using a SimCLR-based pipeline applied over radar observations of meteors, and show performance gains under matched protocols.
- Abstract(参考訳): 科学的な観察によって大量のラベルのないデータが生成され、手書きラベルに精通しているため、教師なし学習技術はデータセットの処理に有用である。
これらのアプローチの中で、コントラスト学習は、注釈のないデータセットから構造表現を抽出する便利なメカニズムを提供する。
自然画像において、一般的なアプローチは、合成サンプルを生成するために様々なデータ空間拡張法を使用することであるが、科学的な観測ではデータ空間の摂動は基礎となるデータを根本的に変更することができる。
提案手法は,データではなく,ネットワーク重みを摂動することで,データ構造をより緊密に保存し,コントラスト的なサンプルを生成する。
本手法は,気象のレーダ観測に応用したSimCLRベースのパイプラインを用いて実証し,一致したプロトコル下での性能向上を示す。
関連論文リスト
- Geometric Characterisation and Structured Trajectory Surrogates for Clinical Dataset Condensation [1.6261700844888172]
トラジェクトリマッチング(TM)は、実データ上でのトレーニング中に観測されたモデルパラメータの変化を用いて合成データを監督する、広く使われている凝縮法である。
固定された合成データセットは、そのような訓練によって引き起こされるパラメータの変化の限られた範囲しか再現できないことを示す。
本稿では,SGDトラジェクトリを2次ベジエトラジェクトリサロゲートに置き換えるBezier Trajectory Matching (BTM)を提案する。
論文 参考訳(メタデータ) (2026-04-23T12:53:46Z) - Research on Dynamic Data Flow Anomaly Detection based on Machine Learning [11.526496773281938]
本研究では,非教師なし学習法を用いて動的データフローの異常を同定する。
類似したデータをクラスタリングすることで、ラベル付きデータを必要とせずに、通常のトラフィックから著しく逸脱するデータ挙動を検出することができる。
特に、不均衡なデータのコンテキストにおいて、堅牢で適応可能なパフォーマンスを示す。
論文 参考訳(メタデータ) (2024-09-23T08:19:15Z) - Generative Expansion of Small Datasets: An Expansive Graph Approach [13.053285552524052]
最小限のサンプルから大規模で情報豊富なデータセットを生成する拡張合成モデルを提案する。
自己アテンション層と最適なトランスポートを持つオートエンコーダは、分散一貫性を洗練させる。
結果は同等のパフォーマンスを示し、モデルがトレーニングデータを効果的に増強する可能性を示している。
論文 参考訳(メタデータ) (2024-06-25T02:59:02Z) - Boosting Data Analytics With Synthetic Volume Expansion [3.568650932986342]
本稿では,合成データに対する統計的手法の有効性と,合成データのプライバシーリスクについて考察する。
この枠組みにおける重要な発見は、合成データに対する統計的手法の誤差率は、より多くの合成データを追加することで減少するが、最終的には上昇または安定化する可能性があることを明らかにする世代効果である。
論文 参考訳(メタデータ) (2023-10-27T01:57:27Z) - Hodge-Aware Contrastive Learning [101.56637264703058]
単純コンプレックスは、マルチウェイ依存によるデータのモデリングに有効である。
我々は、単純なデータを処理するための対照的な自己教師付き学習手法を開発した。
論文 参考訳(メタデータ) (2023-09-14T00:40:07Z) - Minimizing the Accumulated Trajectory Error to Improve Dataset
Distillation [151.70234052015948]
本稿では,フラットな軌道を求める最適化アルゴリズムを提案する。
合成データに基づいてトレーニングされた重みは、平坦な軌道への正規化を伴う累積誤差摂動に対して頑健であることを示す。
本手法はFTD (Flat Trajectory Distillation) と呼ばれ, 勾配整合法の性能を最大4.7%向上させる。
論文 参考訳(メタデータ) (2022-11-20T15:49:11Z) - Unsupervised Machine Learning for Exploratory Data Analysis of Exoplanet
Transmission Spectra [68.8204255655161]
我々は、通過する太陽系外惑星のスペクトルデータを解析するための教師なし手法に焦点をあてる。
スペクトルデータには、適切な低次元表現を要求する高い相関関係があることが示される。
主成分に基づく興味深い構造、すなわち、異なる化学状態に対応する明確に定義された分岐を明らかにする。
論文 参考訳(メタデータ) (2022-01-07T22:26:33Z) - Negative Data Augmentation [127.28042046152954]
負のデータ拡張サンプルは、データ分散のサポートに関する情報を提供することを示す。
我々は、NDAを識別器の合成データの追加源として利用する新しいGAN訓練目標を提案する。
実験により,本手法で訓練したモデルでは,異常検出能力の向上とともに条件付き・条件付き画像生成の改善を実現している。
論文 参考訳(メタデータ) (2021-02-09T20:28:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。