論文の概要: Surrogate- and invariance-boosted contrastive learning for data-scarce
applications in science
- arxiv url: http://arxiv.org/abs/2110.08406v1
- Date: Fri, 15 Oct 2021 23:08:24 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-21 21:52:59.941787
- Title: Surrogate- and invariance-boosted contrastive learning for data-scarce
applications in science
- Title(参考訳): 科学におけるデータスカース応用のためのサロゲートおよび不変型コントラスト学習
- Authors: Charlotte Loh, Thomas Christensen, Rumen Dangovski, Samuel Kim and
Marin Soljacic
- Abstract要約: 3つの安価な情報ソースを組み込んだ深層学習フレームワークであるSurrogate- and invariance-boosted contrastive Learning (SIB-CL)を導入し、データの不足を克服する。
2次元フォトニック結晶の密度を予測し、3次元時間非依存のシュロディンガー方程式を解くなど、SIB-CLの有効性と様々な科学的問題に対する一般性を示す。
- 参考スコア(独自算出の注目度): 2.959890389883449
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deep learning techniques have been increasingly applied to the natural
sciences, e.g., for property prediction and optimization or material discovery.
A fundamental ingredient of such approaches is the vast quantity of labelled
data needed to train the model; this poses severe challenges in data-scarce
settings where obtaining labels requires substantial computational or labor
resources. Here, we introduce surrogate- and invariance-boosted contrastive
learning (SIB-CL), a deep learning framework which incorporates three
``inexpensive'' and easily obtainable auxiliary information sources to overcome
data scarcity. Specifically, these are: 1)~abundant unlabeled data, 2)~prior
knowledge of symmetries or invariances and 3)~surrogate data obtained at
near-zero cost. We demonstrate SIB-CL's effectiveness and generality on various
scientific problems, e.g., predicting the density-of-states of 2D photonic
crystals and solving the 3D time-independent Schrodinger equation. SIB-CL
consistently results in orders of magnitude reduction in the number of labels
needed to achieve the same network accuracies.
- Abstract(参考訳): 深層学習技術は、自然科学(例えば、資産予測や最適化、物質発見など)にますます応用されている。
このようなアプローチの基本的な要素は、モデルをトレーニングするために必要な大量のラベル付きデータである。
本稿では,3つの'inexpensive'を組み込んだ深層学習フレームワークであるSurrogate- and invariance-boosted contrastive Learning (SIB-CL)を紹介する。
具体的には, 1) ラベルなしデータ, 2) 対称性や不変性の事前知識, 3) ほぼゼロのコストで得られた代理データである。
2次元フォトニック結晶の密度を予測し、3次元時間非依存のシュロディンガー方程式を解くなど、SIB-CLの有効性と様々な科学的問題に対する一般性を示す。
SIB-CLは、同じネットワークの精度を達成するのに必要なラベルの数を大幅に削減する。
関連論文リスト
- S-MolSearch: 3D Semi-supervised Contrastive Learning for Bioactive Molecule Search [30.071862398889774]
半教師付きコントラスト学習において,分子3次元情報と親和性情報を活用する最初のフレームワークであるS-MolSearchを提案する。
ラベル付きデータとラベルなしデータの両方を効率的に処理し、ラベルなしデータのソフトラベルを生成しながら分子構造エンコーダを訓練する。
S-MolSearchは、広く使われているLIT-PCBAとDUD-Eで優れた性能を示す。
論文 参考訳(メタデータ) (2024-08-27T14:51:11Z) - Physics-Informed Deep Learning and Partial Transfer Learning for Bearing Fault Diagnosis in the Presence of Highly Missing Data [0.0]
本稿では,物理インフォームド深層学習技術を用いて合成ラベル付きデータを生成するPTPAI法を提案する。
不均衡なクラス問題と部分セット障害診断ハードルに対処する。
CWRUとJNUデータセットの実験結果は、提案手法がこれらの問題に効果的に対処していることを示している。
論文 参考訳(メタデータ) (2024-06-16T17:36:53Z) - Leveraging Neural Radiance Fields for Uncertainty-Aware Visual
Localization [56.95046107046027]
我々は,Neural Radiance Fields (NeRF) を用いてシーン座標回帰のためのトレーニングサンプルを生成することを提案する。
レンダリングにおけるNeRFの効率にもかかわらず、レンダリングされたデータの多くはアーティファクトによって汚染されるか、最小限の情報ゲインしか含まない。
論文 参考訳(メタデータ) (2023-10-10T20:11:13Z) - A New Benchmark: On the Utility of Synthetic Data with Blender for Bare
Supervised Learning and Downstream Domain Adaptation [42.2398858786125]
コンピュータビジョンにおけるディープラーニングは、大規模ラベル付きトレーニングデータの価格で大きな成功を収めた。
制御不能なデータ収集プロセスは、望ましくない重複が存在する可能性のある非IIDトレーニングおよびテストデータを生成する。
これを回避するために、ドメインランダム化による3Dレンダリングによる合成データを生成する方法がある。
論文 参考訳(メタデータ) (2023-03-16T09:03:52Z) - A Survey of Learning on Small Data: Generalization, Optimization, and
Challenge [101.27154181792567]
ビッグデータの一般化能力を近似した小さなデータについて学ぶことは、AIの究極の目的の1つである。
この調査はPACフレームワークの下でのアクティブサンプリング理論に従い、小さなデータにおける学習の一般化誤差とラベルの複雑さを分析した。
効率的な小さなデータ表現の恩恵を受けるかもしれない複数のデータアプリケーションについて調査する。
論文 参考訳(メタデータ) (2022-07-29T02:34:19Z) - Open-Set Semi-Supervised Learning for 3D Point Cloud Understanding [62.17020485045456]
半教師付き学習(SSL)では、ラベル付きデータと同じ分布からラベル付きデータが引き出されることが一般的である。
サンプル重み付けによりラベルなしデータを選択的に活用することを提案する。
論文 参考訳(メタデータ) (2022-05-02T16:09:17Z) - An Empirical Evaluation of the t-SNE Algorithm for Data Visualization in
Structural Engineering [2.4493299476776773]
t-Distributed Neighbor Embedding (t-SNE)アルゴリズムは、可視化目的で設定された地震関連データセットの寸法を縮小するために用いられる。
SMOTE(Synthetic Minority Oversampling Technique)は、このようなデータセットの不均衡な性質に対処するために用いられる。
トレーニングデータセットにおけるt-SNEとSMOTEを用いて、ニューラルネットワーク分類器は精度を犠牲にすることなく、有望な結果が得られることを示す。
論文 参考訳(メタデータ) (2021-09-18T01:24:39Z) - SelfVoxeLO: Self-supervised LiDAR Odometry with Voxel-based Deep Neural
Networks [81.64530401885476]
本稿では,これら2つの課題に対処するために,自己教師型LiDARオドメトリー法(SelfVoxeLO)を提案する。
具体的には、生のLiDARデータを直接処理する3D畳み込みネットワークを提案し、3D幾何パターンをよりよく符号化する特徴を抽出する。
我々は,KITTIとApollo-SouthBayという2つの大規模データセット上での手法の性能を評価する。
論文 参考訳(メタデータ) (2020-10-19T09:23:39Z) - Uncovering the structure of clinical EEG signals with self-supervised
learning [64.4754948595556]
教師付き学習パラダイムは、しばしば利用可能なラベル付きデータの量によって制限される。
この現象は脳波(EEG)などの臨床関連データに特に問題となる。
ラベルのないデータから情報を抽出することで、ディープニューラルネットワークとの競合性能に到達することができるかもしれない。
論文 参考訳(メタデータ) (2020-07-31T14:34:47Z) - Learning while Respecting Privacy and Robustness to Distributional
Uncertainties and Adversarial Data [66.78671826743884]
分散ロバストな最適化フレームワークはパラメトリックモデルのトレーニングのために検討されている。
目的は、逆操作された入力データに対して頑健なトレーニングモデルを提供することである。
提案されたアルゴリズムは、オーバーヘッドがほとんどない堅牢性を提供する。
論文 参考訳(メタデータ) (2020-07-07T18:25:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。