論文の概要: Active learning with RESSPECT: Resource allocation for extragalactic
astronomical transients
- arxiv url: http://arxiv.org/abs/2010.05941v2
- Date: Mon, 26 Oct 2020 21:05:03 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-08 07:54:58.167515
- Title: Active learning with RESSPECT: Resource allocation for extragalactic
astronomical transients
- Title(参考訳): RESSPECTによるアクティブラーニング:銀河外天体トランジェントのための資源配分
- Authors: Noble Kennamer, Emille E. O. Ishida, Santiago Gonzalez-Gaitan, Rafael
S. de Souza, Alexander Ihler, Kara Ponder, Ricardo Vilalta, Anais Moller,
David O. Jones, Mi Dai, Alberto Krone-Martins, Bruno Quint, Sreevarsha
Sreejith, Alex I. Malz, Lluis Galbany (The LSST Dark Energy Science
Collaboration and the COIN collaboration)
- Abstract要約: RESSPECTプロジェクトは、Rubin Observatory Legacy Survey of Space and Timeのために最適化されたトレーニングサンプルを構築することを目的としている。
我々は,現実的なシミュレートされた天文学的データシナリオにおいて,能動的学習技術の堅牢性をテストする。
- 参考スコア(独自算出の注目度): 41.74772877196879
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The recent increase in volume and complexity of available astronomical data
has led to a wide use of supervised machine learning techniques. Active
learning strategies have been proposed as an alternative to optimize the
distribution of scarce labeling resources. However, due to the specific
conditions in which labels can be acquired, fundamental assumptions, such as
sample representativeness and labeling cost stability cannot be fulfilled. The
Recommendation System for Spectroscopic follow-up (RESSPECT) project aims to
enable the construction of optimized training samples for the Rubin Observatory
Legacy Survey of Space and Time (LSST), taking into account a realistic
description of the astronomical data environment. In this work, we test the
robustness of active learning techniques in a realistic simulated astronomical
data scenario. Our experiment takes into account the evolution of training and
pool samples, different costs per object, and two different sources of budget.
Results show that traditional active learning strategies significantly
outperform random sampling. Nevertheless, more complex batch strategies are not
able to significantly overcome simple uncertainty sampling techniques. Our
findings illustrate three important points: 1) active learning strategies are a
powerful tool to optimize the label-acquisition task in astronomy, 2) for
upcoming large surveys like LSST, such techniques allow us to tailor the
construction of the training sample for the first day of the survey, and 3) the
peculiar data environment related to the detection of astronomical transients
is a fertile ground that calls for the development of tailored machine learning
algorithms.
- Abstract(参考訳): 近年、利用可能な天文学データの量と複雑さの増大により、教師付き機械学習技術が広く使われるようになった。
希少なラベリングリソースの分散を最適化する代替手段として,アクティブラーニング戦略が提案されている。
しかし,ラベルの取得可能な具体的な条件から,サンプル代表性やラベルの安定性といった基本的な前提を満たすことはできない。
天文学データ環境の現実的な記述を考慮し、ルビン天文台の宇宙時間探査(lsst)に最適化されたトレーニングサンプルの構築を可能にすることを目的とした、分光追跡(resspect)プロジェクトの推奨システム。
そこで本研究では,現実的なシミュレーションデータシナリオを用いて,アクティブラーニング手法のロバスト性をテストする。
私たちの実験は、トレーニングとプールサンプルの進化、オブジェクトごとに異なるコスト、そして2つの異なる予算源を考慮しています。
その結果、従来のアクティブラーニング戦略はランダムサンプリングを大きく上回ることがわかった。
それでも、より複雑なバッチ戦略は、単純な不確実性サンプリング技術を大幅に克服することはできない。
我々の発見は3つの重要な点を示している。
1)アクティブラーニング戦略は天文学におけるラベル獲得タスクを最適化するための強力なツールである。
2)lsstのような大規模調査では,調査初日のトレーニングサンプルの構築を調整できる。
3) 天文学的過渡現象の検出に関連する特異なデータ環境は、仕立て機械学習アルゴリズムの開発を求める肥育的な基盤である。
関連論文リスト
- Enhancing Multivariate Time Series-based Solar Flare Prediction with Multifaceted Preprocessing and Contrastive Learning [0.9374652839580181]
正確な太陽フレア予測は、宇宙飛行士、宇宙機器、衛星通信システムに強い太陽フレアがもたらす重大なリスクのために重要である。
本研究は、先進的なデータ前処理と分類手法を利用して、太陽フレア予測を強化する。
論文 参考訳(メタデータ) (2024-09-21T05:00:34Z) - Semi-Supervised One-Shot Imitation Learning [83.94646047695412]
ワンショットのImitation Learningは、AIエージェントに1つのデモから新しいタスクを学ぶ能力を持たせることを目的としている。
我々は,学習エージェントにトラジェクトリの大規模なデータセットを提示する,半教師付きOSIL問題設定を導入する。
我々は,この半教師付きOSIL設定に適用可能なアルゴリズムを開発した。
論文 参考訳(メタデータ) (2024-08-09T18:11:26Z) - Take the Bull by the Horns: Hard Sample-Reweighted Continual Training
Improves LLM Generalization [165.98557106089777]
大きな言語モデル(LLM)の能力を高めることが大きな課題だ。
本研究は,従来の事前学習データセットを用いたLCMの光連続訓練に関する実証的戦略から始まった。
次に、この戦略をインスタンス重み付け分散ロバスト最適化の原則化されたフレームワークに定式化します。
論文 参考訳(メタデータ) (2024-02-22T04:10:57Z) - An Experimental Design Framework for Label-Efficient Supervised Finetuning of Large Language Models [55.01592097059969]
命令データセットの監視された微調整は、目覚ましいゼロショットの一般化能力を達成する上で重要な役割を担っている。
アクティブラーニングは、未ラベルのプールからアノテートするサンプルの有用なサブセットを特定するのに効果的である。
本研究では,能動学習の計算ボトルネックを回避するための実験設計を提案する。
論文 参考訳(メタデータ) (2024-01-12T16:56:54Z) - deep-REMAP: Parameterization of Stellar Spectra Using Regularized
Multi-Task Learning [0.0]
確率的推論のための非対称損失をもつ深層正規化アンサンブルに基づくマルチタスク学習(rmdeep-REMAP$)
我々は、PHOENIXライブラリからのリッチな合成スペクトルと、MARVELSサーベイからの観測データを利用して、恒星の大気パラメータを正確に予測する新しいフレームワークを開発する。
論文 参考訳(メタデータ) (2023-11-07T05:41:48Z) - GenCo: An Auxiliary Generator from Contrastive Learning for Enhanced
Few-Shot Learning in Remote Sensing [9.504503675097137]
我々は、バックボーンを事前訓練し、同時に特徴サンプルの変種を探索するジェネレータベースのコントラスト学習フレームワーク(GenCo)を導入する。
微調整では、補助ジェネレータを使用して、特徴空間内の限られたラベル付きデータサンプルを濃縮することができる。
本稿では,2つの重要なリモートセンシングデータセットにおいて,この手法の有効性を実証する。
論文 参考訳(メタデータ) (2023-07-27T03:59:19Z) - Representation Learning with Multi-Step Inverse Kinematics: An Efficient
and Optimal Approach to Rich-Observation RL [106.82295532402335]
既存の強化学習アルゴリズムは、計算的難易度、強い統計的仮定、最適なサンプルの複雑さに悩まされている。
所望の精度レベルに対して、レート最適サンプル複雑性を実現するための、最初の計算効率の良いアルゴリズムを提供する。
我々のアルゴリズムMusIKは、多段階の逆運動学に基づく表現学習と体系的な探索を組み合わせる。
論文 参考訳(メタデータ) (2023-04-12T14:51:47Z) - Sampling Through the Lens of Sequential Decision Making [9.101505546901999]
我々はアダプティブ・サンプル・ウィズ・リワード(ASR)と呼ばれる報酬誘導型サンプリング戦略を提案する。
提案手法は,サンプリング過程を最適に調整し,最適性能を実現する。
情報検索とクラスタリングの実証的な結果は、異なるデータセット間でのASRのスーパーブパフォーマンスを示している。
論文 参考訳(メタデータ) (2022-08-17T04:01:29Z) - Improving Astronomical Time-series Classification via Data Augmentation
with Generative Adversarial Networks [1.2891210250935146]
本稿では,GAN(Generative Adrial Networks)に基づくデータ拡張手法を提案する。
変動星の分類精度は、合成データによるトレーニングや実データによるテストで著しく向上する。
論文 参考訳(メタデータ) (2022-05-13T16:39:54Z) - TRAIL: Near-Optimal Imitation Learning with Suboptimal Data [100.83688818427915]
オフラインデータセットを使用してファクタードトランジションモデルを学習するトレーニング目標を提案する。
我々の理論的分析は、学習された潜在行動空間が下流模倣学習のサンプル効率を高めることを示唆している。
実際に潜伏行動空間を学習するために、エネルギーベースの遷移モデルを学ぶアルゴリズムTRAIL(Transition-Reparametrized Actions for Imitation Learning)を提案する。
論文 参考訳(メタデータ) (2021-10-27T21:05:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。