Fugu-MT 論文翻訳(概要): Transfer Learning for Transient Classification: From Simulations to Real Data and ZTF to LSST

論文の概要: Transfer Learning for Transient Classification: From Simulations to Real Data and ZTF to LSST

arxiv url: http://arxiv.org/abs/2502.18558v1
Date: Tue, 25 Feb 2025 19:00:00 GMT
ステータス: 翻訳完了
システム内更新日: 2025-02-27 15:24:46.278707
Title: Transfer Learning for Transient Classification: From Simulations to Real Data and ZTF to LSST
Title（参考訳）: 過渡分類のための伝達学習:シミュレーションから実データ、ZTFからLSSTへ
Authors: Rithwik Gupta, Daniel Muthukrishna,
Abstract要約: 現在の機械学習アプローチは、実際のデータと競合する。新しい調査では、大量のラベル付きトレーニングデータが必要である。トランスファーラーニングがこれらの課題を克服できることを示します。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Machine learning has become essential for automated classification of astronomical transients, but current approaches face significant limitations: classifiers trained on simulations struggle with real data, models developed for one survey cannot be easily applied to another, and new surveys require prohibitively large amounts of labelled training data. These challenges are particularly pressing as we approach the era of the Vera Rubin Observatory's Legacy Survey of Space and Time (LSST), where existing classification models will need to be retrained using LSST observations. We demonstrate that transfer learning can overcome these challenges by repurposing existing models trained on either simulations or data from other surveys. Starting with a model trained on simulated Zwicky Transient Facility (ZTF) light curves, we show that transfer learning reduces the amount of labelled real ZTF transients needed by 75\% while maintaining equivalent performance to models trained from scratch. Similarly, when adapting ZTF models for LSST simulations, transfer learning achieves 95\% of the baseline performance while requiring only 30\% of the training data. These findings have significant implications for the early operations of LSST, suggesting that reliable automated classification will be possible soon after the survey begins, rather than waiting months or years to accumulate sufficient training data.
Abstract（参考訳）: 機械学習は、天文学的トランジェントの自動分類に欠かせないものとなっているが、現在のアプローチでは、シミュレーションで訓練された分類器が実際のデータと競合する、ある調査のために開発されたモデルが別の調査に容易に適用できない、そして新しい調査では、ラベル付きトレーニングデータを違法に大量に要求している、といった重大な制限に直面している。これらの課題は、既存の分類モデルをLSST観測で再訓練する必要があるヴェラ・ルービン天文台の宇宙と時間に関するレガシーサーベイ(LSST)の時代に近づいている。移動学習がこれらの課題を克服するためには、シミュレーションやデータに基づいてトレーニングされた既存のモデルを他の調査から再利用することが必要である。模擬ZTF(Zicky Transient Facility)光曲線で訓練されたモデルから始めると、転写学習はスクラッチから訓練したモデルと同等の性能を維持しつつ、75 %のラベル付き実ZTF過渡率を減少させることを示す。同様に、LSSTシミュレーションにZTFモデルを適用する場合、転送学習はベースライン性能の95%を達成し、トレーニングデータの30%しか必要としない。これらの知見はLSSTの初期運用に重大な影響を与えており、十分なトレーニングデータを集めるのに数ヶ月や数年を待たずに、調査開始後すぐに信頼性の高い自動分類が可能になることを示唆している。

関連論文リスト

SAE as a Crystal Ball: Interpretable Features Predict Cross-domain Transferability of LLMs without Training [70.84726713548099]
SAEベースのTransferability Score(STS)は、トレーニング後のTransferabilityを予測するための新しい指標である。 STSは教師付き微調整の伝達可能性を正確に予測し,実際の性能変化とともに0.7以上のピアソン相関係数を達成できることを示す。
論文参考訳（メタデータ） (2026-03-03T12:01:09Z)
Simulation-Based Pretraining and Domain Adaptation for Astronomical Time Series with Minimal Labeled Data [0.12744523252873352]
本稿では,実観測からラベル付きサンプルの必要性を大幅に低減し,シミュレーションを活用する事前学習手法を提案する。我々のモデルは、複数の天文学調査(ZTFとLSST)のシミュレーションデータに基づいて訓練され、下流のタスクに効率的に移行する一般化可能な表現を学習する。注目すべきは、既存の望遠鏡(ZTF)データのみをトレーニングすると、将来の望遠鏡(LSST)シミュレーションに匹敵する性能を達成できる、効果的なゼロショット転送能力を示すことだ。
論文参考訳（メタデータ） (2025-10-14T20:07:14Z)
TGLF-SINN: Deep Learning Surrogate Model for Accelerating Turbulent Transport Modeling in Fusion [18.028061388104963]
我々は,3つの重要なイノベーションを持つtextbfTGLF-SINN (Spectra-Informed Neural Network) を提案する。我々の手法は、トレーニングデータを大幅に減らし、優れたパフォーマンスを実現する。下流フラックスマッチングアプリケーションでは、NNサロゲートがTGLFの45倍のスピードアップを提供しながら、同等の精度を維持しています。
論文参考訳（メタデータ） (2025-09-07T09:36:51Z)
An Active Learning-Based Streaming Pipeline for Reduced Data Training of Structure Finding Models in Neutron Diffractometry [1.3083205962260995]
本研究では,不確実性サンプリングを用いて確率分布から抽出した学習データをシミュレートする新しいバッチモードアクティブラーニング(AL)ポリシーを提案する。精度を向上しながら、トレーニングデータの約75%の削減で、同じモデルのトレーニングにおける有効性を確認した。次に、このALポリシを用いた効率的なストリームベースのトレーニングワークフローの設計について論じ、2つの異種プラットフォームの性能調査を示す。
論文参考訳（メタデータ） (2025-06-06T15:48:22Z)
AdvKT: An Adversarial Multi-Step Training Framework for Knowledge Tracing [64.79967583649407]
知識追跡(KT)は、学生の知識状態を監視し、質問シーケンスに対する反応をシミュレートする。既存のKTモデルは通常、単一ステップのトレーニングパラダイムに従っており、大きなエラーの蓄積につながる。本稿では,多段階KTタスクに着目した新しい知識追跡のための多段階学習フレームワーク(AdvKT)を提案する。
論文参考訳（メタデータ） (2025-04-07T03:31:57Z)
PTMs-TSCIL Pre-Trained Models Based Class-Incremental Learning [7.784244204592032]
時系列データのためのクラスインクリメンタルラーニング(CIL)は、新たな知識獲得のための破滅的な忘れと可塑性に対する安定性のバランスをとる上で、課題に直面している。 PTMを用いた時系列クラスインクリメンタルラーニング(TSCIL)の第1回研究について紹介する。
論文参考訳（メタデータ） (2025-03-10T10:27:21Z)
Data Unlearning in Diffusion Models [44.99833362998488]
汎用マシンアンラーニング技術は不安定であるか、あるいはデータを解き放たないかのどちらかであることが判明した。本稿では,重要サンプリングを利用して,理論的な保証をもってデータを学習する最初の方法であるSubtracted Importance Smpled Scores (SISS) と呼ばれる新たな損失関数群を提案する。
論文参考訳（メタデータ） (2025-03-02T21:36:04Z)
NeuralCFD: Deep Learning on High-Fidelity Automotive Aerodynamics Simulations [11.849142587216903]
ニューラルネットワークベースのシミュレーションサロゲートが業界規模で実装される前に、大きな課題が克服されなければならない。我々は幾何学的エンコーディングと物理予測を分離した幾何学保存ユニバーサル物理変換器(GP-UPT)を紹介する。 GP-UPTは、高品質なシミュレーションメッシュの作成を回避し、2000万のメッシュセルで正確な3次元速度場予測を可能にし、低忠実度から高忠実度シミュレーションデータセットへの変換学習を効率化する。
論文参考訳（メタデータ） (2025-02-13T17:58:07Z)
Multi-Scale Convolutional LSTM with Transfer Learning for Anomaly Detection in Cellular Networks [1.1432909951914676]
本研究では,トランスファーラーニング(TL)を用いたマルチスケール畳み込みLSTMによるセルネットワークの異常検出手法を提案する。モデルは最初、公開データセットを使用してスクラッチからトレーニングされ、典型的なネットワーク動作を学習する。我々は,スクラッチから訓練したモデルの性能と,TLを用いた微調整モデルの性能を比較した。
論文参考訳（メタデータ） (2024-09-30T17:51:54Z)
Accelerating Large Language Model Pretraining via LFR Pedagogy: Learn, Focus, and Review [50.78587571704713]
Learn-Focus-Review(LFR)は、モデルの学習進捗に適応する動的トレーニングアプローチである。 LFRは、データブロック(トークンのシーケンス)にわたるモデルの学習パフォーマンスを追跡し、データセットの困難な領域を再検討する。フルデータセットでトレーニングされたベースラインモデルと比較して、LFRは一貫して低いパープレキシティと高い精度を達成した。
論文参考訳（メタデータ） (2024-09-10T00:59:18Z)
Enhancing Activity Recognition After Stroke: Generative Adversarial Networks for Kinematic Data Augmentation [0.0]
脳卒中リハビリテーションにおけるウェアラブルモニタリングのための機械学習モデルの一般化可能性はしばしば、利用可能なデータの限られたスケールと不均一性によって制限される。データ拡張は、トレーニングセットに表される変動性を強化するために、実際のデータに計算的に導出されたデータを追加することで、この課題に対処する。本研究では、CGAN(Conditional Generative Adversarial Networks)を用いて、公開データセットから合成キネマティックデータを生成する。合成データと実験データの両方でディープラーニングモデルを訓練することにより、タスク分類精度を向上させる:実データのみを訓練したモデルでは66.1%よりもはるかに高い80.0%の精度で合成データを組み込んだモデル。
論文参考訳（メタデータ） (2024-06-12T15:51:00Z)
Low-rank finetuning for LLMs: A fairness perspective [54.13240282850982]
低ランク近似技術は、微調整された大規模言語モデルのデファクトスタンダードとなっている。本稿では,これらの手法が初期訓練済みデータ分布から微調整データセットのシフトを捉える上での有効性について検討する。低ランク微調整は好ましくない偏見や有害な振る舞いを必然的に保存することを示す。
論文参考訳（メタデータ） (2024-05-28T20:43:53Z)
Learn to Unlearn for Deep Neural Networks: Minimizing Unlearning Interference with Gradient Projection [56.292071534857946]
最近のデータプライバシ法は、機械学習への関心を喚起している。課題は、残りのデータセットに関する知識を変更することなく、忘れたデータに関する情報を捨てることである。我々は、プロジェクテッド・グラディエント・アンラーニング(PGU)という、プロジェクテッド・グラディエント・ベースの学習手法を採用する。トレーニングデータセットがもはやアクセスできない場合でも、スクラッチからスクラッチで再トレーニングされたモデルと同じような振る舞いをするモデルを、我々のアンラーニング手法が生成できることを実証するための実証的な証拠を提供する。
論文参考訳（メタデータ） (2023-12-07T07:17:24Z)
Fast Machine Unlearning Without Retraining Through Selective Synaptic Dampening [51.34904967046097]
Selective Synaptic Dampening (SSD)は高速で、訓練データの長期保存を必要としない。高速で性能が高く,トレーニングデータの長期保存を必要としない,新しい2段階のポストホック,リトレーニングフリーなマシンアンラーニング手法を提案する。
論文参考訳（メタデータ） (2023-08-15T11:30:45Z)
Test-Time Adaptation with Perturbation Consistency Learning [32.58879780726279]
そこで本研究では, 分布変化のあるサンプルに対して, 安定な予測を行うための簡易なテスト時間適応手法を提案する。提案手法は,強力なPLMバックボーンよりも推論時間が少なく,高い,あるいは同等の性能を実現することができる。
論文参考訳（メタデータ） (2023-04-25T12:29:22Z)
A Comprehensive Survey on Test-Time Adaptation under Distribution Shifts [117.72709110877939]
テスト時間適応(TTA)は、事前訓練されたモデルをテスト中に、予測する前にラベルのないデータに適応する可能性がある。 TTAはテスト時間領域適応、テスト時間バッチ適応、オンラインテスト時間適応といったテストデータの形態に基づいて、いくつかの異なるグループに分類される。
論文参考訳（メタデータ） (2023-03-27T16:32:21Z)
Imputing Knowledge Tracing Data with Subject-Based Training via LSTM Variational Autoencoders Frameworks [6.24828623162058]
我々は,行数分割の代わりに,学生IDによるデータ分割とインプットを行うために,主観的学習手法を採用した。我々は既存の2つの深い生成フレームワーク、すなわち変分オートエンコーダ(VAE)と変分オートエンコーダ(LVAE)を活用している。 LSTM-VAE と LSTM-LVAE から生成したデータにより,元のモデルの性能を約50%向上できることを示す。
論文参考訳（メタデータ） (2023-02-24T21:56:03Z)
CMW-Net: Learning a Class-Aware Sample Weighting Mapping for Robust Deep Learning [55.733193075728096]
現代のディープニューラルネットワークは、破損したラベルやクラス不均衡を含むバイアス付きトレーニングデータに容易に適合する。サンプル再重み付け手法は、このデータバイアス問題を緩和するために一般的に使用されている。本稿では,データから直接明示的な重み付け方式を適応的に学習できるメタモデルを提案する。
論文参考訳（メタデータ） (2022-02-11T13:49:51Z)
FairIF: Boosting Fairness in Deep Learning via Influence Functions with Validation Set Sensitive Attributes [51.02407217197623]
本稿では,FAIRIFという2段階の学習アルゴリズムを提案する。サンプル重みが計算される再重み付きデータセットの損失を最小限に抑える。 FAIRIFは、様々な種類のバイアスに対して、フェアネスとユーティリティのトレードオフを良くしたモデルが得られることを示す。
論文参考訳（メタデータ） (2022-01-15T05:14:48Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。