論文の概要: Automatic Catalog of RRLyrae from $\sim$ 14 million VVV Light Curves:
How far can we go with traditional machine-learning?
- arxiv url: http://arxiv.org/abs/2005.00220v2
- Date: Tue, 4 May 2021 19:29:32 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-07 23:18:31.269629
- Title: Automatic Catalog of RRLyrae from $\sim$ 14 million VVV Light Curves:
How far can we go with traditional machine-learning?
- Title(参考訳): RRLyraeの自動カタログを$\sim$14M(400万ドル)のVVVライトカーブから作成する。
- Authors: Juan B. Cabral, Felipe Ramos, Sebasti\'an Gurovich and Pablo Granitto
- Abstract要約: RRL(RRL)を用いたバルジの3次元地図の作成は、VVV(X)サーベイの主な目標の1つである。
これまでの研究では、可変星分類に機械学習(ML)メソッドが用いられてきた。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The creation of a 3D map of the bulge using RRLyrae (RRL) is one of the main
goals of the VVV(X) surveys. The overwhelming number of sources under analysis
request the use of automatic procedures. In this context, previous works
introduced the use of Machine Learning (ML) methods for the variable star
classification. Our goal is the development and analysis of an automatic
procedure, based on ML, for the identification of RRLs in the VVV Survey. This
procedure will be use to generate reliable catalogs integrated over several
tiles in the survey. After the reconstruction of light-curves, we extract a set
of period and intensity-based features. We use for the first time a new subset
of pseudo color features. We discuss all the appropriate steps needed to define
our automatic pipeline: selection of quality measures; sampling procedures;
classifier setup and model selection. As final result, we construct an ensemble
classifier with an average Recall of 0.48 and average Precision of 0.86 over 15
tiles. We also make available our processed datasets and a catalog of candidate
RRLs. Perhaps most interestingly, from a classification perspective based on
photometric broad-band data, is that our results indicate that Color is an
informative feature type of the RRL that should be considered for automatic
classification methods via ML. We also argue that Recall and Precision in both
tables and curves are high quality metrics for this highly imbalanced problem.
Furthermore, we show for our VVV data-set that to have good estimates it is
important to use the original distribution more than reduced samples with an
artificial balance. Finally, we show that the use of ensemble classifiers helps
resolve the crucial model selection step, and that most errors in the
identification of RRLs are related to low quality observations of some sources
or to the difficulty to resolve the RRL-C type given the date.
- Abstract(参考訳): RRL(RRL)を用いたバルジの3次元地図の作成は、VVV(X)サーベイの主な目標の1つである。
分析対象の圧倒的な数の情報源は、自動手順の使用を要求する。
この文脈において、以前の研究は可変星分類に機械学習(ML)メソッドを導入した。
我々の目標は、VVVサーベイにおけるRRLの同定のためのMLに基づく自動手順の開発と解析である。
この手順は、調査でいくつかのタイルに統合された信頼できるカタログを生成するために使用される。
光曲線の再構成後、周期的特徴と強度に基づく特徴を抽出する。
擬似色機能の新たなサブセットを初めて使用します。
自動パイプラインを定義するために必要なすべてのステップについて,品質指標の選択,サンプリング手順,分類器の設定,モデル選択について論じる。
その結果,平均リコール0.48,平均精度0.86のアンサンブル分類器を15個のタイル上で構築した。
また、処理されたデータセットと候補rrlのカタログも利用できます。
おそらく最も興味深いのは、測光広帯域データに基づく分類の観点から、色はmlによる自動分類法で考慮すべきrrlの有意義な特徴型であることを示していることである。
また、テーブルと曲線のリコールと精度は、この高度に不均衡な問題に対する高品質な指標であると主張する。
さらに,VVVデータ集合について,人工的バランスの低いサンプルよりも,元の分布を用いることが重要であることを示す。
最後に,アンサンブル分類器の使用が重要なモデル選択ステップの解決に寄与することを示すとともに,rrlの同定における誤りのほとんどは,あるソースの低品質な観測や,その日付が与えられたrrl-cタイプの解決の難しさと関連していることを示す。
関連論文リスト
- BanditCAT and AutoIRT: Machine Learning Approaches to Computerized Adaptive Testing and Item Calibration [7.261063083251448]
本稿では,少数の応答を持つ大規模コンピュータ適応テスト(CAT)の校正と管理を行うための完全なフレームワークを提案する。
自動機械学習(AutoML)とアイテム応答理論(IRT)を組み合わせた新しい手法であるAutoIRTを使用している。
我々は、コンテキスト的バンディットフレームワークに問題をキャストし、アイテム応答理論(IRT)を利用する手法であるBanditCATフレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-28T13:54:10Z) - Truncating Trajectories in Monte Carlo Policy Evaluation: an Adaptive Approach [51.76826149868971]
モンテカルロシミュレーションによる政策評価は多くのMC強化学習(RL)アルゴリズムの中核にある。
本研究では,異なる長さの軌跡を用いた回帰推定器の平均二乗誤差のサロゲートとして品質指標を提案する。
本稿では,Robust and Iterative Data Collection Strategy Optimization (RIDO) という適応アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-10-17T11:47:56Z) - A semi-supervised learning using over-parameterized regression [0.0]
半教師付き学習(SSL)は機械学習において重要なテーマである。
本稿では,未ラベルサンプルに関する情報をカーネル関数に組み込む手法を提案する。
論文 参考訳(メタデータ) (2024-09-06T03:05:35Z) - Data Selection for Language Models via Importance Resampling [90.9263039747723]
我々は、望まれるターゲット分布に合わせるために、大規模な未ラベルデータセットのサブセットを選択するという問題を形式化する。
我々は、LMデータ選択のために低次元で使用される古典的な重要度再サンプリング手法を拡張した。
DSIRフレームワークをhash n-gram機能でインスタンス化し、4.5時間で1億のドキュメントを選択できる。
論文 参考訳(メタデータ) (2023-02-06T23:57:56Z) - Nearly Minimax Optimal Reinforcement Learning for Linear Markov Decision
Processes [80.89852729380425]
そこで本研究では,最小限の最小残差である$tilde O(dsqrtH3K)$を計算効率よく実現したアルゴリズムを提案する。
我々の研究は線形 MDP を用いた最適 RL に対する完全な答えを提供する。
論文 参考訳(メタデータ) (2022-12-12T18:58:59Z) - Primal Estimated Subgradient Solver for SVM for Imbalanced
Classification [0.0]
我々は,PEGASOS SVMが8.6:1から130:1までのマイノリティ比に大きく依存する不均衡データセットに対して,優れた性能を達成できることを実証することを目的とする。
学習曲線を調べて評価する。
PEGASOS Cost-Sensitive SVM's results of Ding's LINEAR SVM DECIDL method。
論文 参考訳(メタデータ) (2022-06-19T02:33:14Z) - An Experimental Design Perspective on Model-Based Reinforcement Learning [73.37942845983417]
環境からの状態遷移を観察するのは費用がかかる。
標準RLアルゴリズムは通常、学習するために多くの観測を必要とする。
本稿では,マルコフ決定過程について,状態-作用対がどの程度の情報を提供するかを定量化する獲得関数を提案する。
論文 参考訳(メタデータ) (2021-12-09T23:13:57Z) - SreaMRAK a Streaming Multi-Resolution Adaptive Kernel Algorithm [60.61943386819384]
既存のKRRの実装では、すべてのデータがメインメモリに格納される必要がある。
KRRのストリーミング版であるStreaMRAKを提案する。
本稿では,2つの合成問題と2重振り子の軌道予測について紹介する。
論文 参考訳(メタデータ) (2021-08-23T21:03:09Z) - A Wasserstein Minimax Framework for Mixed Linear Regression [69.40394595795544]
マルチモーダル分布は、学習タスクにおいてクラスタ化されたデータをモデル化するために一般的に使用される。
混合線形回帰問題に対する最適輸送ベースフレームワークを提案する。
論文 参考訳(メタデータ) (2021-06-14T16:03:51Z) - Drifting Features: Detection and evaluation in the context of automatic
RRLs identification in VVV [0.0]
本稿では,データ特徴量で測定した特性の小さな変化に関連したドリフト特徴の概念について紹介し,考察する。
本手法は, 情報源の起源のタイルに関する有用な情報を含む特徴の減少セットを効率的に同定できることを示した。
論文 参考訳(メタデータ) (2021-05-04T19:07:32Z) - Robusta: Robust AutoML for Feature Selection via Reinforcement Learning [24.24652530951966]
強化学習(RL)に基づく初の堅牢なAutoMLフレームワークRobostaを提案します。
このフレームワークは,良性サンプルの競争精度を維持しつつ,モデルロバスト性を最大22%向上させることができることを示す。
論文 参考訳(メタデータ) (2021-01-15T03:12:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。