論文の概要: Imbalance Learning for Variable Star Classification
- arxiv url: http://arxiv.org/abs/2002.12386v1
- Date: Thu, 27 Feb 2020 19:01:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-28 09:34:17.270740
- Title: Imbalance Learning for Variable Star Classification
- Title(参考訳): 可変星分類のための不均衡学習
- Authors: Zafiirah Hosenie, Robert Lyon, Benjamin Stappers, Arrykrishna
Mootoovaloo and Vanessa McBride
- Abstract要約: 我々は,不均衡な学習問題を克服する階層型機械学習分類手法を開発した。
私たちは'データレベル'アプローチを使用して、トレーニングデータを直接拡張し、表現不足のクラスをよりよく記述します。
階層モデルで$texttGpFit$を使用すると,より高い分類率が得られることがわかった。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The accurate automated classification of variable stars into their respective
sub-types is difficult. Machine learning based solutions often fall foul of the
imbalanced learning problem, which causes poor generalisation performance in
practice, especially on rare variable star sub-types. In previous work, we
attempted to overcome such deficiencies via the development of a hierarchical
machine learning classifier. This 'algorithm-level' approach to tackling
imbalance, yielded promising results on Catalina Real-Time Survey (CRTS) data,
outperforming the binary and multi-class classification schemes previously
applied in this area. In this work, we attempt to further improve hierarchical
classification performance by applying 'data-level' approaches to directly
augment the training data so that they better describe under-represented
classes. We apply and report results for three data augmentation methods in
particular: $\textit{R}$andomly $\textit{A}$ugmented $\textit{S}$ampled
$\textit{L}$ight curves from magnitude $\textit{E}$rror ($\texttt{RASLE}$),
augmenting light curves with Gaussian Process modelling ($\texttt{GpFit}$) and
the Synthetic Minority Over-sampling Technique ($\texttt{SMOTE}$). When
combining the 'algorithm-level' (i.e. the hierarchical scheme) together with
the 'data-level' approach, we further improve variable star classification
accuracy by 1-4$\%$. We found that a higher classification rate is obtained
when using $\texttt{GpFit}$ in the hierarchical model. Further improvement of
the metric scores requires a better standard set of correctly identified
variable stars and, perhaps enhanced features are needed.
- Abstract(参考訳): 変光星のそれぞれのサブタイプへの正確な自動分類は困難である。
機械学習に基づくソリューションは、しばしば不均衡な学習問題に悪影響を及ぼし、特に希少な変光星サブタイプにおいて、実際的な一般化性能が低下する。
これまで我々は,階層型機械学習分類器の開発を通じて,そのような欠陥を克服しようと試みてきた。
この'algorithm-level'アプローチは、不均衡に取り組むために、カタリナリアルタイムサーベイ(crts)データに有望な結果をもたらし、この領域で以前適用されていたバイナリおよびマルチクラス分類スキームを上回った。
本研究では,学習データを直接強化するために「データレベル」アプローチを適用することにより,階層的分類性能をさらに向上させようとする。
例えば、$\textit{r}$andomly $\textit{a}$ugmented $\textit{s}$ampled $\textit{l}$ight curves from magnitude $\textit{e}$rror ($\texttt{rasle}$)、ガウス的プロセスモデリング($\texttt{gpfit}$)と合成的マイノリティオーバーサンプリング($\textt{smote}$)による光曲線の拡張である。
agorithm-level'(すなわち階層スキーム)と'data-level'アプローチを組み合わせることで、変光星の分類精度をさらに1-4$\%$向上させる。
階層モデルで$\texttt{GpFit}$を使用すると,より高い分類率が得られることがわかった。
測定値のさらなる改善には、正しく同定された変光星のより良い標準セットが必要である。
関連論文リスト
- Boosting Commit Classification with Contrastive Learning [0.8655526882770742]
コミット分類(CC)は、ソフトウェアのメンテナンスにおいて重要なタスクである。
対照的な学習に基づくコミット分類フレームワークを提案する。
われわれのフレームワークはCCの問題をシンプルに解決できるが、スプリットショットのシナリオでは効果的に解決できる。
論文 参考訳(メタデータ) (2023-08-16T10:02:36Z) - ProTeCt: Prompt Tuning for Taxonomic Open Set Classification [59.59442518849203]
分類学的オープンセット(TOS)設定では、ほとんどショット適応法はうまくいきません。
本稿では,モデル予測の階層的一貫性を校正する即時チューニング手法を提案する。
次に,階層整合性のための新しいPrompt Tuning(ProTeCt)手法を提案し,ラベル集合の粒度を分類する。
論文 参考訳(メタデータ) (2023-06-04T02:55:25Z) - Label-Retrieval-Augmented Diffusion Models for Learning from Noisy
Labels [61.97359362447732]
ノイズの多いラベルからの学習は、実際のアプリケーションのための機械学習において、重要かつ長年にわたる問題である。
本稿では,生成モデルの観点からラベルノイズ問題を再構成する。
我々のモデルは、標準的な実世界のベンチマークデータセットで新しいSOTA(State-of-the-art)結果を達成する。
論文 参考訳(メタデータ) (2023-05-31T03:01:36Z) - Resource saving taxonomy classification with k-mer distributions and
machine learning [2.0196229393131726]
我々はDNAから得られた$k$-merの分布を、その分類学的起源を分類するための特徴として用いることを提案する。
以上の結果から,本手法は属レベルでの分類を改良し,スーパーキングダムや植物レベルでの同等の結果が得られることが示された。
論文 参考訳(メタデータ) (2023-03-10T08:01:08Z) - Enhancing Classification with Hierarchical Scalable Query on Fusion
Transformer [0.4129225533930965]
本稿では,学習可能な独立クエリ埋め込みによる階層的手法により,きめ細かい分類を向上する手法を提案する。
階層構造の概念を利用して、あらゆるレベルにわたってスケーラブルなクエリの埋め込みを学びます。
本手法は, 細粒度分類において, 従来の手法よりも11%の精度で性能を向上できる。
論文 参考訳(メタデータ) (2023-02-28T11:00:55Z) - Learning Hierarchy Aware Features for Reducing Mistake Severity [3.704832909610283]
階層認識機能(HAF)を学習するための新しいアプローチを提案する。
HAFは、トップ1エラーを維持しながらミスを改善するトレーニングタイムアプローチであり、すべてのミスを平等に扱うクロスエントロピー損失の問題に対処する。
我々は,3つの階層的データセット上でHAFを評価し,iNaturalist-19およびCIFAR-100データセットの最先端結果を得た。
論文 参考訳(メタデータ) (2022-07-26T04:24:47Z) - Few-Shot Non-Parametric Learning with Deep Latent Variable Model [50.746273235463754]
遅延変数を用いた圧縮による非パラメトリック学習(NPC-LV)を提案する。
NPC-LVは、ラベルなしデータが多いがラベル付きデータはほとんどないデータセットの学習フレームワークである。
我々は,NPC-LVが低データ構造における画像分類における3つのデータセットの教師あり手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-06-23T09:35:03Z) - Self-Supervised Class Incremental Learning [51.62542103481908]
既存のクラスインクリメンタルラーニング(CIL)手法は、データラベルに敏感な教師付き分類フレームワークに基づいている。
新しいクラスデータに基づいて更新する場合、それらは破滅的な忘れがちである。
本稿では,SSCILにおける自己指導型表現学習のパフォーマンスを初めて考察する。
論文 参考訳(メタデータ) (2021-11-18T06:58:19Z) - Prototypical Classifier for Robust Class-Imbalanced Learning [64.96088324684683]
埋め込みネットワークに付加的なパラメータを必要としないtextitPrototypealを提案する。
プロトタイプは、訓練セットがクラス不均衡であるにもかかわらず、すべてのクラスに対してバランスと同等の予測を生成する。
我々は, CIFAR-10LT, CIFAR-100LT, Webvision のデータセットを用いて, プロトタイプが芸術の状況と比較した場合, サブスタンスの改善が得られることを検証した。
論文 参考訳(メタデータ) (2021-10-22T01:55:01Z) - Improving Calibration for Long-Tailed Recognition [68.32848696795519]
このようなシナリオにおけるキャリブレーションとパフォーマンスを改善する2つの方法を提案します。
異なるサンプルによるデータセットバイアスに対して,シフトバッチ正規化を提案する。
提案手法は,複数の長尾認識ベンチマークデータセットに新しいレコードをセットする。
論文 参考訳(メタデータ) (2021-04-01T13:55:21Z) - Scalable End-to-end Recurrent Neural Network for Variable star
classification [1.2722697496405464]
本稿では,光曲線の表現を自動的に学習し,正確な自動分類を可能にするエンドツーエンドアルゴリズムを提案する。
提案手法では,データ前処理の最小化,新しい観測および光曲線の計算コストの低減,大規模データセットへのスケールアップが可能となる。
論文 参考訳(メタデータ) (2020-02-03T19:56:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。