論文の概要: Active Learning for Planet Habitability Classification under Extreme Class Imbalance
- arxiv url: http://arxiv.org/abs/2602.23666v1
- Date: Fri, 27 Feb 2026 04:18:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-02 19:48:24.24798
- Title: Active Learning for Planet Habitability Classification under Extreme Class Imbalance
- Title(参考訳): 極クラス不均衡下における惑星の居住可能性分類のためのアクティブラーニング
- Authors: R. I. El-Kholy, Z. M. Hayman,
- Abstract要約: 我々は、Habitable World CatalogとNASA Exoplanet Archiveから統合されたデータセットを構築した。
希少な潜在的に居住可能な惑星の同定を優先するために、リコールのために監督されたベースラインが確立され、最適化されている。
アクティブな学習は、教師付きパフォーマンスにアプローチするのに必要なラベル付きインスタンスの数を大幅に削減する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The increasing size and heterogeneity of exoplanet catalogs have made systematic habitability assessment challenging, particularly given the extreme scarcity of potentially habitable planets and the evolving nature of their labels. In this study, we explore the use of pool-based active learning to improve the efficiency of habitability classification under realistic observational constraints. We construct a unified dataset from the Habitable World Catalog and the NASA Exoplanet Archive and formulate habitability assessment as a binary classification problem. A supervised baseline based on gradient-boosted decision trees is established and optimized for recall in order to prioritize the identification of rare potentially habitable planets. This model is then embedded within an active learning framework, where uncertainty-based margin sampling is compared against random querying across multiple runs and labeling budgets. We find that active learning substantially reduces the number of labeled instances required to approach supervised performance, demonstrating clear gains in label efficiency. To connect these results to a practical astronomical use case, we aggregate predictions from independently trained active-learning models into an ensemble and use the resulting mean probabilities and uncertainties to rank planets originally labeled as non-habitable. This procedure identifies a single robust candidate for further study, illustrating how active learning can support conservative, uncertainty-aware prioritization of follow-up targets rather than speculative reclassification. Our results indicate that active learning provides a principled framework for guiding habitability studies in data regimes characterized by label imbalance, incomplete information, and limited observational resources.
- Abstract(参考訳): 太陽系外惑星カタログのサイズと不均一性の増加は、特に潜在的に居住可能な惑星の極端な不足とそれらのラベルの進化の性質を考えると、体系的な居住性評価を困難にしている。
本研究では,プール型アクティブラーニングを用いて,現実的な観察制約下での居住可能性分類の効率化を図る。
我々は、ハビタブル世界カタログとNASA Exoplanet Archiveから統合されたデータセットを構築し、二項分類問題として居住性評価を定式化する。
希少な潜在的に居住可能な惑星の同定を優先するために、勾配型決定木に基づく教師付きベースラインを確立し、リコールに最適化する。
このモデルはアクティブな学習フレームワークに埋め込まれ、不確実性に基づくマージンサンプリングを複数の実行とラベル付け予算にわたるランダムクエリと比較する。
能動的学習は、教師付き性能にアプローチするために必要なラベル付きインスタンスの数を大幅に減らし、ラベル効率の明確な向上を示す。
これらの結果と実際の天文学的ユースケースを結びつけるため、独立に訓練されたアクティブラーニングモデルからの予測をアンサンブルに集約し、結果として得られた平均確率と不確実性を用いて、本来は居住不可能とラベル付けされた惑星のランク付けを行う。
この手法は,学習活動が投機的再分類よりも追跡対象の保守的で不確実性を考慮した優先順位付けをいかに支援できるかを考察し,さらなる研究のための単一の頑健な候補を特定する。
本研究は,ラベルの不均衡,不完全情報,限られた観測資源を特徴とするデータ体制における居住可能性研究の指針として,アクティブラーニングが基本的枠組みを提供することを示す。
関連論文リスト
- Orthogonal Activation with Implicit Group-Aware Bias Learning for Class Imbalance [1.2891210250935148]
クラス不均衡は、機械学習とデータマイニングにおいて一般的な課題である。
我々は、ディープラーニング分類器におけるクラス不均衡を軽減するために、OGABという新しいアクティベーション関数を提案する。
実世界および合成不均衡データセットにおける解の有効性を実証する。
論文 参考訳(メタデータ) (2025-12-23T03:05:25Z) - A Unified and Stable Risk Minimization Framework for Weakly Supervised Learning with Theoretical Guarantees [33.15955234458642]
完全かつ正確なラベルが取得にコストがかかる、あるいは不可能な場合には、完全に教師付き学習の代替として弱教師付き学習が実用化されている。
弱教師付きデータの構造に根ざした安定な代理リスクを定式化することにより、そのようなポストホック調整を回避できる、原則化された統一されたフレームワークを提案する。
論文 参考訳(メタデータ) (2025-11-28T00:57:04Z) - Stochastic Encodings for Active Feature Acquisition [100.47043816019888]
Active Feature Acquisitionは、インスタンスワイドでシーケンシャルな意思決定問題である。
目的は、テストインスタンスごとに独立して、現在の観測に基づいて計測する機能を動的に選択することである。
一般的なアプローチは強化学習(Reinforcement Learning)であり、トレーニングの困難を経験する。
我々は、教師付きで訓練された潜在変数モデルを導入し、潜在空間における観測不能な実現の可能性の多くにまたがる特徴を推論することで獲得する。
論文 参考訳(メタデータ) (2025-08-03T23:48:46Z) - Probably Approximately Precision and Recall Learning [60.00180898830079]
機械学習における重要な課題は、一方的なフィードバックの頻度である。
本稿では,確率的近似(PAC)フレームワークを導入し,各入力をラベルの集合にマッピングする仮説を定めている。
我々は、正のデータのみから学習する新しいアルゴリズムを開発し、実現可能な場合において最適なサンプル複雑性を実現する。
論文 参考訳(メタデータ) (2024-11-20T04:21:07Z) - ACTRESS: Active Retraining for Semi-supervised Visual Grounding [52.08834188447851]
前回の研究であるRefTeacherは、疑似自信と注意に基づく監督を提供するために教師学生の枠組みを採用することで、この課題に取り組むための最初の試みである。
このアプローチは、Transformerベースのパイプラインに従う現在の最先端のビジュアルグラウンドモデルと互換性がない。
本稿では, ACTRESS を略したセミスーパービジョン視覚グラウンドのためのアクティブ・リトレーニング手法を提案する。
論文 参考訳(メタデータ) (2024-07-03T16:33:31Z) - Selective Attention-based Modulation for Continual Learning [22.753447801423366]
本稿では,生物学的に評価可能な注意誘導変調手法を提案し,連続的な学習環境における分類モデルを強化する。
我々は,非I.D.分類タスクのシーケンスの学習を駆動し,安定化させる変調信号として,補助塩分率予測機能を用いる。
注意に基づく変調は、刺激的な特徴の存在に対してより堅牢な特徴の学習を成功させることを示す。
論文 参考訳(メタデータ) (2024-03-29T09:46:14Z) - BAL: Balancing Diversity and Novelty for Active Learning [53.289700543331925]
多様な不確実なデータのバランスをとるために適応的なサブプールを構築する新しいフレームワークであるBalancing Active Learning (BAL)を導入する。
我々のアプローチは、広く認識されているベンチマークにおいて、確立されたすべてのアクティブな学習方法より1.20%優れています。
論文 参考訳(メタデータ) (2023-12-26T08:14:46Z) - Class-Imbalanced Graph Learning without Class Rebalancing [62.1368829847041]
クラス不均衡は実世界のノード分類タスクでよく見られ、グラフ学習モデルには大きな課題がある。
本研究では、トポロジカルパラダイムからクラス不均衡バイアスの根本原因にアプローチする。
我々は,クラス再バランスを伴わずにクラス不均衡バイアスを軽減するために,軽量なトポロジカル拡張フレームワークであるBATを考案した。
論文 参考訳(メタデータ) (2023-08-27T19:01:29Z) - An Expanded Benchmark that Rediscovers and Affirms the Edge of Uncertainty Sampling for Active Learning in Tabular Datasets [22.01908989614291]
Active Learning (AL)は、マシンが戦略的クエリを通じてラベル付きサンプルを効率的に収集できるという重要な課題に対処する。
多くのAL戦略の中で、不確実性サンプリング(US)が最も広く採用されている。
アメリカよりも優れた代替案を示唆する文献の主張にもかかわらず、地域全体での受容はいまだにあり得ない。
論文 参考訳(メタデータ) (2023-06-15T08:47:50Z) - Neighbour Consistency Guided Pseudo-Label Refinement for Unsupervised
Person Re-Identification [80.98291772215154]
教師なしの人物再識別(ReID)は、アノテーションを使わずに人物検索のための識別的アイデンティティの特徴を学習することを目的としている。
近年の進歩はクラスタリングに基づく擬似ラベルを活用することで実現されている。
本稿では, Pseudo Label Refinement フレームワークを提案する。
論文 参考訳(メタデータ) (2022-11-30T09:39:57Z) - Responsible Active Learning via Human-in-the-loop Peer Study [88.01358655203441]
我々は,データプライバシを同時に保持し,モデルの安定性を向上させるために,Pear Study Learning (PSL) と呼ばれる責任あるアクティブラーニング手法を提案する。
まず,クラウドサイドのタスク学習者(教師)から未学習データを分離する。
トレーニング中、タスク学習者は軽量なアクティブ学習者に指示し、アクティブサンプリング基準に対するフィードバックを提供する。
論文 参考訳(メタデータ) (2022-11-24T13:18:27Z) - Consistency-Based Semi-supervised Evidential Active Learning for
Diagnostic Radiograph Classification [2.3545156585418328]
CSEAL(Consistency-based Semi-supervised Evidential Active Learning)フレームワークについて紹介する。
我々は、証拠理論と主観的論理に基づく予測の不確実性を利用して、エンドツーエンドの統合アプローチを開発する。
本手法は, ラベル付きサンプルを少なくして, より稀な異常の精度を大幅に向上させることができる。
論文 参考訳(メタデータ) (2022-09-05T09:28:31Z) - Ask-n-Learn: Active Learning via Reliable Gradient Representations for
Image Classification [29.43017692274488]
深い予測モデルは、ラベル付きトレーニングデータという形で人間の監督に依存する。
Ask-n-Learnは,各アルゴリズムで推定されたペスドラベルを用いて得られる勾配埋め込みに基づく能動的学習手法である。
論文 参考訳(メタデータ) (2020-09-30T05:19:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。