論文の概要: Adaptive Active Learning for Regression via Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2603.10435v1
- Date: Wed, 11 Mar 2026 05:33:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-12 16:22:32.792762
- Title: Adaptive Active Learning for Regression via Reinforcement Learning
- Title(参考訳): 強化学習による回帰学習のための適応型能動学習
- Authors: Simon D. Nguyen, Troy Russo, Kentaro Hoffman, Tyler H. McCormick,
- Abstract要約: レグレッションのためのアクティブラーニングは、最も有益なサンプルを選択することでラベリングコストを削減する。
We proposeed improve Greedy Smpling (WiGS)。
WiGSはiGSや他のベースライン法を精度とラベルの効率の両方で上回る。
- 参考スコア(独自算出の注目度): 0.9566312408744934
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Active learning for regression reduces labeling costs by selecting the most informative samples. Improved Greedy Sampling is a prominent method that balances feature-space diversity and output-space uncertainty using a static, multiplicative rule. We propose Weighted improved Greedy Sampling (WiGS), which replaces this framework with a dynamic, additive criterion. We formulate weight selection as a reinforcement learning problem, enabling an agent to adapt the exploration-investigation balance throughout learning. Experiments on 18 benchmark datasets and a synthetic environment show WiGS outperforms iGS and other baseline methods in both accuracy and labeling efficiency, particularly in domains with irregular data density where the baseline's multiplicative rule ignores high-error samples in dense regions.
- Abstract(参考訳): レグレッションのためのアクティブラーニングは、最も有益なサンプルを選択することでラベリングコストを削減する。
改良されたグレディサンプリングは、静的な乗法則を用いて特徴空間の多様性と出力空間の不確実性をバランスさせる顕著な手法である。
Weighted Improvement Greedy Sampling (WiGS) を提案する。
重み選択を強化学習問題として定式化し、エージェントが学習を通して探索・調査バランスに適応できるようにする。
18のベンチマークデータセットと合成環境の実験では、WiGSがiGSや他のベースラインメソッドを精度とラベル付けの効率の両方で上回っている。
関連論文リスト
- FedAWA: Adaptive Optimization of Aggregation Weights in Federated Learning Using Client Vectors [50.131271229165165]
Federated Learning (FL)は、分散機械学習のための有望なフレームワークとして登場した。
ユーザの行動、好み、デバイス特性の相違から生じるデータの異質性は、連合学習にとって重要な課題である。
本稿では,学習過程におけるクライアントベクトルに基づくアダプティブ重み付けを適応的に調整する手法であるAdaptive Weight Aggregation (FedAWA)を提案する。
論文 参考訳(メタデータ) (2025-03-20T04:49:40Z) - Few-Shot Learning with Adaptive Weight Masking in Conditional GANs [2.4299671488193497]
本稿では,Residual Weight Masking Conditional Generative Adversarial Network (RWM-CGAN) をデータ拡張に用いることにより,少数ショット学習への新たなアプローチを提案する。
提案モデルは,ネットワーク深度とサンプル品質を向上させるため,ジェネレータ内の残留ユニットを統合し,識別器の重みマスク正則化手法と組み合わせて,小サンプルカテゴリの特徴学習を改善する。
論文 参考訳(メタデータ) (2024-12-04T08:10:48Z) - Transformer-Driven Active Transfer Learning for Cross-Hyperspectral Image Classification [3.087068801861429]
ハイパースペクトル画像(HSI)分類は、高スペクトル次元、重要な領域シフト、ラベル付きデータの可用性の制限による固有の課題を示す。
本稿では,空間スペクトル変換器(SST)のバックボーン上に構築された,新しいアクティブトランスファー学習(ATL)フレームワークを提案する。
このフレームワークは多段階移動学習と不確実性多様性駆動型能動学習機構を統合する。
論文 参考訳(メタデータ) (2024-11-27T07:53:39Z) - Uncertainty Aware Learning for Language Model Alignment [97.36361196793929]
異なるタスクシナリオのモデルアライメントを改善するために,不確実性認識学習(UAL)を提案する。
トレーニングのラベルの平滑化値を個々のサンプルの不確実性に応じて適応的に設定する。
広く使われているベンチマーク実験では、我々のUALは標準教師あり微調整よりも著しく優れています。
論文 参考訳(メタデータ) (2024-06-07T11:37:45Z) - Take the Bull by the Horns: Hard Sample-Reweighted Continual Training
Improves LLM Generalization [165.98557106089777]
大きな言語モデル(LLM)の能力を高めることが大きな課題だ。
本研究は,従来の事前学習データセットを用いたLCMの光連続訓練に関する実証的戦略から始まった。
次に、この戦略をインスタンス重み付け分散ロバスト最適化の原則化されたフレームワークに定式化します。
論文 参考訳(メタデータ) (2024-02-22T04:10:57Z) - Boosting Differentiable Causal Discovery via Adaptive Sample Reweighting [62.23057729112182]
異なるスコアに基づく因果探索法は観測データから有向非巡回グラフを学習する。
本稿では,Reweighted Score関数ReScoreの適応重みを動的に学習することにより因果発見性能を向上させるためのモデルに依存しないフレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-06T14:49:59Z) - ALLSH: Active Learning Guided by Local Sensitivity and Hardness [98.61023158378407]
本稿では,局所感度と硬度認識獲得機能を備えたラベル付きサンプルの検索を提案する。
本手法は,様々な分類タスクにおいてよく用いられるアクティブラーニング戦略よりも一貫した利得が得られる。
論文 参考訳(メタデータ) (2022-05-10T15:39:11Z) - Reprint: a randomized extrapolation based on principal components for data augmentation [19.797216197418926]
本稿では,不均衡なデータ分類のための,シンプルで効果的な隠れ空間データ拡張手法を提案する。
各クラス内のサンプルの隠れスペース表現を与えられたREPRINTは、ランダムな方法で、ターゲットクラスの拡張例を外挿する。
この方法は、拡張例のために新しい軟質ラベルを合成できるラベル改質成分を含む。
論文 参考訳(メタデータ) (2022-04-26T01:38:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。