論文の概要: ConBatch-BAL: Batch Bayesian Active Learning under Budget Constraints
- arxiv url: http://arxiv.org/abs/2507.04929v1
- Date: Mon, 07 Jul 2025 12:25:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-08 15:46:35.411902
- Title: ConBatch-BAL: Batch Bayesian Active Learning under Budget Constraints
- Title(参考訳): ConBatch-BAL:予算制約下でのバッチベイズアクティブラーニング
- Authors: Pablo G. Morato, Charalampos P. Andriotis, Seyran Khademi,
- Abstract要約: 本研究は,制約下でのバッチ取得のためのベイズ的アクティブラーニング戦略を2つ導入する(ConBatch-BAL)。
戦略は、2つの実世界のデータセットのランダムな取得ベースラインに対してベンチマークされる。
その結果,開発したConBatch-BAL戦略により,実環境におけるアクティブな学習イテレーションとデータ取得コストを削減できることが示唆された。
- 参考スコア(独自算出の注目度): 1.4678959818041628
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Varying annotation costs among data points and budget constraints can hinder the adoption of active learning strategies in real-world applications. This work introduces two Bayesian active learning strategies for batch acquisition under constraints (ConBatch-BAL), one based on dynamic thresholding and one following greedy acquisition. Both select samples using uncertainty metrics computed via Bayesian neural networks. The dynamic thresholding strategy redistributes the budget across the batch, while the greedy one selects the top-ranked sample at each step, limited by the remaining budget. Focusing on scenarios with costly data annotation and geospatial constraints, we also release two new real-world datasets containing geolocated aerial images of buildings, annotated with energy efficiency or typology classes. The ConBatch-BAL strategies are benchmarked against a random acquisition baseline on these datasets under various budget and cost scenarios. The results show that the developed ConBatch-BAL strategies can reduce active learning iterations and data acquisition costs in real-world settings, and even outperform the unconstrained baseline solutions.
- Abstract(参考訳): データポイント間のアノテーションのコストと予算の制約は、現実世界のアプリケーションでアクティブな学習戦略の採用を妨げる可能性がある。
本研究では,制約下でのバッチ取得(ConBatch-BAL)のための2つのベイズ的アクティブラーニング戦略を紹介する。
どちらもベイジアンニューラルネットワークによって計算された不確実性メトリクスを使用したサンプルである。
動的しきい値付け戦略は、バッチ全体で予算を再分配し、グレディ戦略は、残りの予算によって制限された各ステップで上位のサンプルを選択する。
コストのかかるデータアノテーションと地理空間制約のあるシナリオに着目し、我々はまた、エネルギー効率やタイポロジーのクラスを付加した、建物の位置決めされた空中画像を含む2つの新しい実世界のデータセットもリリースした。
ConBatch-BAL戦略は、さまざまな予算とコストシナリオの下で、これらのデータセットのランダムな取得ベースラインに対してベンチマークされる。
その結果,開発したConBatch-BAL戦略は,実環境におけるアクティブな学習イテレーションやデータ取得コストを低減し,制約のないベースラインソリューションよりも優れることがわかった。
関連論文リスト
- Cohort-Based Active Modality Acquisition [0.27271717351505986]
本稿では,コホートに基づくアクティブモダリティ獲得 (CAMA) を導入し,追加のモダリティを受けるサンプルを選択する際の課題を定式化する。
生成的計算と識別的モデリングを組み合わせた獲得戦略を導出する。
共用マルチモーダルデータセットの実験により,提案手法が新たなサンプルの獲得をより効果的に導くことを示す。
論文 参考訳(メタデータ) (2025-05-22T15:32:50Z) - Cost-Aware Query Policies in Active Learning for Efficient Autonomous Robotic Exploration [0.0]
本稿では,動作コストを考慮しつつ,ガウス過程回帰のためのALアルゴリズムを解析する。
距離制約を持つ伝統的な不確実性計量は、軌道距離上のルート平均二乗誤差を最小化する。
論文 参考訳(メタデータ) (2024-10-31T18:35:03Z) - Provably Efficient Exploration in Inverse Constrained Reinforcement Learning [12.178081346315523]
逆制約強化学習(Inverse Constrained Reinforcement Learning)は、複雑な環境で実現可能な制約を回復するための一般的な解法である。
本稿では,このギャップを埋めるため,効率的なサンプリングを行うための戦略的探索フレームワークを提案する。
効率的な制約推論を実現するための探索アルゴリズムを2つ導入する。
論文 参考訳(メタデータ) (2024-09-24T10:48:13Z) - Minimax and Communication-Efficient Distributed Best Subset Selection with Oracle Property [0.358439716487063]
大規模データの爆発はシングルマシンシステムの処理能力を上回っている。
分散推論への伝統的なアプローチは、高次元データセットにおいて真の疎性を達成するのにしばしば苦労する。
そこで本稿では,これらの問題に対処する2段階分散ベストサブセット選択アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-08-30T13:22:08Z) - Decentralized Learning Strategies for Estimation Error Minimization with Graph Neural Networks [94.2860766709971]
統計的に同一性を持つ無線ネットワークにおける自己回帰的マルコフ過程のサンプリングとリモート推定の課題に対処する。
我々のゴールは、分散化されたスケーラブルサンプリングおよび送信ポリシーを用いて、時間平均推定誤差と/または情報の年齢を最小化することである。
論文 参考訳(メタデータ) (2024-04-04T06:24:11Z) - Scalable Online Exploration via Coverability [45.66375686120087]
探索は、特に関数近似を必要とする高次元領域において、強化学習において大きな課題である。
従来の探索手法を一般化し,3つの基本デシラタをサポートする新しい目的である$L_Coverageを導入する。
$L_Coverageは、カバー可能性の低いMDPにおけるオンライン(リワードフリーまたは報酬駆動)強化学習のための、最初の計算効率のよいモデルベースおよびモデルフリーのアルゴリズムを可能にする。
論文 参考訳(メタデータ) (2024-03-11T10:14:06Z) - Large-scale Fully-Unsupervised Re-Identification [78.47108158030213]
大規模未ラベルデータから学ぶための2つの戦略を提案する。
第1の戦略は、近傍関係に違反することなく、それぞれのデータセットサイズを減らすために、局所的な近傍サンプリングを行う。
第2の戦略は、低時間上限の複雑さを持ち、メモリの複雑さを O(n2) から O(kn) に k n で還元する新しい再帰的手法を利用する。
論文 参考訳(メタデータ) (2023-07-26T16:19:19Z) - Quantization for decentralized learning under subspace constraints [61.59416703323886]
エージェントがサブスペース制約を最小化するために個々のコスト関数を持つ分散最適化問題を考察する。
本稿では,エージェントが確率化量子化器を用いて推定値を圧縮する適応分散型戦略を提案し,検討する。
この分析は、量子化ノイズのいくつかの一般的な条件下では、平均二乗誤差と平均ビットレートの両方で戦略が安定であることを示している。
論文 参考訳(メタデータ) (2022-09-16T09:38:38Z) - Mining Drifting Data Streams on a Budget: Combining Active Learning with
Self-Labeling [6.436899373275926]
本稿では,アクティブラーニングと自己ラベルによる情報を組み合わせることで,ドリフトするデータストリームを予算でマイニングする新しいフレームワークを提案する。
我々は,概念ドリフトの可能性を考慮して,インテリジェントなインスタンス選択と半教師付き手順の両方を活用できる戦略をいくつか導入する。
論文 参考訳(メタデータ) (2021-12-21T07:19:35Z) - Semi-supervised Batch Active Learning via Bilevel Optimization [89.37476066973336]
両レベル最適化によるデータ要約問題として,本手法を定式化する。
本手法は,ラベル付きサンプルがほとんど存在しない場合,レジーム内のキーワード検出タスクにおいて極めて有効であることを示す。
論文 参考訳(メタデータ) (2020-10-19T16:53:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。