論文の概要: Corruption Robust Active Learning
- arxiv url: http://arxiv.org/abs/2106.11220v1
- Date: Mon, 21 Jun 2021 16:06:38 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-22 16:04:54.299926
- Title: Corruption Robust Active Learning
- Title(参考訳): 破壊ロバスト能動的学習
- Authors: Yifang Chen, Simon S. Du, Kevin Jamieson
- Abstract要約: 我々は、未知の逆ラベル汚職下でのバイナリ分類のためのストリーミングに基づくアクティブラーニングに関する理論的研究を行う。
本稿では, 従来のロバストCALフレームワークは, 破損しない場合と同様のラベル複雑性を保証できることを示す。
本稿では, 汚職の有無を仮定することなく, 確実に正しい新しいアルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 43.279169081740726
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We conduct theoretical studies on streaming-based active learning for binary
classification under unknown adversarial label corruptions. In this setting,
every time before the learner observes a sample, the adversary decides whether
to corrupt the label or not. First, we show that, in a benign corruption
setting (which includes the misspecification setting as a special case), with a
slight enlargement on the hypothesis elimination threshold, the classical
RobustCAL framework can (surprisingly) achieve nearly the same label complexity
guarantee as in the non-corrupted setting. However, this algorithm can fail in
the general corruption setting. To resolve this drawback, we propose a new
algorithm which is provably correct without any assumptions on the presence of
corruptions. Furthermore, this algorithm enjoys the minimax label complexity in
the non-corrupted setting (which is achieved by RobustCAL) and only requires
$\tilde{\mathcal{O}}(C_{\mathrm{total}})$ additional labels in the corrupted
setting to achieve $\mathcal{O}(\varepsilon + \frac{C_{\mathrm{total}}}{n})$,
where $\varepsilon$ is the target accuracy, $C_{\mathrm{total}}$ is the total
number of corruptions and $n$ is the total number of unlabeled samples.
- Abstract(参考訳): 未知のラベル破壊下での2値分類のためのストリーミングベースのアクティブラーニングに関する理論的研究を行う。
この設定では、学習者がサンプルを観察するたびに、相手はラベルを破損するか否かを判定する。
まず,不正な腐敗設定(特別な場合として誤特定設定を含む)において,仮説除去閾値をわずかに拡大することで,古典的ロバストカルフレームワークが(当然のことながら)非腐敗設定とほぼ同じラベル複雑性保証を達成できることを示す。
しかし、このアルゴリズムは一般的な腐敗設定では失敗する可能性がある。
この欠点を解決するために, 汚職の有無を仮定することなく, 確実に正しいアルゴリズムを提案する。
さらに、このアルゴリズムは分解されていない設定(ロバストカルによって達成される)におけるminimaxラベルの複雑さを享受し、破損した設定で$\mathcal{o}(\varepsilon + \frac{c_{\mathrm{total}}}{n})$を達成するために$\tilde{\mathcal{o}}(c_{\mathrm{total}})$を追加するだけで$\mathcal{o}(\varepsilon + \frac{c_{\mathrm{total}}}{n})$となる。
関連論文リスト
- Bandit Multiclass List Classification [28.483435983018616]
入力例を$K$のラベル集合のサブセットにマッピングする(セミバンドフィードバック)マルチクラスリスト分類の問題について検討する。
我々の主な結果は、$(varepsilon,delta)$-PACの変種であり、そこでは、$varepsilon$-Optimal仮説を返すアルゴリズムを設計する。
論文 参考訳(メタデータ) (2025-02-13T12:13:25Z) - Corruption-Robust Offline Reinforcement Learning with General Function
Approximation [60.91257031278004]
一般関数近似を用いたオフライン強化学習(RL)における劣化問題について検討する。
我々のゴールは、崩壊しないマルコフ決定プロセス(MDP)の最適方針に関して、このような腐敗に対して堅牢で、最適でないギャップを最小限に抑える政策を見つけることである。
論文 参考訳(メタデータ) (2023-10-23T04:07:26Z) - Corruption-Robust Algorithms with Uncertainty Weighting for Nonlinear
Contextual Bandits and Markov Decision Processes [59.61248760134937]
本稿では,$tildeO(sqrtT+zeta)$を後悔するアルゴリズムを提案する。
提案アルゴリズムは、最近開発された線形文脈帯域からの不確実性重み付き最小二乗回帰に依存する。
本稿では,提案アルゴリズムをエピソディックなMDP設定に一般化し,まず汚職レベル$zeta$への付加的依存を実現する。
論文 参考訳(メタデータ) (2022-12-12T15:04:56Z) - Minimax Rates for Robust Community Detection [19.229475414802213]
逆ノードの破損を伴うブロックモデルにおけるコミュニティ検出の問題点について検討する。
我々の主な結果は、$epsilon$-fraction of corruption and unbounded error $O(epsilon) + e-fracC2 (1 pm o(1))$ where $C = (sqrta - sqrtb)2$ is the signal-to-noise ratio。
アルゴリズムがさらに機能するという意味では、我々のアルゴリズムは2倍に損なわれていることを示す。
論文 参考訳(メタデータ) (2022-07-25T04:45:16Z) - Nearly Optimal Algorithms for Linear Contextual Bandits with Adversarial
Corruptions [98.75618795470524]
本稿では,敵対的腐敗の存在下での線形文脈的包帯問題について検討する。
我々は不確実性に直面した楽観主義の原理に基づく新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-05-13T17:58:58Z) - A Robust Phased Elimination Algorithm for Corruption-Tolerant Gaussian
Process Bandits [118.22458816174144]
そこで本稿では,エポックで動作するロバストな除去型アルゴリズムを提案し,探索と頻繁な切替を併用して,小さなアクションサブセットを選択し,各アクションを複数タイミングで実行する。
我々のアルゴリズムであるGP Robust Phased Elimination (RGP-PE) は、探索とエクスプロイトによる汚職に対するロバストネスのバランスに成功している。
GPバンディット設定におけるロバスト性の最初の実証的研究を行い,アルゴリズムが様々な敵攻撃に対してロバストであることを示す。
論文 参考訳(メタデータ) (2022-02-03T21:19:36Z) - Linear Contextual Bandits with Adversarial Corruptions [91.38793800392108]
本稿では,敵対的腐敗の存在下での線形文脈的包帯問題について検討する。
逆汚染レベルに適応する分散認識アルゴリズムをC$で提案する。
論文 参考訳(メタデータ) (2021-10-25T02:53:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。