Fugu-MT 論文翻訳(概要): Corruption Robust Active Learning

論文の概要: Corruption Robust Active Learning

arxiv url: http://arxiv.org/abs/2106.11220v1
Date: Mon, 21 Jun 2021 16:06:38 GMT
ステータス: 翻訳完了
システム内更新日: 2021-06-22 16:04:54.299926
Title: Corruption Robust Active Learning
Title（参考訳）: 破壊ロバスト能動的学習
Authors: Yifang Chen, Simon S. Du, Kevin Jamieson
Abstract要約: 我々は、未知の逆ラベル汚職下でのバイナリ分類のためのストリーミングに基づくアクティブラーニングに関する理論的研究を行う。本稿では, 従来のロバストCALフレームワークは, 破損しない場合と同様のラベル複雑性を保証できることを示す。本稿では, 汚職の有無を仮定することなく, 確実に正しい新しいアルゴリズムを提案する。
参考スコア（独自算出の注目度）: 43.279169081740726
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We conduct theoretical studies on streaming-based active learning for binary classification under unknown adversarial label corruptions. In this setting, every time before the learner observes a sample, the adversary decides whether to corrupt the label or not. First, we show that, in a benign corruption setting (which includes the misspecification setting as a special case), with a slight enlargement on the hypothesis elimination threshold, the classical RobustCAL framework can (surprisingly) achieve nearly the same label complexity guarantee as in the non-corrupted setting. However, this algorithm can fail in the general corruption setting. To resolve this drawback, we propose a new algorithm which is provably correct without any assumptions on the presence of corruptions. Furthermore, this algorithm enjoys the minimax label complexity in the non-corrupted setting (which is achieved by RobustCAL) and only requires $\tilde{\mathcal{O}}(C_{\mathrm{total}})$ additional labels in the corrupted setting to achieve $\mathcal{O}(\varepsilon + \frac{C_{\mathrm{total}}}{n})$, where $\varepsilon$ is the target accuracy, $C_{\mathrm{total}}$ is the total number of corruptions and $n$ is the total number of unlabeled samples.
Abstract（参考訳）: 未知のラベル破壊下での2値分類のためのストリーミングベースのアクティブラーニングに関する理論的研究を行う。この設定では、学習者がサンプルを観察するたびに、相手はラベルを破損するか否かを判定する。まず,不正な腐敗設定(特別な場合として誤特定設定を含む)において,仮説除去閾値をわずかに拡大することで,古典的ロバストカルフレームワークが(当然のことながら)非腐敗設定とほぼ同じラベル複雑性保証を達成できることを示す。しかし、このアルゴリズムは一般的な腐敗設定では失敗する可能性がある。この欠点を解決するために, 汚職の有無を仮定することなく, 確実に正しいアルゴリズムを提案する。さらに、このアルゴリズムは分解されていない設定(ロバストカルによって達成される)におけるminimaxラベルの複雑さを享受し、破損した設定で$\mathcal{o}(\varepsilon + \frac{c_{\mathrm{total}}}{n})$を達成するために$\tilde{\mathcal{o}}(c_{\mathrm{total}})$を追加するだけで$\mathcal{o}(\varepsilon + \frac{c_{\mathrm{total}}}{n})$となる。

関連論文リスト

Unconstrained Robust Online Convex Optimization [38.9652176513385]
私たちは、アルゴリズムが低い後悔を保たなければならないという困難な「制約のない」設定に焦点を合わせます。我々のアルゴリズムは、$G ge max_t |g_t|$ が知られているときに |u|G (sqrtT + k) $ を許す。
論文参考訳（メタデータ） (2025-06-15T09:21:15Z)
Bandit Multiclass List Classification [28.483435983018616]
入力例を$K$のラベル集合のサブセットにマッピングする(セミバンドフィードバック)マルチクラスリスト分類の問題について検討する。我々の主な結果は、$(varepsilon,delta)$-PACの変種であり、そこでは、$varepsilon$-Optimal仮説を返すアルゴリズムを設計する。
論文参考訳（メタデータ） (2025-02-13T12:13:25Z)
Corruption-Robust Offline Reinforcement Learning with General Function Approximation [60.91257031278004]
一般関数近似を用いたオフライン強化学習(RL)における劣化問題について検討する。我々のゴールは、崩壊しないマルコフ決定プロセス(MDP)の最適方針に関して、このような腐敗に対して堅牢で、最適でないギャップを最小限に抑える政策を見つけることである。
論文参考訳（メタデータ） (2023-10-23T04:07:26Z)
Corruption-Robust Algorithms with Uncertainty Weighting for Nonlinear Contextual Bandits and Markov Decision Processes [59.61248760134937]
本稿では,$tildeO(sqrtT+zeta)$を後悔するアルゴリズムを提案する。提案アルゴリズムは、最近開発された線形文脈帯域からの不確実性重み付き最小二乗回帰に依存する。本稿では,提案アルゴリズムをエピソディックなMDP設定に一般化し,まず汚職レベル$zeta$への付加的依存を実現する。
論文参考訳（メタデータ） (2022-12-12T15:04:56Z)
Minimax Rates for Robust Community Detection [19.229475414802213]
逆ノードの破損を伴うブロックモデルにおけるコミュニティ検出の問題点について検討する。我々の主な結果は、$epsilon$-fraction of corruption and unbounded error $O(epsilon) + e-fracC2 (1 pm o(1))$ where $C = (sqrta - sqrtb)2$ is the signal-to-noise ratio。アルゴリズムがさらに機能するという意味では、我々のアルゴリズムは2倍に損なわれていることを示す。
論文参考訳（メタデータ） (2022-07-25T04:45:16Z)
Nearly Optimal Algorithms for Linear Contextual Bandits with Adversarial Corruptions [98.75618795470524]
本稿では,敵対的腐敗の存在下での線形文脈的包帯問題について検討する。我々は不確実性に直面した楽観主義の原理に基づく新しいアルゴリズムを提案する。
論文参考訳（メタデータ） (2022-05-13T17:58:58Z)
A Robust Phased Elimination Algorithm for Corruption-Tolerant Gaussian Process Bandits [118.22458816174144]
そこで本稿では,エポックで動作するロバストな除去型アルゴリズムを提案し,探索と頻繁な切替を併用して,小さなアクションサブセットを選択し,各アクションを複数タイミングで実行する。我々のアルゴリズムであるGP Robust Phased Elimination (RGP-PE) は、探索とエクスプロイトによる汚職に対するロバストネスのバランスに成功している。 GPバンディット設定におけるロバスト性の最初の実証的研究を行い,アルゴリズムが様々な敵攻撃に対してロバストであることを示す。
論文参考訳（メタデータ） (2022-02-03T21:19:36Z)
Linear Contextual Bandits with Adversarial Corruptions [91.38793800392108]
本稿では,敵対的腐敗の存在下での線形文脈的包帯問題について検討する。逆汚染レベルに適応する分散認識アルゴリズムをC$で提案する。
論文参考訳（メタデータ） (2021-10-25T02:53:24Z)
Improved Corruption Robust Algorithms for Episodic Reinforcement Learning [43.279169081740726]
基礎システムの報酬と遷移確率の両方において,未知の敵的腐敗下でのエピソディック強化学習について検討した。既存の結果と比較して、総汚職の点で厳密により良い後悔の境界を達成する新しいアルゴリズムを提案します。その結果、汚職防止政策のメタアルゴリズムとプラグインフリーのサブアルゴリズムを組み合わせた一般的なアルゴリズムフレームワークが得られた。
論文参考訳（メタデータ） (2021-02-13T07:04:23Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。