論文の概要: Boosting Active Learning via Improving Test Performance
- arxiv url: http://arxiv.org/abs/2112.05683v1
- Date: Fri, 10 Dec 2021 17:25:14 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-13 16:14:37.755288
- Title: Boosting Active Learning via Improving Test Performance
- Title(参考訳): テストパフォーマンス向上によるアクティブラーニングの促進
- Authors: Tianyang Wang, Xingjian Li, Pengkun Yang, Guosheng Hu, Xiangrui Zeng,
Siyu Huang, Cheng-Zhong Xu, Min Xu
- Abstract要約: 勾配ノルムの高いラベル付きデータを選択すると、テスト損失の上限が低くなることを示す。
本稿では,期待次数とエントロピー次数という2つのスキームを提案する。
本手法は最先端技術に対して優れた性能を発揮する。
- 参考スコア(独自算出の注目度): 35.9303900799961
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Central to active learning (AL) is what data should be selected for
annotation. Existing works attempt to select highly uncertain or informative
data for annotation. Nevertheless, it remains unclear how selected data impacts
the test performance of the task model used in AL. In this work, we explore
such an impact by theoretically proving that selecting unlabeled data of higher
gradient norm leads to a lower upper bound of test loss, resulting in a better
test performance. However, due to the lack of label information, directly
computing gradient norm for unlabeled data is infeasible. To address this
challenge, we propose two schemes, namely expected-gradnorm and
entropy-gradnorm. The former computes the gradient norm by constructing an
expected empirical loss while the latter constructs an unsupervised loss with
entropy. Furthermore, we integrate the two schemes in a universal AL framework.
We evaluate our method on classical image classification and semantic
segmentation tasks. To demonstrate its competency in domain applications and
its robustness to noise, we also validate our method on a cellular imaging
analysis task, namely cryo-Electron Tomography subtomogram classification.
Results demonstrate that our method achieves superior performance against the
state-of-the-art. Our source code is available at
https://github.com/xulabs/aitom
- Abstract(参考訳): 中心から活動的学習(AL)は、アノテーションのために選択すべきデータである。
既存の作品は、アノテーションのために非常に不確実または情報的なデータを選択しようとする。
それでも、選択されたデータがALで使用されるタスクモデルのテストパフォーマンスにどの程度影響するかは、まだ不明である。
本研究では,高い勾配ノルムのラベル付きデータを選択することにより,テスト損失の上限が低くなり,テスト性能が向上することが理論的に証明された。
しかしラベル情報がないため、ラベルなしデータの勾配ノルムを直接計算することは不可能である。
この課題に対処するため,我々は2つのスキーム,すなわちexpected-gradnormとentropy-gradnormを提案する。
前者は予測された経験的損失を構築して勾配ノルムを計算し、後者はエントロピーを伴う教師なし損失を構成する。
さらに,この2つのスキームを普遍的alフレームワークに統合する。
本手法は,古典的画像分類と意味セグメンテーションタスクについて評価する。
また,ドメイン応用におけるその能力と雑音に対するロバスト性を示すために,セルイメージング解析タスクであるクライオ電子トモグラフィサブトモグラム分類について検証を行った。
その結果,本手法は最先端技術に対して優れた性能が得られることがわかった。
ソースコードはhttps://github.com/xulabs/aitom.com/で入手できる。
関連論文リスト
- Mitigating Label Noise on Graph via Topological Sample Selection [72.86862597508077]
トポロジ情報を活用することで,グラフ内の情報的サンプル選択プロセスを促進できる$textitTopological Sample Selection$ (TSS)法を提案する。
提案手法は,対象のクリーン分布下での予測されるリスク上限の上限を最小化し,最先端のベースラインと比較して,提案手法の優位性を実験的に示す。
論文 参考訳(メタデータ) (2024-03-04T11:24:51Z) - XAL: EXplainable Active Learning Makes Classifiers Better Low-resource Learners [71.8257151788923]
低リソーステキスト分類のための新しい説明可能なアクティブラーニングフレームワーク(XAL)を提案する。
XALは分類器に対して、推論を正当化し、合理的な説明ができないラベルのないデータを掘り下げることを推奨している。
6つのデータセットの実験では、XALは9つの強いベースラインに対して一貫した改善を達成している。
論文 参考訳(メタデータ) (2023-10-09T08:07:04Z) - AnoRand: A Semi Supervised Deep Learning Anomaly Detection Method by
Random Labeling [0.0]
異常検出(英: Anomaly detection)またはより一般的には異常検出(英: outliers detection)は、理論的および応用機械学習において最も人気があり、課題の1つである。
我々は、ディープラーニングアーキテクチャとランダムな合成ラベル生成を組み合わせることで、textbfAnoRandと呼ばれる新しい半教師付き異常検出手法を提案する。
論文 参考訳(メタデータ) (2023-05-28T10:53:34Z) - Rethinking Precision of Pseudo Label: Test-Time Adaptation via
Complementary Learning [10.396596055773012]
本稿では,テスト時間適応性を高めるための新しい補完学習手法を提案する。
テスト時適応タスクでは、ソースドメインからの情報は通常利用できない。
我々は,相補ラベルのリスク関数がバニラ損失式と一致することを強調した。
論文 参考訳(メタデータ) (2023-01-15T03:36:33Z) - NorMatch: Matching Normalizing Flows with Discriminative Classifiers for
Semi-Supervised Learning [8.749830466953584]
Semi-Supervised Learning (SSL)は、小さなラベル付きセットと大量のラベルなしデータを使ってモデルを学習することを目的としている。
この作業では、NorMatchというSSLの新しいフレームワークを紹介します。
数値的および視覚的な結果を通して、NorMatchはいくつかのデータセットで最先端のパフォーマンスを達成することを実証する。
論文 参考訳(メタデータ) (2022-11-17T15:39:18Z) - CAFA: Class-Aware Feature Alignment for Test-Time Adaptation [50.26963784271912]
テスト時間適応(TTA)は、テスト時にラベルのないデータにモデルを適応させることによって、この問題に対処することを目的としている。
本稿では,クラス認識特徴アライメント(CAFA, Class-Aware Feature Alignment)と呼ばれる単純な機能アライメント損失を提案する。
論文 参考訳(メタデータ) (2022-06-01T03:02:07Z) - SLA$^2$P: Self-supervised Anomaly Detection with Adversarial
Perturbation [77.71161225100927]
異常検出は、機械学習の基本的な問題であるが、難しい問題である。
本稿では,非教師付き異常検出のための新しい強力なフレームワークであるSLA$2$Pを提案する。
論文 参考訳(メタデータ) (2021-11-25T03:53:43Z) - Highly Efficient Representation and Active Learning Framework for
Imbalanced Data and its Application to COVID-19 X-Ray Classification [0.7829352305480284]
胸部X線を分類するためのデータ効率の高い分類および能動的学習フレームワークを提案する。
これは(1)畳み込みニューラルネットワークの教師なし表現学習と(2)ガウス過程法に基づいている。
利用可能なラベルのトレーニングから正確性に到達するには、ラベル付きデータの10%の$simしか必要ありません。
論文 参考訳(メタデータ) (2021-02-25T02:48:59Z) - A Free Lunch for Unsupervised Domain Adaptive Object Detection without
Source Data [69.091485888121]
教師なしドメイン適応(unsupervised domain adaptation) ソースとターゲットのドメインデータは自由に利用でき、通常、ドメイン間のギャップを減らすために一緒に訓練される。
ノイズの多いラベルで学習する問題にモデル化することで,ソースデータのないドメイン適応オブジェクト検出(SFOD)フレームワークを提案する。
論文 参考訳(メタデータ) (2020-12-10T01:42:35Z) - Improving Generalization of Deep Fault Detection Models in the Presence
of Mislabeled Data [1.3535770763481902]
ラベルノイズを用いた頑健なトレーニングのための新しい2段階フレームワークを提案する。
最初のステップでは、仮説空間の更新に基づいて、外れ値(ラベルのつかないサンプルを含む)を識別する。
第2のステップでは、識別されたアウトレイラとデータ拡張技術に基づいて、トレーニングデータを修正するための異なるアプローチを提案する。
論文 参考訳(メタデータ) (2020-09-30T12:33:25Z) - Learning with Out-of-Distribution Data for Audio Classification [60.48251022280506]
我々は,OODインスタンスを破棄するよりも,特定のOODインスタンスを検出・復号化することで,学習に肯定的な影響を及ぼすことを示す。
提案手法は,畳み込みニューラルネットワークの性能を著しく向上させる。
論文 参考訳(メタデータ) (2020-02-11T21:08:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。