論文の概要: Boost AI Power: Data Augmentation Strategies with unlabelled Data and
Conformal Prediction, a Case in Alternative Herbal Medicine Discrimination
with Electronic Nose
- arxiv url: http://arxiv.org/abs/2102.03088v1
- Date: Fri, 5 Feb 2021 10:25:36 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-08 13:03:04.646254
- Title: Boost AI Power: Data Augmentation Strategies with unlabelled Data and
Conformal Prediction, a Case in Alternative Herbal Medicine Discrimination
with Electronic Nose
- Title(参考訳): Boost AI Power: 乱れのないデータとコンフォーマル予測によるデータ拡張戦略 - 電子ノイズによる代替医療の差別の場合
- Authors: Li Liu, Xianghao Zhan, Rumeng Wu, Xiaoqing Guan, Zhan Wang, Wei Zhang,
You Wang, Zhiyuan Luo, Guang Li
- Abstract要約: 電子鼻は代替医療の分類において有効であることが証明されているが、教師付き学習コストの性質のため、従来の研究はラベル付きトレーニングデータに依存していた。
本研究は,データ拡張戦略を用いて分類精度を向上させることを目的とする。
- 参考スコア(独自算出の注目度): 12.31253329379136
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Electronic nose proves its effectiveness in alternativeherbal medicine
classification, but due to the supervised learn-ing nature, previous research
relies on the labelled training data,which are time-costly and labor-intensive
to collect. Consideringthe training data inadequacy in real-world applications,
this studyaims to improve classification accuracy via data
augmentationstrategies. We stimulated two scenarios to investigate the
effective-ness of five data augmentation strategies under different
trainingdata inadequacy: in the noise-free scenario, different availability
ofunlabelled data were simulated, and in the noisy scenario, differentlevels of
Gaussian noises and translational shifts were added tosimulate sensor drifts.
The augmentation strategies: noise-addingdata augmentation, semi-supervised
learning, classifier-based online learning, inductive conformal prediction
(ICP) onlinelearning and the novel ensemble ICP online learning proposed in
this study, were compared against supervised learningbaseline, with Linear
Discriminant Analysis (LDA) and Support Vector Machine (SVM) as the
classifiers. We found thatat least one strategies significantly improved the
classification accuracy with LDA(p<=0.05) and showed
non-decreasingclassification accuracy with SVM in each tasks. Moreover, our
novel strategy: ensemble ICP online learning outperformedthe others by showing
non-decreasing classification accuracy on all tasks and significant improvement
on most tasks(25/36 tasks,p<=0.05). This study provides a systematic analysis
over augmentation strategies, and we provided userswith recommended strategies
under specific circumstances. Furthermore, our newly proposed strategy showed
botheffectiveness and robustness in boosting the classification model
generalizability, which can also be further employed inother machine learning
applications.
- Abstract(参考訳): 電子鼻は、代替薬の分類において有効性が証明されるが、教師付き学習の性質から、従来の研究はラベル付きトレーニングデータに依存している。
本研究は,実世界の応用におけるトレーニングデータの不十分さを考慮し,データ拡張戦略による分類精度の向上を目的とする。
学習データの不適切な状況下での5つのデータ拡張戦略の有効性を検討するために,2つのシナリオを刺激した。ノイズのないシナリオでは,ラベルなしデータの異なる可用性をシミュレートし,ノイズシナリオではガウス雑音と翻訳シフトの異なるレベルを同調したセンサドリフトを付加した。
拡張戦略:ノイズ付加データ強化,半教師付き学習,分類器に基づくオンライン学習,帰納的共形予測(icp)オンラインラーニング,新しいアンサンブルicpオンラインラーニングを教師付き学習ベースラインと比較し,線形判別分析(lda)とサポートベクターマシン(svm)を分類器とした。
少なくとも1つの戦略がLDA(p<=0.05)による分類精度を有意に向上させ、各タスクにおいてSVMによる非減少分類精度を示した。
さらに、ICPオンライン学習のアンサンブルは、全てのタスクにおいて非遅延的な分類精度を示し、ほとんどのタスク(25/36タスク、p<=0.05)において顕著に改善した。
本研究では,拡張戦略を体系的に分析し,特定の状況下での推奨戦略をユーザに提供する。
さらに,本提案手法は,他の機械学習アプリケーションにも適用可能な分類モデルの一般化性向上の両立と堅牢性を示した。
関連論文リスト
- Systematic Evaluation of Synthetic Data Augmentation for Multi-class NetFlow Traffic [2.5182419298876857]
マルチクラス分類モデルは特定のタイプの攻撃を識別し、より標的的で効果的なインシデント応答を可能にする。
最近の進歩は、生成モデルがデータの増大を補助し、不均衡なデータセットに対して優れたソリューションを提供すると主張することを示唆している。
本実験は,トレーニングデータのバランスをとる再サンプリング手法が,分類性能を確実に向上させるものではないことを示唆している。
論文 参考訳(メタデータ) (2024-08-28T12:44:07Z) - Graph Transductive Defense: a Two-Stage Defense for Graph Membership Inference Attacks [50.19590901147213]
グラフニューラルネットワーク(GNN)は、さまざまな現実世界のアプリケーションにおいて、強力なグラフ学習機能を提供する。
GNNは、メンバーシップ推論攻撃(MIA)を含む敵攻撃に対して脆弱である
本稿では,グラフトランスダクティブ学習特性に合わせて,グラフトランスダクティブ・ディフェンス(GTD)を提案する。
論文 参考訳(メタデータ) (2024-06-12T06:36:37Z) - Which Augmentation Should I Use? An Empirical Investigation of Augmentations for Self-Supervised Phonocardiogram Representation Learning [5.438725298163702]
Contrastive Self-Supervised Learning (SSL)はラベル付きデータの不足に対する潜在的な解決策を提供する。
1次元心電図(PCG)分類におけるコントラスト学習の最適化を提案する。
トレーニング分布によっては、完全教師付きモデルの有効性が最大32%低下し、SSLモデルは最大10%低下し、場合によっては改善される。
論文 参考訳(メタデータ) (2023-12-01T11:06:00Z) - NTKCPL: Active Learning on Top of Self-Supervised Model by Estimating
True Coverage [3.4806267677524896]
ニューラル・タンジェント・カーネル・クラスタリング・プシュード・ラベル(NTKCPL)の新しいアクティブ・ラーニング・ストラテジーを提案する。
擬似ラベルとNTK近似を用いたモデル予測に基づいて経験的リスクを推定する。
提案手法を5つのデータセット上で検証し,ほとんどの場合,ベースライン法よりも優れていることを示す。
論文 参考訳(メタデータ) (2023-06-07T01:43:47Z) - Variance-Reduced Gradient Estimation via Noise-Reuse in Online Evolution
Strategies [50.10277748405355]
Noise-Reuse Evolution Strategies (NRES) は、非バイアスのオンライン進化戦略の一般的なクラスである。
NRESの結果は既存のAD法やES法よりも早く,様々なアプリケーションにまたがるウォールクロック時間とステップ数で収束することを示す。
論文 参考訳(メタデータ) (2023-04-21T17:53:05Z) - Mitigating Forgetting in Online Continual Learning via Contrasting
Semantically Distinct Augmentations [22.289830907729705]
オンライン連続学習(OCL)は、非定常データストリームからモデル学習を可能とし、新たな知識を継続的に獲得し、学習した知識を維持することを目的としている。
主な課題は、"破滅的な忘れる"問題、すなわち、新しい知識を学習しながら学習した知識を十分に記憶できないことにある。
論文 参考訳(メタデータ) (2022-11-10T05:29:43Z) - Improving GANs with A Dynamic Discriminator [106.54552336711997]
我々は、オンザフライで調整可能な判別器は、そのような時間変化に適応できると論じる。
総合的な実証研究により、提案したトレーニング戦略がDynamicDと呼ばれ、追加のコストやトレーニング目標を発生させることなく、合成性能を向上させることが確認された。
論文 参考訳(メタデータ) (2022-09-20T17:57:33Z) - Training Strategies for Improved Lip-reading [61.661446956793604]
本研究では,最先端データ拡張手法,時間モデル,その他のトレーニング戦略の性能について検討する。
すべての手法を組み合わせると、分類精度は93.4%となり、現在の最先端技術よりも4.6%向上した。
各種学習手法の誤り解析により, 難解な単語の分類精度を高めることにより, 性能が向上することが明らかとなった。
論文 参考訳(メタデータ) (2022-09-03T09:38:11Z) - Continual Learning For On-Device Environmental Sound Classification [63.81276321857279]
デバイス上での環境音の分類のための簡易かつ効率的な連続学習法を提案する。
本手法は,サンプルごとの分類の不確実性を測定することにより,トレーニングの履歴データを選択する。
論文 参考訳(メタデータ) (2022-07-15T12:13:04Z) - An Empirical Study on Distribution Shift Robustness From the Perspective
of Pre-Training and Data Augmentation [91.62129090006745]
本稿では,事前学習とデータ拡張の観点から分布シフト問題を考察する。
我々は,事前学習とデータ拡張に焦点を当てた,最初の総合的な実証的研究を行った。
論文 参考訳(メタデータ) (2022-05-25T13:04:53Z) - Ask-n-Learn: Active Learning via Reliable Gradient Representations for
Image Classification [29.43017692274488]
深い予測モデルは、ラベル付きトレーニングデータという形で人間の監督に依存する。
Ask-n-Learnは,各アルゴリズムで推定されたペスドラベルを用いて得られる勾配埋め込みに基づく能動的学習手法である。
論文 参考訳(メタデータ) (2020-09-30T05:19:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。