論文の概要: Enhancement attacks in biomedical machine learning
- arxiv url: http://arxiv.org/abs/2301.01885v1
- Date: Thu, 5 Jan 2023 03:03:28 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-06 13:51:25.674261
- Title: Enhancement attacks in biomedical machine learning
- Title(参考訳): バイオメディカル機械学習における強化攻撃
- Authors: Matthew Rosenblatt, Javid Dadashkarimi, Dustin Scheinost
- Abstract要約: 強化攻撃(enhancement attack)は、バイオメディカル研究における機械学習に対する脅威である可能性がある。
特徴量の変更を最小限に抑えた分類器の予測性能を大幅に向上させる3つの手法を開発した。
我々の結果は、機械学習研究におけるデータの完全性を維持するためには、より堅牢なデータ共有と前兆追跡パイプラインが必要であることを示唆している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The prevalence of machine learning in biomedical research is rapidly growing,
yet the trustworthiness of such research is often overlooked. While some
previous works have investigated the ability of adversarial attacks to degrade
model performance in medical imaging, the ability to falsely improve
performance via recently-developed "enhancement attacks" may be a greater
threat to biomedical machine learning. In the spirit of developing attacks to
better understand trustworthiness, we developed three techniques to drastically
enhance prediction performance of classifiers with minimal changes to features,
including the enhancement of 1) within-dataset predictions, 2) a particular
method over another, and 3) cross-dataset generalization. Our within-dataset
enhancement framework falsely improved classifiers' accuracy from 50% to almost
100% while maintaining high feature similarities between original and enhanced
data (Pearson's r's>0.99). Similarly, the method-specific enhancement framework
was effective in falsely improving the performance of one method over another.
For example, a simple neural network outperformed LR by 50% on our enhanced
dataset, although no performance differences were present in the original
dataset. Crucially, the original and enhanced data were still similar (r=0.95).
Finally, we demonstrated that enhancement is not specific to within-dataset
predictions but can also be adapted to enhance the generalization accuracy of
one dataset to another by up to 38%. Overall, our results suggest that more
robust data sharing and provenance tracking pipelines are necessary to maintain
data integrity in biomedical machine learning research.
- Abstract(参考訳): 生物医学研究における機械学習の普及は急速に進んでいるが、そのような研究の信頼性はしばしば見過ごされている。
過去の研究では、医療画像におけるモデル性能を低下させる敵攻撃の能力について研究されてきたが、最近開発された「エンハンスメント・アタック」による性能改善能力は、バイオメディカル・機械学習にとって大きな脅威となる可能性がある。
信頼度を高めるために,我々は,機能の変更を最小限に抑えながら分類器の予測性能を飛躍的に向上させる3つの手法を開発した。
1) データセット内予測
2)別の方法に対する特定の方法,及び
3) クロスデータセットの一般化。
データセット内拡張フレームワークは,オリジナルデータと拡張データ(pearsonのr's>0.99)との高機能な類似性を維持しつつ,分類器の精度を50%からほぼ100%向上させた。
同様に、メソッド固有の拡張フレームワークは、あるメソッドの別のメソッドのパフォーマンスを誤って改善するのに効果的であった。
例えば、単純なニューラルネットワークは拡張データセットでLRを50%上回りましたが、元のデータセットにはパフォーマンス上の違いはありませんでした。
重要な点として、オリジナルデータと拡張データはまだ似ている(r=0.95)。
最後に、拡張はデータセット内の予測に特有ではなく、あるデータセットの一般化精度を最大38%向上させるように適応できることを示した。
全体として,生体医学的機械学習研究におけるデータの完全性を維持するためには,より堅牢なデータ共有とプロヴァンストラッキングパイプラインが必要であることが示唆された。
関連論文リスト
- Class-specific Data Augmentation for Plant Stress Classification [8.433217399526521]
本稿では,遺伝的アルゴリズムを用いたクラス固有の自動データ拡張手法を提案する。
葉に症状がみられるダイズ(Glycine max (L.) Merr)ストレス分類に対するアプローチの有用性を実証した。
本手法は,ダイズ葉のストレスデータセットにおいて,平均クラス毎の精度97.61%,全体的な精度98%を達成し,高い性能を示した。
論文 参考訳(メタデータ) (2024-06-18T22:01:25Z) - Enhancing Activity Recognition After Stroke: Generative Adversarial Networks for Kinematic Data Augmentation [0.0]
脳卒中リハビリテーションにおけるウェアラブルモニタリングのための機械学習モデルの一般化可能性はしばしば、利用可能なデータの限られたスケールと不均一性によって制限される。
データ拡張は、トレーニングセットに表される変動性を強化するために、実際のデータに計算的に導出されたデータを追加することで、この課題に対処する。
本研究では、CGAN(Conditional Generative Adversarial Networks)を用いて、公開データセットから合成キネマティックデータを生成する。
合成データと実験データの両方でディープラーニングモデルを訓練することにより、タスク分類精度を向上させる:実データのみを訓練したモデルでは66.1%よりもはるかに高い80.0%の精度で合成データを組み込んだモデル。
論文 参考訳(メタデータ) (2024-06-12T15:51:00Z) - Physical formula enhanced multi-task learning for pharmacokinetics prediction [54.13787789006417]
AIによる薬物発見の大きな課題は、高品質なデータの不足である。
薬物動態の4つの重要なパラメータを同時に予測するPEMAL法を開発した。
実験の結果,PEMALは一般的なグラフニューラルネットワークに比べてデータ需要を著しく低減することがわかった。
論文 参考訳(メタデータ) (2024-04-16T07:42:55Z) - Explainability-Driven Leaf Disease Classification Using Adversarial
Training and Knowledge Distillation [2.2823100315094624]
本研究は, 植物葉病の分類に焦点を当て, 逆行訓練, モデル説明可能性, モデル圧縮の3つの重要な側面を探求する。
このロバスト性は、通常のテストでは3%-20%、敵攻撃テストでは50%-70%の性能低下を伴う分類精度の価格である。
論文 参考訳(メタデータ) (2023-12-30T21:48:20Z) - Dataset Optimization for Chronic Disease Prediction with Bio-Inspired
Feature Selection [0.32634122554913997]
本研究は慢性疾患領域における予測分析の進歩に寄与する。
この研究の潜在的影響は、早期介入、精密医療、そして患者の成果の改善にまで及んでいる。
論文 参考訳(メタデータ) (2023-12-17T18:18:34Z) - The effect of data augmentation and 3D-CNN depth on Alzheimer's Disease
detection [51.697248252191265]
この研究は、データハンドリング、実験設計、モデル評価に関するベストプラクティスを要約し、厳密に観察する。
我々は、アルツハイマー病(AD)の検出に焦点を当て、医療における課題のパラダイム的な例として機能する。
このフレームワークでは,3つの異なるデータ拡張戦略と5つの異なる3D CNNアーキテクチャを考慮し,予測15モデルを訓練する。
論文 参考訳(メタデータ) (2023-09-13T10:40:41Z) - Embracing assay heterogeneity with neural processes for markedly
improved bioactivity predictions [0.276240219662896]
リガンドの生物活性を予測することは、コンピュータ支援薬物発見において最も困難かつ最も重要な課題の1つである。
長年のデータ収集とキュレーションの努力にもかかわらず、生物活性データは希少で不均一である。
異種アッセイ間の情報シナジーを利用した階層型メタラーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2023-08-17T16:26:58Z) - Drug Synergistic Combinations Predictions via Large-Scale Pre-Training
and Graph Structure Learning [82.93806087715507]
薬物併用療法は、より有効で安全性の低い疾患治療のための確立された戦略である。
ディープラーニングモデルは、シナジスティックな組み合わせを発見する効率的な方法として登場した。
我々のフレームワークは、他のディープラーニングベースの手法と比較して最先端の結果を達成する。
論文 参考訳(メタデータ) (2023-01-14T15:07:43Z) - Robust Trajectory Prediction against Adversarial Attacks [84.10405251683713]
ディープニューラルネットワーク(DNN)を用いた軌道予測は、自律運転システムにおいて不可欠な要素である。
これらの手法は敵の攻撃に対して脆弱であり、衝突などの重大な結果をもたらす。
本研究では,敵対的攻撃に対する軌道予測モデルを保護するための2つの重要な要素を同定する。
論文 参考訳(メタデータ) (2022-07-29T22:35:05Z) - Performance or Trust? Why Not Both. Deep AUC Maximization with
Self-Supervised Learning for COVID-19 Chest X-ray Classifications [72.52228843498193]
ディープラーニングモデルのトレーニングでは、パフォーマンスと信頼の間に妥協をしなければなりません。
本研究は、新型コロナウイルス患者のコンピュータ支援スクリーニングのための自己教師型学習と新しい代理損失を統合したものである。
論文 参考訳(メタデータ) (2021-12-14T21:16:52Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。