論文の概要: Extracting Chemical-Protein Interactions via Calibrated Deep Neural
Network and Self-training
- arxiv url: http://arxiv.org/abs/2011.02207v1
- Date: Wed, 4 Nov 2020 10:14:31 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-29 22:04:28.595110
- Title: Extracting Chemical-Protein Interactions via Calibrated Deep Neural
Network and Self-training
- Title(参考訳): 深層ニューラルネットワークと自己学習による化学タンパク質相互作用の抽出
- Authors: Dongha Choi and Hyunju Lee
- Abstract要約: データ不確実性を推定し、信頼性を向上させるため、ディープラーニングモデルに"校正"技術が適用されている。
本研究では, 化学物質-タンパク質相互作用を抽出するために, 不確実性情報とキャリブレーション手法を取り入れたDNNベースの手法を提案する。
我々の手法は,従来の手法よりも高い校正能力を維持しつつ,Biocreative VI ChemProtタスクに関して最先端のパフォーマンスを実現している。
- 参考スコア(独自算出の注目度): 0.8376091455761261
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The extraction of interactions between chemicals and proteins from several
biomedical articles is important in many fields of biomedical research such as
drug development and prediction of drug side effects. Several natural language
processing methods, including deep neural network (DNN) models, have been
applied to address this problem. However, these methods were trained with
hard-labeled data, which tend to become over-confident, leading to degradation
of the model reliability. To estimate the data uncertainty and improve the
reliability, "calibration" techniques have been applied to deep learning
models. In this study, to extract chemical--protein interactions, we propose a
DNN-based approach incorporating uncertainty information and calibration
techniques. Our model first encodes the input sequence using a pre-trained
language-understanding model, following which it is trained using two
calibration methods: mixup training and addition of a confidence penalty loss.
Finally, the model is re-trained with augmented data that are extracted using
the estimated uncertainties. Our approach has achieved state-of-the-art
performance with regard to the Biocreative VI ChemProt task, while preserving
higher calibration abilities than those of previous approaches. Furthermore,
our approach also presents the possibilities of using uncertainty estimation
for performance improvement.
- Abstract(参考訳): 化学物質とタンパク質との相互作用の抽出は、医薬品開発や薬物副作用の予測など、多くの生物医学研究において重要である。
この問題に対処するために、ディープニューラルネットワーク(DNN)モデルを含むいくつかの自然言語処理手法が適用されている。
しかし、これらの手法は信頼度が過度になる傾向があり、モデルの信頼性が低下する傾向にあったハードラベルデータを用いて訓練された。
データ不確実性を推定し、信頼性を向上させるため、ディープラーニングモデルに"校正"技術を適用した。
本研究では, 化学物質-タンパク質相互作用を抽出するために, 不確実性情報と校正技術を用いたDNNベースのアプローチを提案する。
まず、事前学習した言語理解モデルを用いて入力シーケンスを符号化し、2つのキャリブレーション手法を用いて学習する。
最後に、推定不確実性を用いて抽出した拡張データでモデルを再学習する。
我々の手法は,従来の手法よりも高い校正能力を維持しつつ,Biocreative VI ChemProtタスクに関して最先端のパフォーマンスを実現している。
さらに,本手法は,不確実性推定による性能改善の可能性を示す。
関連論文リスト
- An Investigation on Machine Learning Predictive Accuracy Improvement and Uncertainty Reduction using VAE-based Data Augmentation [2.517043342442487]
深層生成学習は、特定のMLモデルを使用して、既存のデータの基盤となる分布を学習し、実際のデータに似た合成サンプルを生成する。
本研究では,変分オートエンコーダ(VAE)を用いた深部生成モデルを用いて,データ拡張の有効性を評価することを目的とする。
本研究では,拡張データを用いてトレーニングしたディープニューラルネットワーク(DNN)モデルの予測において,データ拡張が精度の向上につながるかどうかを検討した。
論文 参考訳(メタデータ) (2024-10-24T18:15:48Z) - Achieving Well-Informed Decision-Making in Drug Discovery: A Comprehensive Calibration Study using Neural Network-Based Structure-Activity Models [4.619907534483781]
薬物と標的の相互作用を予測する計算モデルは、新しい治療薬の開発を加速するための貴重なツールである。
しかし、そのようなモデルはキャリブレーションが不十分であり、信頼性の低い不確実性推定をもたらす。
本研究では,ポストホックキャリブレーション法と不確実な定量化手法を組み合わせることで,モデルの精度とキャリブレーションを向上できることを示す。
論文 参考訳(メタデータ) (2024-07-19T10:29:00Z) - Drug Discovery under Covariate Shift with Domain-Informed Prior
Distributions over Functions [30.305418761024143]
実世界の薬物発見タスクは、しばしばラベル付きデータの不足とかなりの範囲のデータによって特徴づけられる。
我々は、データ生成プロセスの明示的な事前知識を事前分布にエンコードする原理的な方法を提案する。
我々は,Q-SAVIを組み込んで,事前知識のような化学空間をモデリングプロセスに組み込むことで,相当な精度と校正が可能であることを実証した。
論文 参考訳(メタデータ) (2023-07-14T05:01:10Z) - Drug Synergistic Combinations Predictions via Large-Scale Pre-Training
and Graph Structure Learning [82.93806087715507]
薬物併用療法は、より有効で安全性の低い疾患治療のための確立された戦略である。
ディープラーニングモデルは、シナジスティックな組み合わせを発見する効率的な方法として登場した。
我々のフレームワークは、他のディープラーニングベースの手法と比較して最先端の結果を達成する。
論文 参考訳(メタデータ) (2023-01-14T15:07:43Z) - Accurate, reliable and interpretable solubility prediction of druglike
molecules with attention pooling and Bayesian learning [1.8275108630751844]
可溶性のシリコ予測は, 仮想スクリーニングと鉛最適化において有用性について研究されている。
近年,物理に基づく手法は高スループットタスクには適さないため,実験データを用いた機械学習(ML)手法が普及している。
本稿では,グラフニューラルネットワーク(GNN)を自己注意型読み出し層で開発し,予測性能を向上させる。
論文 参考訳(メタデータ) (2022-09-29T07:48:10Z) - Benchmarking Heterogeneous Treatment Effect Models through the Lens of
Interpretability [82.29775890542967]
治療のパーソナライズされた効果を見積もるのは複雑だが、普及している問題である。
ヘテロジニアス処理効果推定に関する機械学習文献の最近の進歩は、洗練されたが不透明なツールの多くを生み出した。
我々は、ポストホックな特徴重要度法を用いて、モデルの予測に影響を及ぼす特徴を特定する。
論文 参考訳(メタデータ) (2022-06-16T17:59:05Z) - Improving robustness of jet tagging algorithms with adversarial training [56.79800815519762]
本研究では,フレーバータグ付けアルゴリズムの脆弱性について,敵攻撃による検証を行った。
シミュレーション攻撃の影響を緩和する対人訓練戦略を提案する。
論文 参考訳(メタデータ) (2022-03-25T19:57:19Z) - SPLDExtraTrees: Robust machine learning approach for predicting kinase
inhibitor resistance [1.0674604700001966]
本研究では,タンパク質変異によるリガンド結合親和性の変化を正確に予測できる堅牢な機械学習手法SPLDExtraTreesを提案する。
提案手法は、学習が容易なサンプルから始まる特定のスキームに従ってトレーニングデータをランク付けする。
実験では,3つのシナリオにおいて,キナーゼ阻害剤耐性の予測法の有効性を実証した。
論文 参考訳(メタデータ) (2021-11-15T09:07:45Z) - Efficient training of lightweight neural networks using Online
Self-Acquired Knowledge Distillation [51.66271681532262]
オンライン自己獲得知識蒸留(OSAKD)は、ディープニューラルネットワークの性能をオンライン的に向上することを目的としている。
出力特徴空間におけるデータサンプルの未知確率分布を推定するために、k-nnノンパラメトリック密度推定手法を用いる。
論文 参考訳(メタデータ) (2021-08-26T14:01:04Z) - Unlabelled Data Improves Bayesian Uncertainty Calibration under
Covariate Shift [100.52588638477862]
後続正則化に基づく近似ベイズ推定法を開発した。
前立腺癌の予後モデルを世界規模で導入する上で,本手法の有用性を実証する。
論文 参考訳(メタデータ) (2020-06-26T13:50:19Z) - Rectified Meta-Learning from Noisy Labels for Robust Image-based Plant
Disease Diagnosis [64.82680813427054]
植物病は食料安全保障と作物生産に対する主要な脅威の1つである。
1つの一般的なアプローチは、葉画像分類タスクとしてこの問題を変換し、強力な畳み込みニューラルネットワーク(CNN)によって対処できる。
本稿では,正規化メタ学習モジュールを共通CNNパラダイムに組み込んだ新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2020-03-17T09:51:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。