論文の概要: PlasmoFAB: A Benchmark to Foster Machine Learning for Plasmodium
falciparum Protein Antigen Candidate Prediction
- arxiv url: http://arxiv.org/abs/2301.06454v1
- Date: Mon, 16 Jan 2023 14:57:42 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-18 15:50:39.457747
- Title: PlasmoFAB: A Benchmark to Foster Machine Learning for Plasmodium
falciparum Protein Antigen Candidate Prediction
- Title(参考訳): PlasmoFAB: Plasmodium falciparum protein Antigen Candidate Predictionのための機械学習のためのベンチマーク
- Authors: Jonas Christian Ditz and Jacqueline Wistuba-Hamprecht and Timo Maier
and Rolf Fendel and Nico Pfeifer and Bernhard Reuter
- Abstract要約: PlasmoFABは、Plasmodium falciparumタンパク質抗原候補の探索のための機械学習手法の訓練に使用できる、キュレートされたベンチマークである。
文献検索とドメインの専門知識を組み合わせてPlasmodium falciparum特異的タンパク質の高品質なラベルを作成しました。
利用可能な汎用サービスは,タンパク質抗原候補の同定に十分な性能を提供できないことを示す。
- 参考スコア(独自算出の注目度): 1.4680035572775534
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Motivation: Machine learning methods can be used to support scientific
discovery in healthcare-related research fields. However, these methods can
only be reliably used if they can be trained on high-quality and curated
datasets. Currently, no such dataset for the exploration of Plasmodium
falciparum protein antigen candidates exists. The parasite Plasmodium
falciparum causes the infectious disease malaria. Thus, identifying potential
antigens is of utmost importance for the development of antimalarial drugs and
vaccines. Since exploring antigen candidates experimentally is an expensive and
time-consuming process, applying machine learning methods to support this
process has the potential to accelerate the development of drugs and vaccines
which are needed for fighting and controlling malaria.
Results: We developed PlasmoFAB, a curated benchmark that can be used to
train machine learning methods for the exploration of Plasmodium falciparum
protein antigen candidates. We combined an extensive literature search with
domain expertise to create high-quality labels for Plasmodium falciparum
specific proteins that distinguish between antigen candidates and intracellular
proteins. Additionally, we used our benchmark to compare different well-known
prediction models and available protein localization prediction services on the
task of identifying protein antigen candidates. We show that available
general-purpose services are unable to provide sufficient performance on
identifying protein antigen candidates and are outperformed by models that were
trained on specialized data.
- Abstract(参考訳): モチベーション(Motivation):医療関連研究分野における科学的発見を支援する機械学習手法。
しかし、これらのメソッドは、高品質でキュレートされたデータセットでトレーニングできる場合にのみ確実に使用できる。
現在、Plasmodium falciparumタンパク質の抗原候補を探索するためのデータセットは存在しない。
寄生虫plasmodium falciparumは感染症のマラリアを引き起こす。
したがって、潜在的な抗原の同定は抗マラリア薬やワクチンの開発に最も重要である。
抗原候補を実験的に探索することは高価で時間のかかるプロセスであるので、このプロセスをサポートするために機械学習手法を適用することは、マラリアとの戦いや制御に必要な薬やワクチンの開発を加速する可能性がある。
結果:PlasmoFABは,Plasmodium falciparumタンパク質抗原候補の探索のための機械学習手法の訓練に使用できるキュレートされたベンチマークである。
われわれは広範囲にわたる文献検索とドメインの専門知識を組み合わせて,抗原候補と細胞内タンパク質を区別するPlasmodium falciparum特異的タンパク質の高品質なラベルを作成した。
さらに,このベンチマークを用いて,タンパク質抗原候補の同定作業において,よく知られた予測モデルと利用可能なタンパク質局在予測サービスを比較した。
利用可能な汎用サービスは、タンパク質抗原候補の同定に十分な性能を提供できず、特殊なデータに基づいて訓練されたモデルにより性能が向上していることを示す。
関連論文リスト
- Protein-Mamba: Biological Mamba Models for Protein Function Prediction [18.642511763423048]
タンパク質-マンバは、タンパク質機能予測を改善するために、自己教師付き学習と微調整の両方を活用する新しい2段階モデルである。
実験の結果,Protein-Mambaはいくつかの最先端手法と比較して,競争力を発揮することが示された。
論文 参考訳(メタデータ) (2024-09-22T22:51:56Z) - BioDiscoveryAgent: An AI Agent for Designing Genetic Perturbation Experiments [112.25067497985447]
そこで,BioDiscoveryAgentを紹介した。このエージェントは,新しい実験を設計し,その結果の理由を明らかにし,仮説空間を効率的にナビゲートし,望ましい解に到達させる。
BioDiscoveryAgentは、機械学習モデルをトレーニングすることなく、新しい実験を独自に設計することができる。
6つのデータセットで関連する遺伝的摂動を予測することで、平均21%の改善が達成されている。
論文 参考訳(メタデータ) (2024-05-27T19:57:17Z) - ProLLM: Protein Chain-of-Thoughts Enhanced LLM for Protein-Protein Interaction Prediction [54.132290875513405]
タンパク質-タンパク質相互作用(PPI)の予測は、生物学的機能や疾患を理解する上で重要である。
PPI予測に対する従来の機械学習アプローチは、主に直接的な物理的相互作用に焦点を当てていた。
PPIに適したLLMを用いた新しいフレームワークProLLMを提案する。
論文 参考訳(メタデータ) (2024-03-30T05:32:42Z) - SBSM-Pro: Support Bio-sequence Machine for Proteins [2.716144006729723]
本稿では,生物配列の分類モデルであるSBSM-Pro(Support Bio-Sequence Machine for Proteins)を紹介する。
配列アライメントを組み込んでタンパク質間の類似性を計測し、新しいマルチカーネル学習(MKL)アプローチを用いて様々な種類の情報を統合する。
以上の結果から,タンパク質の機能同定と翻訳後修飾の観点から,本モデルが10個のデータセットにまたがる可換性を示すことが示唆された。
論文 参考訳(メタデータ) (2023-08-20T14:10:50Z) - On Pre-trained Language Models for Antibody [21.59770462282307]
一般のタンパク質と抗体特異的な事前訓練言語モデルの両方が、抗体予測タスクを促進する。
1) 事前学習された言語モデルは,異なる特異性を持つ抗体処理において,どのように機能するのか?
学習された抗体の事前学習表現は、薬物発見や免疫プロセス理解のような現実世界の抗体問題に意味があるのだろうか?
論文 参考訳(メタデータ) (2023-01-28T07:05:15Z) - Improved proteasomal cleavage prediction with positive-unlabeled
learning [0.9023847175654603]
本稿では,拡張データセットと正の未ラベル学習のソリッド理論スペクトロメトリを用いて学習した新しい予測器を提案する。
改良された予測能力により、より正確なワクチン開発が可能になる。
論文 参考訳(メタデータ) (2022-09-14T11:29:15Z) - Multi-class versus One-class classifier in spontaneous speech analysis
oriented to Alzheimer Disease diagnosis [58.720142291102135]
本研究の目的は,音声信号から抽出した新しいバイオマーカーを用いて自動解析を行うことにより,ADの早期診断と重症度評価の改善に寄与することである。
外付け器とフラクタル次元の機能に関する情報を使用することで、システムの性能が向上する。
論文 参考訳(メタデータ) (2022-03-21T09:57:20Z) - AntBO: Towards Real-World Automated Antibody Design with Combinatorial
Bayesian Optimisation [53.43922443725598]
本稿では,CDRH3領域のシリコ設計を効率的に行うための組合せ最適化アルゴリズムAntBOを提案する。
AntBOをベンチマークするために、私たちはAbsolut!ソフトウェアスイートをブラックボックスのオラクルとして使用しています。
200以上のタンパク質の設計において、AntBOは690万の実験的に得られたCDRH3から引き出された最も優れた結合配列より優れた抗体配列を提案することができる。
論文 参考訳(メタデータ) (2022-01-29T12:03:04Z) - DrugOOD: Out-of-Distribution (OOD) Dataset Curator and Benchmark for
AI-aided Drug Discovery -- A Focus on Affinity Prediction Problems with Noise
Annotations [90.27736364704108]
我々は、AI支援薬物発見のための体系的なOODデータセットキュレーターおよびベンチマークであるTarmOODを提案する。
DrugOODには、ベンチマークプロセスを完全に自動化するオープンソースのPythonパッケージが付属している。
我々は、薬物標的結合親和性予測という、AIDDにおける最も重要な問題の1つに焦点を当てる。
論文 参考訳(メタデータ) (2022-01-24T12:32:48Z) - HMD-AMP: Protein Language-Powered Hierarchical Multi-label Deep Forest
for Annotating Antimicrobial Peptides [5.61222966894307]
各種AMPデータベースからアミノ酸を収集, 洗浄することにより, 多様な多ラベルタンパク質配列データベースを構築した。
我々は、AMPを包括的にアノテートするために、エンドツーエンドの階層型多ラベル深い森林フレームワーク、HMD-AMPを開発した。
AMPを特定した後、AMPが効果的に11の利用可能なクラスから殺すことができるターゲットを予測します。
論文 参考訳(メタデータ) (2021-11-11T02:10:07Z) - Neural networks for Anatomical Therapeutic Chemical (ATC) [83.73971067918333]
両方向の長期記憶ネットワーク(BiLSTM)から抽出された集合を含む、特徴の異なるセットで訓練された複数の複数ラベル分類器を組み合わせることを提案する。
実験はこのアプローチのパワーを実証し、文献で報告された最良の手法よりも優れていることを示した。
論文 参考訳(メタデータ) (2021-01-22T19:49:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。