論文の概要: Antibody Representation Learning for Drug Discovery
- arxiv url: http://arxiv.org/abs/2210.02881v1
- Date: Wed, 5 Oct 2022 13:48:41 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-07 17:57:36.661939
- Title: Antibody Representation Learning for Drug Discovery
- Title(参考訳): 薬物発見のための抗体表現学習
- Authors: Lin Li, Esther Gupta, John Spaeth, Leslie Shing, Tristan Bepler,
Rajmonda Sulo Caceres
- Abstract要約: 新規なSARS-CoV-2抗体結合データセットと追加ベンチマークデータセットについて報告する。
従来の統計的シーケンスモデル,各データセットの教師付き学習,および抗体特異的事前訓練言語モデルの微調整の3つのクラスを比較した。
実験結果から,特徴表現の自己教師付き事前学習は,従来の手法よりも大幅に改善されていることが示唆された。
- 参考スコア(独自算出の注目度): 7.291511531280898
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Therapeutic antibody development has become an increasingly popular approach
for drug development. To date, antibody therapeutics are largely developed
using large scale experimental screens of antibody libraries containing
hundreds of millions of antibody sequences. The high cost and difficulty of
developing therapeutic antibodies create a pressing need for computational
methods to predict antibody properties and create bespoke designs. However, the
relationship between antibody sequence and activity is a complex physical
process and traditional iterative design approaches rely on large scale assays
and random mutagenesis. Deep learning methods have emerged as a promising way
to learn antibody property predictors, but predicting antibody properties and
target-specific activities depends critically on the choice of antibody
representations and data linking sequences to properties is often limited.
Existing works have not yet investigated the value, limitations and
opportunities of these methods in application to antibody-based drug discovery.
In this paper, we present results on a novel SARS-CoV-2 antibody binding
dataset and an additional benchmark dataset. We compare three classes of
models: conventional statistical sequence models, supervised learning on each
dataset independently, and fine-tuning an antibody specific pre-trained
language model. Experimental results suggest that self-supervised pretraining
of feature representation consistently offers significant improvement in over
previous approaches. We also investigate the impact of data size on the model
performance, and discuss challenges and opportunities that the machine learning
community can address to advance in silico engineering and design of
therapeutic antibodies.
- Abstract(参考訳): 治療用抗体の開発は、薬物開発においてますますポピュラーなアプローチとなっている。
現在までに、抗体治療は数十億の抗体配列を含む抗体ライブラリーの大規模な実験画面を用いて開発されている。
高いコストと治療用抗体の開発の難しさは、抗体特性を予測し、造形設計を作成するための計算方法の必要性を圧迫する。
しかし、抗体配列と活性の関係は複雑な物理的プロセスであり、伝統的な反復的設計アプローチは大規模なアッセイとランダム変異に依存する。
深層学習法は, 抗体特性予測器を学習するための有望な方法として現れてきたが, 抗体特性と標的特異的活性の予測は, 抗体表現の選択とデータリンク配列のプロパティへの選択に大きく依存する。
既存の研究はまだ、抗体ベースの薬物発見への応用におけるこれらの方法の価値、限界、機会について調査していない。
本稿では,SARS-CoV-2抗体結合データセットと追加ベンチマークデータセットについて述べる。
従来の統計シーケンスモデル,各データセットの教師付き学習,および抗体特異的事前学習言語モデルの3つのクラスを比較した。
実験結果から, 特徴表現の自己教師付き事前学習は, 従来よりも一貫して大きな改善をもたらすことが示唆された。
また,データサイズがモデル性能に与える影響についても検討し,サイリコ工学の進歩と治療抗体の設計に機械学習コミュニティが取り組むべき課題と機会について考察する。
関連論文リスト
- Large scale paired antibody language models [40.401345152825314]
IgBert と IgT5 は,これまでに開発された抗体特異的言語モデルの中で最も優れた性能を示した。
これらのモデルは、20億以上のObserved Spaceデータセットを使用して、包括的にトレーニングされている。
この進歩は、治療開発のための抗体設計を強化するために、機械学習、大規模データセット、高性能コンピューティングを活用する上で大きな前進となる。
論文 参考訳(メタデータ) (2024-03-26T17:21:54Z) - Improving Antibody Humanness Prediction using Patent Data [6.185604158465185]
マルチステージ・マルチロス・トレーニングプロセスを用いて,抗体の人間性予測を改善するための特許データの可能性を検討する。
初期学習段階は、弱教師付きコントラスト学習問題として機能する。
次に、コントラストエンコーダの一部を凍結し、クロスエントロピー損失を用いて特許データに基づいてトレーニングし、与えられた抗体配列の人間性スコアを予測する。
論文 参考訳(メタデータ) (2024-01-25T16:04:17Z) - AI driven B-cell Immunotherapy Design [0.0]
抗原中和と除去ヒンジの効果は、パラトープ-エピトープ相互作用の強さ、感受性、特異性に影響を及ぼす。
近年、人工知能と機械学習の手法は大きな進歩を遂げ、タンパク質の構造とその複合体の予測に革命をもたらした。
本稿では,B細胞免疫療法設計分野における機械学習ツールとそのフレームワークの進歩に焦点をあてる。
論文 参考訳(メタデータ) (2023-09-03T09:14:10Z) - Drug Synergistic Combinations Predictions via Large-Scale Pre-Training
and Graph Structure Learning [82.93806087715507]
薬物併用療法は、より有効で安全性の低い疾患治療のための確立された戦略である。
ディープラーニングモデルは、シナジスティックな組み合わせを発見する効率的な方法として登場した。
我々のフレームワークは、他のディープラーニングベースの手法と比較して最先端の結果を達成する。
論文 参考訳(メタデータ) (2023-01-14T15:07:43Z) - xTrimoABFold: De novo Antibody Structure Prediction without MSA [77.47606749555686]
我々は、抗体配列から抗体構造を予測するために、xTrimoABFoldという新しいモデルを開発した。
CDRにおけるドメイン特異的焦点損失のアンサンブル損失とフレーム整合点損失を最小化することにより,PDBの抗体構造をエンドツーエンドにトレーニングした。
論文 参考訳(メタデータ) (2022-11-30T09:26:08Z) - Incorporating Pre-training Paradigm for Antibody Sequence-Structure
Co-design [134.65287929316673]
深層学習に基づく計算抗体の設計は、人間の経験を補完する可能性のあるデータから自動的に抗体パターンをマイニングするので、注目を集めている。
計算手法は高品質な抗体構造データに大きく依存しており、非常に限定的である。
幸いなことに、CDRをモデル化し、構造データへの依存を軽減するために有効な抗体の配列データが多数存在する。
論文 参考訳(メタデータ) (2022-10-26T15:31:36Z) - Reprogramming Pretrained Language Models for Antibody Sequence Infilling [72.13295049594585]
抗体の計算設計には、構造的一貫性を維持しながら、新規で多様な配列を生成することが含まれる。
近年のディープラーニングモデルでは優れた結果が得られたが、既知の抗体配列/構造対の数が限られているため、性能が劣化することが多い。
これは、ソース言語でトレーニング済みのモデルを再利用して、異なる言語で、データが少ないタスクに適応するものです。
論文 参考訳(メタデータ) (2022-10-05T20:44:55Z) - Benchmarking Heterogeneous Treatment Effect Models through the Lens of
Interpretability [82.29775890542967]
治療のパーソナライズされた効果を見積もるのは複雑だが、普及している問題である。
ヘテロジニアス処理効果推定に関する機械学習文献の最近の進歩は、洗練されたが不透明なツールの多くを生み出した。
我々は、ポストホックな特徴重要度法を用いて、モデルの予測に影響を及ぼす特徴を特定する。
論文 参考訳(メタデータ) (2022-06-16T17:59:05Z) - Sequence-based deep learning antibody design for in silico antibody
affinity maturation [0.0]
治療リードの最適化ステップは抗体発見パイプラインでますます人気が高まっている。
従来の方法とシリコのアプローチは、特定の標的抗原に対して高い結合親和性を有する候補を生成することを目指している。
本研究では,抗体親和性予測の観点から,抗体-抗原相互作用を表現するための異なるグラフに基づく設計について検討した。
論文 参考訳(メタデータ) (2021-02-21T02:48:31Z) - Accelerating Antimicrobial Discovery with Controllable Deep Generative
Models and Molecular Dynamics [109.70543391923344]
CLaSS(Controlled Latent attribute Space Smpling)は、分子の属性制御のための効率的な計算手法である。
深層学習分類器と原子論シミュレーションから得られた新しい特徴を併用して, 生成分子を付加的なキー属性としてスクリーニングする。
提案手法は, 強い広帯域能を有する非毒性抗菌性ペプチド(AMP)を設計するためのものである。
論文 参考訳(メタデータ) (2020-05-22T15:57:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。