論文の概要: Conditional generation of antibody sequences with classifier-guided germline-absorbing discrete diffusion
- arxiv url: http://arxiv.org/abs/2605.06720v1
- Date: Thu, 07 May 2026 06:57:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-11 19:43:38.486894
- Title: Conditional generation of antibody sequences with classifier-guided germline-absorbing discrete diffusion
- Title(参考訳): 分化誘導性生殖細胞吸収性離散拡散を有する抗体配列の条件付き生成
- Authors: Justin Sanders, Luca Giancardo, Lan Guo, Yue Zhao, Kemal Sonmez, Nina Cheng, Melih Yilmaz,
- Abstract要約: 本稿では, 離散拡散ノイズプロセスの新たな改良である, ゲルムリン吸収拡散を導入する。
菌根拡散は菌根残基の予測精度を26%から46%に改善することを示した。
そこで本研究では,疎水性と結合親和性を予測したサンプリング抗体の条件付き生成タスクにおける生殖細胞拡散モデルの有用性を実証した。
- 参考スコア(独自算出の注目度): 4.068045326287419
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Antibody therapeutics are among the most successful modern medicines, yet computationally designing antibodies with desirable binding and developability properties remains challenging. While protein language models (pLMs) have emerged as powerful tools for antibody sequence design, existing approaches largely suffer from two key limitations: they predominantly memorize germline sequences rather than modeling biologically meaningful somatic variation, and they offer limited support for flexible classifier-guided conditional generation. We address these challenges through two primary contributions. First, we demonstrate that discrete diffusion fine-tuning achieves strong language modeling performance on antibody sequences while allowing for generation conditioned on any off-the-shelf classifier. Second, we introduce germline absorbing diffusion, a novel modification of the discrete diffusion noise process in which the germline sequence - rather than a masked sequence - serves as the absorbing state. This biologically motivated inductive bias restricts the model to learning the trajectory from germline to observed sequence, effectively excluding genetic variation and V(D)J recombination statistics from the learned distribution and dramatically mitigating germline bias. We show that germline diffusion improves non-germline residue prediction accuracy from 26 percent to 46 percent, approaching the theoretical upper bound set by true biological variability. We then demonstrate the utility of our germline diffusion model on the conditional generation tasks of sampling antibodies with improved hydrophobicity and predicted binding affinity. On both tasks our model shows an improved tradeoff between class adherence and sample quality, significantly outperforming EvoProtGrad, a popular strategy to sample from pLMs with gradient-based discrete Markov Chain Monte Carlo.
- Abstract(参考訳): 抗体治療は最も成功した現代医学の1つだが、望ましい結合性と開発性を持つ抗体を計算的に設計することは依然として困難である。
タンパク質言語モデル(pLM)は、抗体配列設計の強力なツールとして登場したが、既存のアプローチは、生物学的に意味のある体性変異をモデル化するよりも、主に生殖細胞配列を記憶し、柔軟な分類器誘導条件生成のための限定的なサポートを提供するという2つの重要な制限を主に抱えている。
主な2つのコントリビューションを通じて、これらの課題に対処する。
まず, 離散拡散微調整は, 任意のオフザシェルフ分類器における生成条件を許容しつつ, 抗体配列上での言語モデリング性能を向上することを示した。
第2に,ガンマ線が吸収状態として機能する独立した拡散ノイズ過程の新規な改良である,ジェムリン吸収拡散を導入している。
この生物学的に動機付けられた誘導バイアスは、生殖細胞から観察された配列への軌道学習にモデルを制限し、遺伝的変異を効果的に排除し、学習分布からのV(D)J組換え統計を効果的に排除し、生殖細胞バイアスを劇的に緩和する。
菌根拡散は, 生菌残基の予測精度を26%から46%に改善し, 真の生物学的変動性による理論上界に近づいた。
そこで本研究では,疎水性と結合親和性を予測したサンプリング抗体の条件付き生成タスクにおける生殖細胞拡散モデルの有用性を実証した。
EvoProtGradは、勾配に基づく離散的なMarkov Chain Monte Carloを持つpLMからサンプルをサンプリングする一般的な戦略である。
関連論文リスト
- Co-Diffusion: An Affinity-Aware Two-Stage Latent Diffusion Framework for Generalizable Drug-Target Affinity Prediction [19.66162559968931]
Co-DiffusionはDTA予測を再定義する新しいフレームワークである。
我々は,Co-Diffusionが最先端のベースラインを著しく上回ることを示す。
論文 参考訳(メタデータ) (2026-03-11T14:47:58Z) - Negative Binomial Variational Autoencoders for Overdispersed Latent Modeling [22.62423547669558]
最近の研究は、ポアソン分布を用いてスパイク数をモデル化することによって生物学的にインスピレーションを得ている。
負二項分布を用いてスパイク数をカウントするVAEフレームワークの原理拡張であるNegBio-VAEを導入する。
このシフトは分散を明示的に制御し、より広範で正確な神経表現の族を解き放つ。
論文 参考訳(メタデータ) (2025-08-07T14:15:09Z) - Unlasting: Unpaired Single-Cell Multi-Perturbation Estimation by Dual Conditional Diffusion Implicit Bridges [68.98973318553983]
本稿では,Dual Diffusion Implicit Bridges (DDIB) に基づくフレームワークを提案する。
我々は、生物学的に意味のある方法で摂動シグナルを伝達するために遺伝子制御ネットワーク(GRN)情報を統合する。
また、サイレント遺伝子を予測し、生成したプロファイルの品質を向上させるためのマスキング機構も組み込んだ。
論文 参考訳(メタデータ) (2025-06-26T09:05:38Z) - One-for-More: Continual Diffusion Model for Anomaly Detection [63.50488826645681]
異常検出法は拡散モデルを用いて任意の異常画像が与えられたときの正常サンプルの生成または再構成を行う。
われわれは,拡散モデルが「重度忠実幻覚」と「破滅的な忘れ」に悩まされていることを発見した。
本研究では,安定な連続学習を実現するために勾配予測を用いた連続拡散モデルを提案する。
論文 参考訳(メタデータ) (2025-02-27T07:47:27Z) - Fine-Tuning Discrete Diffusion Models via Reward Optimization with Applications to DNA and Protein Design [56.957070405026194]
拡散モデルにより生成された軌道全体を通して報酬の直接バックプロパゲーションを可能にするアルゴリズムを提案する。
DRAKESは自然に似ており、高い報酬をもたらすシーケンスを生成することができる。
論文 参考訳(メタデータ) (2024-10-17T15:10:13Z) - BetterBodies: Reinforcement Learning guided Diffusion for Antibody
Sequence Design [10.6101758867776]
抗体は様々な疾患の治療に大きな可能性を秘めている。
従来の湿式検査方法による治療抗体の発見は高価で時間を要する。
抗体の設計における生成モデルの使用は、時間とリソースを削減できるため、大きな約束となる。
論文 参考訳(メタデータ) (2024-09-09T13:06:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。