論文の概要: Biologically-Grounded Multi-Encoder Architectures as Developability Oracles for Antibody Design
- arxiv url: http://arxiv.org/abs/2604.09369v1
- Date: Fri, 10 Apr 2026 14:39:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-13 17:57:53.911242
- Title: Biologically-Grounded Multi-Encoder Architectures as Developability Oracles for Antibody Design
- Title(参考訳): 抗体設計のための開発可能なOracleとしての生物群マルチエンコーダアーキテクチャ
- Authors: Simon J. Crouzet,
- Abstract要約: 生成モデルは何千ものエンフデノボ抗体配列を提案できるが、これらの設計を有効な治療法に翻訳することは、生物物理学的特徴のコストに制約される。
ここでは、凍結したタンパク質言語モデルエンコーダとアテンションデコーダを組み合わせた、プロパティ固有の神経オラクルのフレームワークであるCrossAbSenseを紹介する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Generative models can now propose thousands of \emph{de novo} antibody sequences, yet translating these designs into viable therapeutics remains constrained by the cost of biophysical characterization. Here we present CrossAbSense, a framework of property-specific neural oracles that combine frozen protein language model encoders with configurable attention decoders, identified through a systematic hyperparameter campaign totaling over 200 runs per property. On the GDPa1 benchmark of 242 therapeutic IgGs, our oracles achieve notable improvements of 12--20\% over established baselines on three of five developability assays and competitive performance on the remaining two. The central finding is that optimal decoder architectures \emph{invert} our initial biological hypotheses: self-attention alone suffices for aggregation-related properties (hydrophobic interaction chromatography, polyreactivity), where the relevant sequence signatures -- such as CDR-H3 hydrophobic patches -- are already fully resolved within single-chain embeddings by the high-capacity 6B encoder. Bidirectional cross-attention, by contrast, is required for expression yield and thermal stability -- properties that inherently depend on the compatibility between heavy and light chains. Learned chain fusion weights independently confirm heavy-chain dominance in aggregation ($w_H = 0.62$) versus balanced contributions for stability ($w_H = 0.51$). We demonstrate practical utility by deploying CrossAbSense on 100 IgLM-generated antibody designs, illustrating a path toward substantial reduction in experimental screening costs.
- Abstract(参考訳): 生成モデルは今や何千ものemph{de novo}抗体配列を提案できるが、これらの設計を実行可能な治療に翻訳することは、生物物理学的特徴のコストに制約されるままである。
ここでは、凍結したタンパク質言語モデルエンコーダと設定可能なアテンションデコーダを組み合わせた、プロパティ固有の神経オラクルのフレームワークであるCrossAbSenseについて述べる。
治療IgG242例のGDPa1ベンチマークでは,5例中3例で確立されたベースラインよりも12-20-%の顕著な改善が達成され,残りの2例では競争性能が向上した。
CDR-H3疎水性パッチのような関連するシーケンスシグネチャは、高容量の6Bエンコーダによって、単一鎖の埋め込みの中で既に完全に解決されている。
対照的に、双方向の相互注意は、表現の収量と熱安定性 -- 本質的に重鎖と軽鎖の整合性に依存する性質 -- に必要である。
学習鎖融合重量は、凝集(w_H = 0.62$)と安定(w_H = 0.51$)のバランスの取れた寄与(w_H = 0.51$)を独立に確認する。
我々は,100 IgLM生成抗体にCrossAbSenseをデプロイし,実験スクリーニングコストの大幅な削減に向けた道筋を示す。
関連論文リスト
- Differential Attention-Augmented BiomedCLIP with Asymmetric Focal Optimization for Imbalanced Multi-Label Video Capsule Endoscopy Classification [1.2246649738388389]
本研究は,ビデオカプセル内視鏡(VCE)のためのマルチラベル分類フレームワークを提案する。
アーキテクチャと最適化レベルの戦略を組み合わせることで、Galarデータセットに固有の極端なクラス不均衡に対処する。
論文 参考訳(メタデータ) (2026-03-18T16:04:50Z) - SiDGen: Structure-informed Diffusion for Generative modeling of Ligands for Proteins [0.0]
マスク付きSMILES生成とポケット認識のための軽量な折りたたみ機能を統合したタンパク質条件拡散フレームワークSiDGenを提案する。
SiDGenは、タンパク質の埋め込みから粗い構造信号をプールする合理化モードと、より強い結合のために局所化された対のバイアスを注入するフルモードの2つの条件付けパスをサポートしている。
自動ベンチマークでは、SiDGenは高い妥当性、一意性、新規性を生み出し、ドッキングベースの評価において競合性能を達成し、適切な分子特性を維持する。
論文 参考訳(メタデータ) (2025-11-12T18:25:51Z) - Cancer-Net PCa-MultiSeg: Multimodal Enhancement of Prostate Cancer Lesion Segmentation Using Synthetic Correlated Diffusion Imaging [55.62977326180104]
前立腺癌病変の分節化に対する近年の深層学習アプローチは,限られた性能を達成している。
本稿では,標準拡散型プロトコルの拡張として,合成相関拡散イメージング(CDI$s$)について検討する。
以上の結果から,PCa病変セグメント化タスクの実践的ドロップイン強化として,CDI$s$に対する検証済み統合経路が確立された。
論文 参考訳(メタデータ) (2025-11-11T04:16:12Z) - FP-AbDiff: Improving Score-based Antibody Design by Capturing Nonequilibrium Dynamics through the Underlying Fokker-Planck Equation [19.153777175873547]
FP-AbDiffはFokker-Planck Equation (FPE) 物理を誘導する最初の抗体生成装置である。
生成力学を物理法則と整合させることにより、FP-AbDiffは堅牢性と一般化性を高め、物理的に忠実で機能的に実行可能な抗体設計のための原則化されたアプローチを確立する。
論文 参考訳(メタデータ) (2025-11-05T01:44:37Z) - scMRDR: A scalable and flexible framework for unpaired single-cell multi-omics data integration [53.683726781791385]
単一セルマルチオミクス(ScMRDR)と呼ばれるスケーラブルでフレキシブルな生成フレームワークを導入する。
本手法は, バッチ補正, モダリティアライメント, 生体信号保存の観点から, ベンチマークデータセット上での優れた性能を実現する。
論文 参考訳(メタデータ) (2025-10-28T21:28:39Z) - ProteinAE: Protein Diffusion Autoencoders for Structure Encoding [64.77182442408254]
本稿では,新規かつ合理化されたタンパク質拡散オートエンコーダであるProteinAEを紹介する。
プロテインAEは、タンパク質のバックボーン座標を直接E(3)から連続的でコンパクトな潜在空間にマッピングする。
本研究では,既存のオートエンコーダよりも優れた,最先端の再構築品質を実現することを実証する。
論文 参考訳(メタデータ) (2025-10-12T14:30:32Z) - Bidirectional Representations Augmented Autoregressive Biological Sequence Generation:Application in De Novo Peptide Sequencing [51.12821379640881]
自己回帰(AR)モデルは、全体的な双方向表現を提供するが、生成的コヒーレンスとスケーラビリティに関する課題に直面している。
非自己回帰機構からリッチなコンテキスト情報を動的に統合することにより、AR生成を向上するハイブリッドフレームワークを提案する。
新しいクロスデコーダアテンションモジュールにより、ARデコーダは、これらの双方向機能を反復的にクエリし、統合することができる。
論文 参考訳(メタデータ) (2025-10-09T12:52:55Z) - Generalizing electrocardiogram delineation: training convolutional
neural networks with synthetic data augmentation [63.51064808536065]
ECGのデライン化のための既存のデータベースは小さく、サイズやそれらが表す病態の配列に不足している。
まず、原データベースから抽出した基本セグメントのプールを与えられたECGトレースを確率的に合成し、その整合性のある合成トレースに配置するための一連のルールを考案した。
第二に、2つの新しいセグメンテーションに基づく損失関数が開発され、これは、正確な数の独立構造の予測を強制し、サンプル数の削減に焦点をあてて、より密接なセグメンテーション境界を創出することを目的としている。
論文 参考訳(メタデータ) (2021-11-25T10:11:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。