論文の概要: Diffusion Model with Representation Alignment for Protein Inverse Folding
- arxiv url: http://arxiv.org/abs/2412.09380v1
- Date: Thu, 12 Dec 2024 15:47:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-13 13:33:47.719970
- Title: Diffusion Model with Representation Alignment for Protein Inverse Folding
- Title(参考訳): タンパク質逆フォールディングのための表現アライメント付き拡散モデル
- Authors: Chenglin Wang, Yucheng Zhou, Zijie Zhai, Jianbing Shen, Kai Zhang,
- Abstract要約: タンパク質逆フォールディングはバイオインフォマティクスの基本的な問題であり、与えられたタンパク質のバックボーン構造からアミノ酸配列を復元することを目的としている。
表現アライメント(DMRA)を用いた拡散モデルを用いた新しい手法を提案する。
実験では,CATH4.2データセットを広範囲に評価し,DMRAが先行手法より優れていることを示す。
- 参考スコア(独自算出の注目度): 53.139837825588614
- License:
- Abstract: Protein inverse folding is a fundamental problem in bioinformatics, aiming to recover the amino acid sequences from a given protein backbone structure. Despite the success of existing methods, they struggle to fully capture the intricate inter-residue relationships critical for accurate sequence prediction. We propose a novel method that leverages diffusion models with representation alignment (DMRA), which enhances diffusion-based inverse folding by (1) proposing a shared center that aggregates contextual information from the entire protein structure and selectively distributes it to each residue; and (2) aligning noisy hidden representations with clean semantic representations during the denoising process. This is achieved by predefined semantic representations for amino acid types and a representation alignment method that utilizes type embeddings as semantic feedback to normalize each residue. In experiments, we conduct extensive evaluations on the CATH4.2 dataset to demonstrate that DMRA outperforms leading methods, achieving state-of-the-art performance and exhibiting strong generalization capabilities on the TS50 and TS500 datasets.
- Abstract(参考訳): タンパク質逆フォールディングはバイオインフォマティクスの基本的な問題であり、与えられたタンパク質のバックボーン構造からアミノ酸配列を復元することを目的としている。
既存の手法が成功したにも拘わらず、正確なシーケンス予測に欠かせない複雑な相互関係を捉えるのに苦労している。
本研究では,(1)タンパク質構造全体からコンテキスト情報を集約し,各残基に選択的に分配する共有センタを提案し,(2)ノイズの多い隠れ表現とクリーンなセマンティック表現を調和させることにより,拡散に基づく逆折り畳みを促進させる拡散モデルを利用した新しい手法を提案する。
これは、アミノ酸型に対する事前定義された意味表現と、各残基を正規化するために、型埋め込みを意味フィードバックとして利用する表現アライメント手法によって達成される。
実験では,CATH4.2データセットを広範囲に評価し,DMRAが先行手法より優れ,最先端性能を実現し,TS50およびTS500データセットに強力な一般化能力を示すことを示す。
関連論文リスト
- Mask prior-guided denoising diffusion improves inverse protein folding [3.1373465343833704]
逆タンパク質の折り畳みは、所望のタンパク質構造に折り畳むことのできる有効なアミノ酸配列を生成する。
逆タンパク質折り畳みのための構造的相互作用と残基相互作用の両方を捉える枠組みを提案する。
MapDiffは、ノイズを低減したアミノ酸配列を反復的に生成する離散拡散確率モデルである。
論文 参考訳(メタデータ) (2024-12-10T09:10:28Z) - SFM-Protein: Integrative Co-evolutionary Pre-training for Advanced Protein Sequence Representation [97.99658944212675]
タンパク質基盤モデルのための新しい事前学習戦略を導入する。
アミノ酸残基間の相互作用を強調し、短距離および長距離の共進化的特徴の抽出を強化する。
大規模タンパク質配列データセットを用いて学習し,より優れた一般化能力を示す。
論文 参考訳(メタデータ) (2024-10-31T15:22:03Z) - ArSDM: Colonoscopy Images Synthesis with Adaptive Refinement Semantic
Diffusion Models [69.9178140563928]
大腸内視鏡検査は臨床診断や治療に不可欠である。
注釈付きデータの不足は、既存の手法の有効性と一般化を制限する。
本稿では, 下流作業に有用な大腸内視鏡画像を生成するために, 適応Refinement Semantic Diffusion Model (ArSDM)を提案する。
論文 参考訳(メタデータ) (2023-09-03T07:55:46Z) - DiAMoNDBack: Diffusion-denoising Autoregressive Model for
Non-Deterministic Backmapping of C{\alpha} Protein Traces [0.0]
DiAMoNDBack は非決定論的バックマッピングのための自己回帰デノナイジング拡散確率モデルである。
我々は、タンパク質データバンク(PDB)から65k以上の構造をトレーニングし、それをホールドアウトしたPDBテストセットにアプリケーションで検証する。
DiAMoNDBackは、フリーでオープンソースのPythonパッケージとして公開しています。
論文 参考訳(メタデータ) (2023-07-23T23:05:08Z) - Graph Denoising Diffusion for Inverse Protein Folding [15.06549999760776]
逆タンパク質の折り畳みは、その固有の一対多マッピング特性のために困難である。
本稿では,逆タンパク質の折り畳みに対する拡散モデルを提案する。
本モデルは,シークエンスリカバリにおける一般的なベースライン手法のセットに対して,最先端の性能を実現する。
論文 参考訳(メタデータ) (2023-06-29T09:55:30Z) - Protein Design with Guided Discrete Diffusion [67.06148688398677]
タンパク質設計における一般的なアプローチは、生成モデルと条件付きサンプリングのための識別モデルを組み合わせることである。
離散拡散モデルのためのガイダンス手法であるdiffusioN Optimized Smpling (NOS)を提案する。
NOSは、構造に基づく手法の重要な制限を回避し、シーケンス空間で直接設計を行うことができる。
論文 参考訳(メタデータ) (2023-05-31T16:31:24Z) - DDS2M: Self-Supervised Denoising Diffusion Spatio-Spectral Model for
Hyperspectral Image Restoration [103.79030498369319]
ハイパースペクトル画像復元のための自己教師付き拡散モデルを提案する。
textttDDS2Mは、既存の拡散法と比較して、より強力な一般化能力を持っている。
HSIのノイズ除去、ノイズ除去、様々なHSIの超解像実験は、既存のタスク固有状態よりもtextttDDS2Mの方が優れていることを示した。
論文 参考訳(メタデータ) (2023-03-12T14:57:04Z) - Bayesian Reconstruction and Differential Testing of Excised mRNA [0.0]
我々は、転写と局所スプライシングの視点を調和させる最初の確率モデルを開発する。
拡張mRNA(BREM)の再構成のための新しい階層的ベイズ混和モデルを提案する。
BREMは局所スプライシングイベントとフル長の転写産物を補間し、高い後部確率を持つ中小企業にのみ焦点をあてる。
論文 参考訳(メタデータ) (2022-11-14T04:46:33Z) - Orthogonalization of data via Gromov-Wasserstein type feedback for
clustering and visualization [5.44192123671277]
直交化プロセスによるデータのクラスタリングと可視化に適応的な手法を提案する。
本手法は,パラメータ値に対して一意な固定点にグローバルに収束することを示す。
本手法は,ヒトの専門的分類と一致して生物学的に意味のあるクラスタリング結果を生成する。
論文 参考訳(メタデータ) (2022-07-25T15:52:11Z) - Unsupervised Contrastive Domain Adaptation for Semantic Segmentation [75.37470873764855]
クロスドメイン適応における特徴アライメントのためのコントラスト学習を導入する。
提案手法は、ドメイン適応のための最先端手法を一貫して上回る。
Cityscapesデータセットで60.2% mIoUを達成した。
論文 参考訳(メタデータ) (2022-04-18T16:50:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。