論文の概要: Quantum algorithm for bioinformatics to compute the similarity between
proteins
- arxiv url: http://arxiv.org/abs/2402.09927v1
- Date: Thu, 15 Feb 2024 13:17:32 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-16 15:35:24.020962
- Title: Quantum algorithm for bioinformatics to compute the similarity between
proteins
- Title(参考訳): バイオインフォマティクスの量子アルゴリズムによるタンパク質間の類似性の計算
- Authors: Anthony Chagneau, Yousra Massaoudi, Imene Derbali and Linda Yahiaoui
- Abstract要約: 著者らは、タンパク質データベースの出現に基づいてランダムな配列を生成する量子法を提案する。
目的は、生成したタンパク質に最も近いタンパク質を見つけ、これらのタンパク質を秩序づけることである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Drug discovery has become a main challenge in our society, following the
Covid-19 pandemic. Even pharmaceutical companies are already using computing to
accelerate drug discovery. They are increasingly interested in Quantum
Computing with a view to improve the speed of research and development process
for new drugs. Here, the authors propose a quantum method to generate random
sequences based on the occurrence in a protein database and another quantum
process to compute a similarity rate between proteins. The aim is to find
proteins that are closest to the generated protein and to have an ordering of
these proteins. First, the authors will present the construction of a quantum
generator of proteins who define a protein, called the test protein. The aim is
to have a randomly defined amino-acids sequence according to a proteins
database given. The authors will then describe two different methods to compute
the similarity's rate between the test protein and each protein of the database
and present results obtained for the test protein and for a case study, the
elafin.
- Abstract(参考訳): 新型コロナウイルスのパンデミックを受けて、薬物発見は私たちの社会で大きな課題となっている。
製薬会社でさえ、既にコンピューターを使って薬物発見を加速している。
彼らは、新しい薬物の研究と開発プロセスのスピードを改善するために、量子コンピューティングにますます関心を寄せている。
本稿では,タンパク質データベースと他の量子プロセスで発生したランダムシーケンスを生成し,タンパク質間の類似度を計算する量子法を提案する。
目的は、生成したタンパク質に最も近いタンパク質を見つけ、これらのタンパク質を秩序づけることである。
まず、著者らはテストタンパク質と呼ばれるタンパク質を定義するタンパク質の量子生成体の構築について述べる。
目的は、与えられたタンパク質データベースに従ってランダムに定義されたアミノ酸配列を持つことである。
筆者らは,テストタンパク質とデータベースの各タンパク質の類似度を計算するための2つの異なる方法について記述し,本実験タンパク質とelafinのケーススタディで得られた結果について述べる。
関連論文リスト
- A PLMs based protein retrieval framework [4.110243520064533]
本稿では,配列類似性に対するバイアスを緩和する新規なタンパク質検索フレームワークを提案する。
我々のフレームワークは、タンパク質の配列を高次元の特徴空間に埋め込むために、タンパク質言語モデル(PLM)を主導的に活用する。
大規模な実験により、我々のフレームワークは類似タンパク質と異種タンパク質の両方を等しく回収できることが示された。
論文 参考訳(メタデータ) (2024-07-16T09:52:42Z) - ProtT3: Protein-to-Text Generation for Text-based Protein Understanding [88.43323947543996]
言語モデル(LM)は、タンパク質のテキスト記述を理解するのに優れている。
タンパク質言語モデル(PLM)は、タンパク質データを理解し、高品質な表現に変換するが、テキストを処理するのに苦労する。
ProtT3は、テキストベースのタンパク質理解のための、タンパク質からテキストへの生成のためのフレームワークである。
論文 参考訳(メタデータ) (2024-05-21T08:06:13Z) - Clustering for Protein Representation Learning [72.72957540484664]
本稿では,タンパク質の臨界成分を自動的に検出するニューラルネットワーククラスタリングフレームワークを提案する。
我々のフレームワークはタンパク質をグラフとして扱い、各ノードはアミノ酸を表し、各エッジはアミノ酸間の空間的またはシーケンシャルな接続を表す。
タンパク質の折り畳み分類, 酵素反応分類, 遺伝子期予測, 酵素コミッショニング数予測の4つの課題について検討した。
論文 参考訳(メタデータ) (2024-03-30T05:51:09Z) - ProLLM: Protein Chain-of-Thoughts Enhanced LLM for Protein-Protein Interaction Prediction [54.132290875513405]
タンパク質-タンパク質相互作用(PPI)の予測は、生物学的機能や疾患を理解する上で重要である。
PPI予測に対する従来の機械学習アプローチは、主に直接的な物理的相互作用に焦点を当てていた。
PPIに適したLLMを用いた新しいフレームワークProLLMを提案する。
論文 参考訳(メタデータ) (2024-03-30T05:32:42Z) - Protein Language Model-Powered 3D Ligand Binding Site Prediction from
Protein Sequence [16.06613460477948]
タンパク質の結合部位の予測は、タンパク質の機能を理解し、潜在的な薬物をスクリーニングする重要な課題である。
既存の方法の多くは、入力として実験的に決定されたタンパク質ホロ構造を必要とする。
タンパク質配列とリガンド分子グラフのみを入力とするLaMPSiteを提案する。
論文 参考訳(メタデータ) (2023-12-05T01:47:38Z) - An approach to solve the coarse-grained Protein folding problem in a
Quantum Computer [0.0]
タンパク質の構造や酵素を理解することは、標的とした医薬品の設計、タンパク質関連疾患のメカニズムの解明、新規酵素の革新において重要な役割を担っている。
AIに基づくタンパク質構造予測手法の最近の進歩により、タンパク質の折り畳み問題はある程度解決されているが、配列の類似度が低いタンパク質の構造を決定する精度は限られている。
本研究では,より小さなタンパク質配列の構造を予測するために,ゲートベースの量子コンピュータ上で動作可能なターンベース符号化アルゴリズムを開発した。
論文 参考訳(メタデータ) (2023-11-23T18:20:05Z) - A Latent Diffusion Model for Protein Structure Generation [50.74232632854264]
本稿では,タンパク質モデリングの複雑さを低減できる潜在拡散モデルを提案する。
提案手法は, 高い設計性と効率性を有する新規なタンパク質のバックボーン構造を効果的に生成できることを示す。
論文 参考訳(メタデータ) (2023-05-06T19:10:19Z) - A Text-guided Protein Design Framework [106.79061950107922]
本稿では,タンパク質設計のためのテキスト記述を利用するマルチモーダルフレームワークであるProteinDTを提案する。
タンパク質DTは以下の3つのステップから構成される:2つのモダリティの表現を整列するProteinCLAP、テキストモダリティからタンパク質表現を生成するファシリテーター、表現からタンパク質配列を生成するデコーダ。
本研究では,(1)テキスト誘導タンパク質生成における90%以上の精度,(2)ゼロショットテキスト誘導タンパク質編集タスクにおけるベストヒット率,(3)タンパク質特性予測ベンチマーク6項目中4項目における優れた性能の3つの課題に対するProteinDTの有効性を定量的に検証した。
論文 参考訳(メタデータ) (2023-02-09T12:59:16Z) - Learning Geometrically Disentangled Representations of Protein Folding
Simulations [72.03095377508856]
この研究は、薬物標的タンパク質の構造的アンサンブルに基づいて生成ニューラルネットワークを学習することに焦点を当てている。
モデル課題は、様々な薬物分子に結合したタンパク質の構造的変動を特徴付けることである。
その結果,我々の幾何学的学習に基づく手法は,複雑な構造変化を生成するための精度と効率の両方を享受できることがわかった。
論文 参考訳(メタデータ) (2022-05-20T19:38:00Z) - Protein Representation Learning by Geometric Structure Pretraining [27.723095456631906]
既存のアプローチは通常、多くの未ラベルアミノ酸配列で事前訓練されたタンパク質言語モデルである。
まず,タンパク質の幾何学的特徴を学習するための単純かつ効果的なエンコーダを提案する。
関数予測と折り畳み分類の両タスクの実験結果から,提案した事前学習法は,より少ないデータを用いた最先端のシーケンスベース手法と同等あるいは同等であることがわかった。
論文 参考訳(メタデータ) (2022-03-11T17:52:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。