論文の概要: Evolutionary Algorithms Simulating Molecular Evolution: A New Field Proposal
- arxiv url: http://arxiv.org/abs/2403.08797v2
- Date: Mon, 10 Jun 2024 21:49:16 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-12 22:13:02.383866
- Title: Evolutionary Algorithms Simulating Molecular Evolution: A New Field Proposal
- Title(参考訳): 分子進化をシミュレートする進化的アルゴリズム:新しい分野の提案
- Authors: James S. L. Browning Jr., Daniel R. Tauritz, John Beckmann,
- Abstract要約: 近年のゲノムシークエンシングの進歩により、タンパク質ファミリーの多様性が明らかにされているが、全てのアミノ酸配列の膨大な検索空間と比較して、既知の機能ファミリーのセットは最小限である。
自然には限定的なタンパク質「語彙」があると言えるかもしれない
進化的アルゴリズム、機械学習(ML)、バイオインフォマティクスを組み合わせることで、これまで存在しなかった全く新しいタンパク質の開発を促進することができる。
- 参考スコア(独自算出の注目度): 0.0716879432974126
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The genetic blueprint for the essential functions of life is encoded in DNA, which is translated into proteins -- the engines driving most of our metabolic processes. Recent advancements in genome sequencing have unveiled a vast diversity of protein families, but compared to the massive search space of all possible amino acid sequences, the set of known functional families is minimal. One could say nature has a limited protein "vocabulary." The major question for computational biologists, therefore, is whether this vocabulary can be expanded to include useful proteins that went extinct long ago, or maybe never evolved in the first place. We outline a computational approach to solving this problem. By merging evolutionary algorithms, machine learning (ML), and bioinformatics, we can facilitate the development of completely novel proteins which have never existed before. We envision this work forming a new sub-field of computational evolution we dub evolutionary algorithms simulating molecular evolution (EASME).
- Abstract(参考訳): 生命の本質的な機能の遺伝的青写真はDNAにコード化され、タンパク質に翻訳される。
近年のゲノムシークエンシングの進歩により、タンパク質ファミリーの多様性が明らかにされているが、全てのアミノ酸配列の膨大な検索空間と比較して、既知の機能ファミリーのセットは最小限である。
自然は限定的なタンパク質「語彙」を持っていると言うことができる。
したがって、計算生物学者にとっての最大の疑問は、この語彙が、昔に絶滅した、あるいはそもそも進化しなかった、有用なタンパク質を含むように拡張できるかどうかである。
この問題を解決するための計算手法を概説する。
進化的アルゴリズム、機械学習(ML)、バイオインフォマティクスを組み合わせることで、これまで存在しなかった全く新しいタンパク質の開発を促進することができる。
我々は、分子進化(EASME)をシミュレートする進化アルゴリズムをダブし、計算進化の新しいサブフィールドを形成することを想定する。
関連論文リスト
- Meta-Learning an Evolvable Developmental Encoding [7.479827648985631]
生成モデルはブラックボックス最適化のための学習可能な表現であることを示す。
本稿では,表現の質の多様性を生成する能力を最適化することで,そのような表現をメタ学習できるシステムを提案する。
より詳しくは、我々のメタラーニングアプローチが、開発中に細胞が「DNA」文字列ゲノムの異なる部分に参加することができる1つのニューラルセルオートマタを見つけることができることを示す。
論文 参考訳(メタデータ) (2024-06-13T11:52:06Z) - NaNa and MiGu: Semantic Data Augmentation Techniques to Enhance Protein Classification in Graph Neural Networks [60.48306899271866]
本稿では,背骨化学および側鎖生物物理情報をタンパク質分類タスクに組み込む新しい意味データ拡張手法を提案する。
具体的には, 分子生物学的, 二次構造, 化学結合, およびタンパク質のイオン特性を活用し, 分類作業を容易にする。
論文 参考訳(メタデータ) (2024-03-21T13:27:57Z) - Efficiently Predicting Mutational Effect on Homologous Proteins by Evolution Encoding [7.067145619709089]
EvolMPNNは進化を意識したタンパク質の埋め込みを学習するための効率的なモデルである。
我々のモデルは最先端の手法よりも最大6.4%向上し,36倍の高速化を実現している。
論文 参考訳(メタデータ) (2024-02-20T23:06:21Z) - Mathematics-assisted directed evolution and protein engineering [0.913755431537592]
巨大な突然変異空間のため、タンパク質ライブラリー全体の深い突然変異スキャンを実行することは実験的に不可能である。
これにより、AI支援指向進化(AIDE)やAI支援タンパク質工学(AIPE)が、新たな研究分野として急速に成長した。
我々は、永続的なラプラシアン、永続的なパスラプラシアン、永続的な層ラプラシアン、永続的なハイパーグラフラプラシアン、永続的なハイパーディグラフラプラシアン、進化的ド・ラム=ホッジ理論を含む永続的なトポロジカルラプラシアン(PTL)のクラスが、この制限を効果的に克服できると主張している。
論文 参考訳(メタデータ) (2023-06-06T19:27:11Z) - Phylogeny-informed fitness estimation [58.720142291102135]
本研究では, 住民の健康評価を推定するために, フィロジェニーを利用した適合度推定手法を提案する。
以上の結果から, 植物性インフォームドフィットネス推定は, ダウンサンプドレキシケースの欠点を軽減することが示唆された。
この研究は、ランタイム系統解析を利用して進化アルゴリズムを改善するための最初のステップとなる。
論文 参考訳(メタデータ) (2023-06-06T19:05:01Z) - A Latent Diffusion Model for Protein Structure Generation [50.74232632854264]
本稿では,タンパク質モデリングの複雑さを低減できる潜在拡散モデルを提案する。
提案手法は, 高い設計性と効率性を有する新規なタンパク質のバックボーン構造を効果的に生成できることを示す。
論文 参考訳(メタデータ) (2023-05-06T19:10:19Z) - Learning Geometrically Disentangled Representations of Protein Folding
Simulations [72.03095377508856]
この研究は、薬物標的タンパク質の構造的アンサンブルに基づいて生成ニューラルネットワークを学習することに焦点を当てている。
モデル課題は、様々な薬物分子に結合したタンパク質の構造的変動を特徴付けることである。
その結果,我々の幾何学的学習に基づく手法は,複雑な構造変化を生成するための精度と効率の両方を享受できることがわかった。
論文 参考訳(メタデータ) (2022-05-20T19:38:00Z) - Using Genetic Programming to Predict and Optimize Protein Function [65.25258357832584]
我々は,進化的手法に基づく遺伝的プログラミングツールPOETを提案し,方向性進化におけるスクリーニングと変異原性を高める。
概念実証として, 化学交換飽和移動機構によって検出されたMRIコントラストを生成するペプチドを用いる。
以上の結果から,POETのような計算モデリングツールは,従来よりも400%優れた機能性を持つペプチドを見つけるのに有効であることが示唆された。
論文 参考訳(メタデータ) (2022-02-08T18:08:08Z) - Modeling Protein Using Large-scale Pretrain Language Model [12.568452480689578]
学際的な研究者は、大規模な生物学的データセットをモデル化するためにディープラーニング手法を活用し始めている。
自然言語とタンパク質配列の類似性から着想を得て,進化的タンパク質配列をモデル化するために大規模言語モデルを用いた。
本モデルでは,進化規模個別配列の事前学習から進化情報を正確に捉えることができる。
論文 参考訳(メタデータ) (2021-08-17T04:13:11Z) - Epigenetic opportunities for Evolutionary Computation [0.0]
進化計算(Evolutionary Computation)は、複雑な最適化問題を解くために用いられる生物学的にインスパイアされたアルゴリズムのグループである。
遺伝的遺伝からインスピレーションを得る進化的アルゴリズムと、文化的遺伝からインスピレーションを得るSwarm Intelligenceアルゴリズムに分けることができる。
本稿では, 進化的拡張合成に基づく生物学的枠組みの下で, バイオインスパイアされたアルゴリズムを成功裏に分解する。
論文 参考訳(メタデータ) (2021-08-10T09:44:53Z) - ProGen: Language Modeling for Protein Generation [47.32931317203297]
タンパク質工学のための生成モデリングは、合成生物学、医学、物質科学における根本的な問題を解決する鍵となる。
コストのかかる構造アノテーションが欠如しているタンパク質の指数関数的に増加する集合を活用するために、タンパク質工学を教師なしシーケンス生成問題として採用する。
論文 参考訳(メタデータ) (2020-03-08T04:27:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。