論文の概要: Machine learning can guide experimental approaches for protein
digestibility estimations
- arxiv url: http://arxiv.org/abs/2211.00625v1
- Date: Tue, 1 Nov 2022 17:43:58 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-02 14:53:48.592184
- Title: Machine learning can guide experimental approaches for protein
digestibility estimations
- Title(参考訳): 機械学習はタンパク質の消化率推定のための実験的アプローチを導く
- Authors: Sara Malvar, Anvita Bhagavathula, Maria Angels de Luis Balaguer, Swati
Sharma and Ranveer Chandra
- Abstract要約: 本稿では,食品の本当の回腸消化率を予測するための機械学習手法を提案する。
食品タンパク質の消化率を予測する最初のAIベースのモデルは、既存のモデルと比較して90%の精度を持つ。
- 参考スコア(独自算出の注目度): 1.447032077887874
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Food protein digestibility and bioavailability are critical aspects in
addressing human nutritional demands, particularly when seeking sustainable
alternatives to animal-based proteins. In this study, we propose a machine
learning approach to predict the true ileal digestibility coefficient of food
items. The model makes use of a unique curated dataset that combines
nutritional information from different foods with FASTA sequences of some of
their protein families. We extracted the biochemical properties of the proteins
and combined these properties with embeddings from a Transformer-based protein
Language Model (pLM). In addition, we used SHAP to identify features that
contribute most to the model prediction and provide interpretability. This
first AI-based model for predicting food protein digestibility has an accuracy
of 90% compared to existing experimental techniques. With this accuracy, our
model can eliminate the need for lengthy in-vivo or in-vitro experiments,
making the process of creating new foods faster, cheaper, and more ethical.
- Abstract(参考訳): 食品タンパク質の消化性とバイオアベイラビリティは、ヒトの栄養要求に対処する上で重要な側面である。
本研究では,食品の真の回腸消化率係数を予測するための機械学習手法を提案する。
このモデルは、異なる食品からの栄養情報とそれらのタンパク質ファミリーのFASTA配列を組み合わせた、ユニークなキュレートされたデータセットを利用している。
タンパク質の生化学的性質を抽出し,これらの性質をTransformer-based protein Language Model (pLM) の埋め込みと組み合わせた。
さらに、モデル予測に最も寄与する特徴を特定し、解釈可能性を提供するためにSHAPを使用しました。
食品タンパク質の消化率を予測する最初のAIベースのモデルは、既存の実験技術と比較して90%の精度を持つ。
この精度で、我々のモデルは、ビビオやビオトロでの長い実験の必要性を排除し、新しい食品をより早く、より安く、より倫理的に作成することができる。
関連論文リスト
- Enhancing Protein Predictive Models via Proteins Data Augmentation: A
Benchmark and New Directions [58.819567030843025]
本稿では,これまで画像やテキストに用いたデータ拡張手法をタンパク質に拡張し,タンパク質関連タスクでこれらの手法をベンチマークする。
本稿では,2つの新規な意味レベルタンパク質増強法,すなわち,統合的グラディエント置換法とバック翻訳置換法を提案する。
最後に、拡張および提案された拡張を拡張プールに統合し、シンプルで効果的なフレームワークであるAutomated Protein Augmentation (APA)を提案する。
論文 参考訳(メタデータ) (2024-03-01T07:58:29Z) - Efficiently Predicting Protein Stability Changes Upon Single-point
Mutation with Large Language Models [51.57843608615827]
タンパク質の熱安定性を正確に予測する能力は、様々なサブフィールドや生化学への応用において重要である。
タンパク質配列と構造的特徴を統合したESMによる効率的なアプローチを導入し, 単一点突然変異によるタンパク質の熱安定性変化を予測する。
論文 参考訳(メタデータ) (2023-12-07T03:25:49Z) - NutritionVerse: Empirical Study of Various Dietary Intake Estimation
Approaches [60.97896788599621]
食事の正確な摂取推定は、健康的な食事を支援するための政策やプログラムを伝える上で重要である。
最近の研究は、コンピュータービジョンと機械学習を使用して、食物画像から食事摂取を自動的に推定することに焦点を当てている。
我々は,84,984個の合成2D食品画像と関連する食事情報を用いた最初の大規模データセットであるNutritionVerse-Synthを紹介した。
また、リアルなイメージデータセットであるNutritionVerse-Realを収集し、リアル性を評価するために、251の料理の889のイメージを含む。
論文 参考訳(メタデータ) (2023-09-14T13:29:41Z) - Multi-level Protein Representation Learning for Blind Mutational Effect
Prediction [5.207307163958806]
本稿では,タンパク質構造解析のためのシーケンシャルおよび幾何学的アナライザをカスケードする,新しい事前学習フレームワークを提案する。
野生型タンパク質の自然選択をシミュレートすることにより、所望の形質に対する突然変異方向を誘導する。
提案手法は,多種多様な効果予測タスクに対して,パブリックデータベースと2つの新しいデータベースを用いて評価する。
論文 参考訳(メタデータ) (2023-06-08T03:00:50Z) - A Latent Diffusion Model for Protein Structure Generation [50.74232632854264]
本稿では,タンパク質モデリングの複雑さを低減できる潜在拡散モデルを提案する。
提案手法は, 高い設計性と効率性を有する新規なタンパク質のバックボーン構造を効果的に生成できることを示す。
論文 参考訳(メタデータ) (2023-05-06T19:10:19Z) - AmorProt: Amino Acid Molecular Fingerprints Repurposing based Protein
Fingerprint [0.0]
そこで本研究では,AmorProt型タンパク質 (AmorProt型タンパク質) を精製するアミノ酸分子指紋を提案する。
木に基づく機械学習と人工ニューラルネットワークモデルの性能を比較した。
その結果、現在のタンパク質表現法は、タンパク質に関連する様々な分野に適用できることが判明した。
論文 参考訳(メタデータ) (2023-03-27T23:57:47Z) - PSP: Million-level Protein Sequence Dataset for Protein Structure
Prediction [34.11168458572554]
PSPと命名された,高いカバレッジと多様性を持つ最初の100万レベルのタンパク質構造予測データセットを提示する。
このデータセットは570k真構造配列(10TB)と745k相補的蒸留配列(15TB)からなる。
また、このデータセット上でのSOTAタンパク質構造予測モデルのベンチマークトレーニング手順も提供する。
論文 参考訳(メタデータ) (2022-06-24T14:08:44Z) - Learning Geometrically Disentangled Representations of Protein Folding
Simulations [72.03095377508856]
この研究は、薬物標的タンパク質の構造的アンサンブルに基づいて生成ニューラルネットワークを学習することに焦点を当てている。
モデル課題は、様々な薬物分子に結合したタンパク質の構造的変動を特徴付けることである。
その結果,我々の幾何学的学習に基づく手法は,複雑な構造変化を生成するための精度と効率の両方を享受できることがわかった。
論文 参考訳(メタデータ) (2022-05-20T19:38:00Z) - Structure-aware Protein Self-supervised Learning [50.04673179816619]
本稿では,タンパク質の構造情報を取得するための構造認識型タンパク質自己教師学習法を提案する。
特に、タンパク質構造情報を保存するために、よく設計されたグラフニューラルネットワーク(GNN)モデルを事前訓練する。
タンパク質言語モデルにおける逐次情報と特別に設計されたGNNモデルにおける構造情報との関係を,新しい擬似二段階最適化手法を用いて同定する。
論文 参考訳(メタデータ) (2022-04-06T02:18:41Z) - OntoProtein: Protein Pretraining With Gene Ontology Embedding [36.92674447484136]
GO(Gene Ontology)の構造をタンパク質事前学習モデルに活用する最初の汎用フレームワークであるOntoProteinを提案する。
我々はGOとその関連タンパク質からなる新しい大規模知識グラフを構築し、遺伝子アノテーションのテキストやタンパク質配列はグラフ内の全てのノードを記述する。
論文 参考訳(メタデータ) (2022-01-23T14:49:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。