論文の概要: Identification of feasible pathway information for c-di-GMP binding
proteins in cellulose production
- arxiv url: http://arxiv.org/abs/2204.12526v1
- Date: Tue, 26 Apr 2022 18:22:13 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-29 03:12:27.793823
- Title: Identification of feasible pathway information for c-di-GMP binding
proteins in cellulose production
- Title(参考訳): セルロース生産におけるc-di-gmp結合タンパク質の経路情報の同定
- Authors: Syeda Sakira Hassan, Rahul Mangayil, Tommi Aho, Olli Yli-Harja, Matti
Karp
- Abstract要約: 我々は機械学習を用いてc-di-GMPシグナル伝達タンパク質の重要な経路を同定する。
このデータセットは、12の経路と1024の細菌ゲノムに対する5つの必須c-di-GMP結合ドメインからの遺伝子数を含んでいる。
- 参考スコア(独自算出の注目度): 0.3149883354098941
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we utilize a machine learning approach to identify the
significant pathways for c-di-GMP signaling proteins. The dataset involves gene
counts from 12 pathways and 5 essential c-di-GMP binding domains for 1024
bacterial genomes. Two novel approaches, Least absolute shrinkage and selection
operator (Lasso) and Random forests, have been applied for analyzing and
modeling the dataset. Both approaches show that bacterial chemotaxis is the
most essential pathway for c-di-GMP encoding domains. Though popular for
feature selection, the strong regularization of Lasso method fails to associate
any pathway to MshE domain. Results from the analysis may help to understand
and emphasize the supporting pathways involved in bacterial cellulose
production. These findings demonstrate the need for a chassis to restrict the
behavior or functionality by deactivating the selective pathways in cellulose
production.
- Abstract(参考訳): 本稿では機械学習を用いてc-di-GMPシグナル伝達タンパク質の重要な経路を同定する。
このデータセットは、12の経路と1024の細菌ゲノムに対する5つの必須c-di-GMP結合ドメインからの遺伝子数を含んでいる。
2つの新しいアプローチ、Last absolute shrinkage and selection operator (Lasso) とRandom forests がデータセットの解析とモデリングに応用されている。
どちらのアプローチも、細菌の遊走性はc-di-GMPエンコーディングドメインにとって最も重要な経路であることを示している。
特徴選択には人気があるが、ラッソ法の強い正規化は、MshEドメインにいかなる経路も関連付けることができない。
分析の結果は、細菌のセルロース生産にかかわる経路を理解し強調するのに役立つかもしれない。
これらの結果から, セルロース生産における選択的経路を阻害することにより, 挙動や機能性を制限するシャシーの必要性が示された。
関連論文リスト
- An Evaluation of Large Language Models in Bioinformatics Research [52.100233156012756]
本研究では,大規模言語モデル(LLM)の性能について,バイオインフォマティクスの幅広い課題について検討する。
これらのタスクには、潜在的なコーディング領域の同定、遺伝子とタンパク質の命名されたエンティティの抽出、抗微生物および抗がんペプチドの検出、分子最適化、教育生物情報学問題の解決が含まれる。
以上の結果から, GPT 変種のような LLM がこれらのタスクの多くをうまく処理できることが示唆された。
論文 参考訳(メタデータ) (2024-02-21T11:27:31Z) - Single-Cell Deep Clustering Method Assisted by Exogenous Gene
Information: A Novel Approach to Identifying Cell Types [50.55583697209676]
我々は,細胞間のトポロジ的特徴を効率的に捉えるために,注目度の高いグラフオートエンコーダを開発した。
クラスタリング過程において,両情報の集合を統合し,細胞と遺伝子の特徴を再構成し,識別的表現を生成する。
本研究は、細胞の特徴と分布に関する知見を高め、疾患の早期診断と治療の基礎となる。
論文 参考訳(メタデータ) (2023-11-28T09:14:55Z) - Efficient Prediction of Peptide Self-assembly through Sequential and
Graphical Encoding [57.89530563948755]
この研究は、高度なディープラーニングモデルを用いたペプチドエンコーディングのベンチマーク分析を提供する。
等電点や水和自由エネルギーなど、幅広いペプチド関連予測のガイドとして機能する。
論文 参考訳(メタデータ) (2023-07-17T00:43:33Z) - Functional Integrative Bayesian Analysis of High-dimensional
Multiplatform Genomic Data [0.8029049649310213]
我々は高次元多プラットフォームゲノミクスデータ(fiBAG)の関数積分ベイズ解析というフレームワークを提案する。
fiBAGは、プロテオゲノムバイオマーカーの上流での機能的証拠の同時同定を可能にする。
本研究は,14種類のがんのパン・カンサー解析を用いて,fiBAGの収益性を示す。
論文 参考訳(メタデータ) (2022-12-29T03:31:45Z) - Designing Biological Sequences via Meta-Reinforcement Learning and
Bayesian Optimization [68.28697120944116]
メタ強化学習を用いて自己回帰生成モデルを訓練し、選択のための有望なシーケンスを提案する。
我々は,データのサブセットのサンプリングによって誘導されるMDPの分布に対する最適ポリシーを求める問題として,この問題を提起する。
このようなアンサンブルに対するメタラーニングは,報酬の過小評価に対して頑健であり,競争的な結果が得られることを示す。
論文 参考訳(メタデータ) (2022-09-13T18:37:27Z) - EGFR Mutation Prediction of Lung Biopsy Images using Deep Learning [1.793983482813105]
本研究では,EGFR変異の形態的相関を識別するために,教師の弱いカスタマイズ深層学習パイプラインを用いた。
病理組織学的に腺癌と扁平上皮癌との鑑別は0.942であった。
EGFR検出では,TGAデータセットでは平均0.864AUC,インドからのデータセットでは0.783AUCを達成した。
論文 参考訳(メタデータ) (2022-08-26T08:56:33Z) - Deep metric learning improves lab of origin prediction of genetically
engineered plasmids [63.05016513788047]
遺伝工学の属性(GEA)は、配列-ラブの関連を作る能力である。
本稿では,計量学習に基づいて,最も可能性の高い実験室をランク付けする手法を提案する。
我々は、特定の実験室のプラスミド配列のキーシグネチャを抽出することができ、モデル出力の解釈可能な検査を可能にする。
論文 参考訳(メタデータ) (2021-11-24T16:29:03Z) - Lung Cancer Lesion Detection in Histopathology Images Using Graph-Based
Sparse PCA Network [93.22587316229954]
ヘマトキシリンとエオシン(H&E)で染色した組織学的肺スライドにおける癌病変の自動検出のためのグラフベーススパース成分分析(GS-PCA)ネットワークを提案する。
我々は,SVM K-rasG12D肺がんモデルから得られたH&Eスライダーの精度・リコール率,Fスコア,谷本係数,レシーバ演算子特性(ROC)の曲線下領域を用いて,提案アルゴリズムの性能評価を行った。
論文 参考訳(メタデータ) (2021-10-27T19:28:36Z) - Primary Tumor and Inter-Organ Augmentations for Supervised Lymph Node
Colon Adenocarcinoma Metastasis Detection [8.69535649683089]
ラベル付きデータの不足は、病理組織学応用のためのディープラーニングベースのモデルを開発する上で、大きなボトルネックとなる。
本研究は,対象領域の限定的あるいは全く表現されていない場合の大腸癌転移検出のためのトレーニングデータの拡張方法について検討する。
論文 参考訳(メタデータ) (2021-09-17T17:31:25Z) - A general kernel boosting framework integrating pathways for predictive
modeling based on genomic data [5.763710641111974]
本稿では,パスウェイを基盤としたカーネルブースティング(Kernel Boosting, PKB)を提案する。
予測アルゴリズムは, 経路からカーネル関数空間を構築し, ブースティング手順のベースラーナとして用いることにより, 経路知識を組み込む。
論文 参考訳(メタデータ) (2020-08-26T05:54:23Z) - Inferring Signaling Pathways with Probabilistic Programming [1.8275108630751837]
我々はGen確率型プログラミング言語を用いてJuliaでスパース信号経路サンプリング(Sparse Signaling Pathway Smpling)という手法を実装した。
我々は,シミュレーションデータとHPN-DREAM経路再構成問題に基づくアルゴリズムの評価を行った。
本研究は,生物ネットワーク推論における確率的プログラミング,特にGenの可能性を示すものである。
論文 参考訳(メタデータ) (2020-05-28T14:55:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。