論文の概要: Comprehensive Lipidomic Automation Workflow using Large Language Models
- arxiv url: http://arxiv.org/abs/2403.15076v1
- Date: Fri, 22 Mar 2024 10:00:52 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-25 17:58:20.386962
- Title: Comprehensive Lipidomic Automation Workflow using Large Language Models
- Title(参考訳): 大規模言語モデルを用いた総合的なリピドミック自動化ワークフロー
- Authors: Connor Beveridge, Sanjay Iyer, Caitlin E. Randolph, Matthew Muhoberac, Palak Manchanda, Amy C. Clingenpeel, Shane Tichy, Gaurav Chopra,
- Abstract要約: Comprehensive Automated (CLAW)プラットフォームは、解析、詳細な統計分析、脂質アノテーションのためのワークフローを統合している。
CLAWは不飽和脂質中の炭素-炭素二重結合位置の同定を含むいくつかのモジュールを含む。
人工知能(AI)エージェントを使用した大規模言語モデルによる統合言語ユーザインタフェース。
- 参考スコア(独自算出の注目度): 0.06597802620830574
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Lipidomics generates large data that makes manual annotation and interpretation challenging. Lipid chemical and structural diversity with structural isomers further complicates annotation. Although, several commercial and open-source software for targeted lipid identification exists, it lacks automated method generation workflows and integration with statistical and bioinformatics tools. We have developed the Comprehensive Lipidomic Automated Workflow (CLAW) platform with integrated workflow for parsing, detailed statistical analysis and lipid annotations based on custom multiple reaction monitoring (MRM) precursor and product ion pair transitions. CLAW contains several modules including identification of carbon-carbon double bond position(s) in unsaturated lipids when combined with ozone electrospray ionization (OzESI)-MRM methodology. To demonstrate the utility of the automated workflow in CLAW, large-scale lipidomics data was collected with traditional and OzESI-MRM profiling on biological and non-biological samples. Specifically, a total of 1497 transitions organized into 10 MRM-based mass spectrometry methods were used to profile lipid droplets isolated from different brain regions of 18-24 month-old Alzheimer's disease mice and age-matched wild-type controls. Additionally, triacyclglycerols (TGs) profiles with carbon-carbon double bond specificity were generated from canola oil samples using OzESI-MRM profiling. We also developed an integrated language user interface with large language models using artificially intelligent (AI) agents that permits users to interact with the CLAW platform using a chatbot terminal to perform statistical and bioinformatic analyses. We envision CLAW pipeline to be used in high-throughput lipid structural identification tasks aiding users to generate automated lipidomics workflows ranging from data acquisition to AI agent-based bioinformatic analysis.
- Abstract(参考訳): リピドミクスは、手動の注釈と解釈を困難にする巨大なデータを生成する。
構造異性体の脂質化学的および構造的多様性はさらにアノテーションを複雑にする。
標的脂質識別のための商用およびオープンソースソフトウェアはいくつか存在するが、自動メソッド生成ワークフローや統計およびバイオインフォマティクスツールとの統合は欠如している。
我々は,MRM前駆体および製品イオン対転移に基づく解析,詳細な統計分析,脂質アノテーションのための統合ワークフローを備えた包括的リピドミック自動ワークフロー(CLAW)プラットフォームを開発した。
CLAWは、オゾンエレクトロスプレーイオン化(OzESI)-MRM法と組み合わせた際の不飽和脂質中の炭素-炭素二重結合位置の同定を含むいくつかのモジュールを含む。
CLAWにおける自動化ワークフローの有用性を実証するため,生物試料と非生物試料のOzESI-MRMプロファイリングを用いて大規模リポソームデータを収集した。
具体的には,18-24カ月のアルツハイマー病マウスの異なる脳領域から分離された脂質液滴と,年齢に適合した野生型コントロールを同定するために,MRMをベースとした10種類の質量分析法に組織された1497件のトランジションを用いた。
さらに,OzESI-MRMプロファイリングを用いて,カノラ油から炭素-炭素二重結合特異性のトリアシルグリセロール (TGs) プロファイルを作成した。
また,チャットボット端末を用いてCLAWプラットフォームと対話し,統計的・バイオインフォマティクス解析を行うことができるAIエージェントを用いた大規模言語モデルを用いた統合言語ユーザインタフェースを開発した。
我々は、データ取得からAIエージェントベースのバイオインフォマティクス分析まで、ユーザが自動的なリポロミクスワークフローを生成するのに役立つ、高スループット脂質構造識別タスクに使用されるCLAWパイプラインを想定する。
関連論文リスト
- MMIL: A novel algorithm for disease associated cell type discovery [58.044870442206914]
単一細胞データセットは、しばしば個々の細胞ラベルを欠いているため、病気に関連する細胞を特定することは困難である。
セルレベルの分類器の訓練と校正を可能にする予測手法であるMixture Modeling for Multiple Learning Instance (MMIL)を導入する。
論文 参考訳(メタデータ) (2024-06-12T15:22:56Z) - STREAMLINE: An Automated Machine Learning Pipeline for Biomedicine
Applied to Examine the Utility of Photography-Based Phenotypes for OSA
Prediction Across International Sleep Centers [2.872498492478085]
我々は、シンプルで透明でエンドツーエンドの機械学習パイプライン(STREAMLINE)を開発し、検証する。
閉塞性睡眠時無呼吸(OSA)予測のための写真ベース表現型追加の有用性の検討にSTREAMLINEを適用した。
ベンチマーク分析により,データシミュレーションにおけるSTREAMLINEの有効性が検証された。
論文 参考訳(メタデータ) (2023-12-09T04:12:38Z) - Automated Bioinformatics Analysis via AutoBA [33.09743154722675]
Auto Bioinformatics Analysis(オートバイオインフォマティクス・アナリティクス・アナリティクス・アナリティクス、AutoBA)は、従来のオミクスデータ分析用に明示的に設計された大きな言語モデルに基づく自律型AIエージェントである。
AutoBAの堅牢性と適応性は、全ゲノムシークエンシング(WGS)、RNAシークエンシング(RNA-seq)、単細胞RNAシークエンシング(RNA-seq)、ChIP-seq、空間転写学など、様々なオミクス解析ケースで確認されている。
論文 参考訳(メタデータ) (2023-09-06T07:54:45Z) - From Quantity to Quality: Boosting LLM Performance with Self-Guided Data Selection for Instruction Tuning [52.257422715393574]
本稿では,Large Language Models (LLMs) の自己誘導手法を導入し,オープンソースデータセットからサクラサンプルを自動識別し,選択する。
我々の重要な革新である命令追従困難度(IFD)メトリックは、モデルが期待する応答と本質的な生成能力の相違を識別するための重要な指標として現れます。
論文 参考訳(メタデータ) (2023-08-23T09:45:29Z) - Closing the loop: Autonomous experiments enabled by
machine-learning-based online data analysis in synchrotron beamline
environments [80.49514665620008]
機械学習は、大規模または高速に生成されたデータセットを含む研究を強化するために使用できる。
本研究では,X線反射法(XRR)のための閉ループワークフローへのMLの導入について述べる。
本研究では,ビームライン制御ソフトウェア環境に付加的なソフトウェア依存関係を導入することなく,実験中の基本データ解析をリアルタイムで行うソリューションを提案する。
論文 参考訳(メタデータ) (2023-06-20T21:21:19Z) - Optimal transport for automatic alignment of untargeted metabolomic data [8.692678207022084]
本稿では,LC-MSデータセットを最適なトランスポートで自動的に組み合わせる,フレキシブルでユーザフレンドリなアルゴリズムであるGromovMatcherを紹介する。
特徴強度相関構造を利用することで、GromovMatcherは優れたアライメント精度とロバスト性を提供する。
我々は,GromovMatcherが,いくつかのがんタイプに関連するライフスタイルのリスク要因に関連するバイオマーカーの検索をいかに促進するかを示す。
論文 参考訳(メタデータ) (2023-06-05T20:08:19Z) - Differentiable Agent-based Epidemiology [71.81552021144589]
GradABM(GradABM)は、エージェントベースのモデリングのためのスケーラブルで微分可能な設計で、勾配に基づく学習と自動微分が可能である。
GradABMは、コモディティハードウェア上で数秒で数百万の人口をシミュレートし、ディープニューラルネットワークと統合し、異種データソースを取り込みます。
論文 参考訳(メタデータ) (2022-07-20T07:32:02Z) - LCS-DIVE: An Automated Rule-based Machine Learning Visualization
Pipeline for Characterizing Complex Associations in Classification [0.7226144684379191]
本研究では、複雑な生物医学分類のための自動LCS解釈パイプラインであるLCS Discovery Visualization Environment(LCS-DIVE)を紹介する。
LCS-DIVEは、バイオメディカルデータマイニングにおけるノイズとスケーラビリティを克服するために設計されたLCSであるExSTraCSの新しいシキット学習実装を使用してモデリングを行います。
特徴追跡スコアおよび/またはルールを利用して、(1)特徴の重要性(2)基礎となる付加、エピスタティック、および/または異種関係のパターン、(3)クラスタリング、視覚化生成、およびクラスタ尋問を介してモデル駆動の異種サブグループを自動的に評価する。
論文 参考訳(メタデータ) (2021-04-26T19:47:03Z) - G-MIND: An End-to-End Multimodal Imaging-Genetics Framework for
Biomarker Identification and Disease Classification [49.53651166356737]
診断によって誘導される画像データと遺伝データを統合し、解釈可能なバイオマーカーを提供する新しいディープニューラルネットワークアーキテクチャを提案する。
2つの機能的MRI(fMRI)パラダイムとSingle Nucleotide Polymorphism (SNP)データを含む統合失調症の集団研究で本モデルを評価した。
論文 参考訳(メタデータ) (2021-01-27T19:28:04Z) - Towards an Automatic Analysis of CHO-K1 Suspension Growth in
Microfluidic Single-cell Cultivation [63.94623495501023]
我々は、人間の力で抽象化されたニューラルネットワークをデータレベルで注入できる新しい機械学習アーキテクチャを提案する。
具体的には、自然データと合成データに基づいて生成モデルを同時に訓練し、細胞数などの対象変数を確実に推定できる共有表現を学習する。
論文 参考訳(メタデータ) (2020-10-20T08:36:51Z) - A Rigorous Machine Learning Analysis Pipeline for Biomedical Binary
Classification: Application in Pancreatic Cancer Nested Case-control Studies
with Implications for Bias Assessments [2.9726886415710276]
バイナリ分類にフォーカスした、厳格で厳格なML分析パイプラインをレイアウトし、組み立てました。
この'自動'だがカスタマイズ可能なパイプラインは、a)探索分析、b)データのクリーニングと変換、c)特徴選択、d)9つの確立されたMLアルゴリズムによるモデルトレーニングを含む。
本パイプラインは,癌に対する確立された,新たに同定されたリスクファクターの疫学的検討に適用し,MLアルゴリズムによって異なるバイアス源がどのように扱われるかを評価する。
論文 参考訳(メタデータ) (2020-08-28T19:58:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。