論文の概要: Comparative Performance Evaluation of Large Language Models for
Extracting Molecular Interactions and Pathway Knowledge
- arxiv url: http://arxiv.org/abs/2307.08813v1
- Date: Mon, 17 Jul 2023 20:01:11 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-19 17:18:34.766660
- Title: Comparative Performance Evaluation of Large Language Models for
Extracting Molecular Interactions and Pathway Knowledge
- Title(参考訳): 分子相互作用と経路知識抽出のための大規模言語モデルの比較性能評価
- Authors: Gilchan Park, Byung-Jun Yoon, Xihaier Luo, Vanessa L\'opez-Marrero,
Patrick Johnstone, Shinjae Yoo, Francis J. Alexander
- Abstract要約: 本研究では,タンパク質の相互作用,経路,および遺伝子制御関係を認識する上で,異なる大規模言語モデルの有効性について検討する。
我々は,様々なモデルの性能を徹底的に評価し,重要な知見を浮き彫りにし,今後の可能性と,このアプローチにかかわる課題について論じる。
- 参考スコア(独自算出の注目度): 4.716340512462896
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Understanding protein interactions and pathway knowledge is crucial for
unraveling the complexities of living systems and investigating the underlying
mechanisms of biological functions and complex diseases. While existing
databases provide curated biological data from literature and other sources,
they are often incomplete and their maintenance is labor-intensive,
necessitating alternative approaches. In this study, we propose to harness the
capabilities of large language models to address these issues by automatically
extracting such knowledge from the relevant scientific literature. Toward this
goal, in this work, we investigate the effectiveness of different large
language models in tasks that involve recognizing protein interactions,
pathways, and gene regulatory relations. We thoroughly evaluate the performance
of various models, highlight the significant findings, and discuss both the
future opportunities and the remaining challenges associated with this
approach. The code and data are available at:
https://github.com/boxorange/BioIE-LLM
- Abstract(参考訳): タンパク質の相互作用と経路の知識を理解することは、生体システムの複雑さを解明し、生物学的機能や複雑な疾患の基盤となるメカニズムを研究するために重要である。
既存のデータベースは、文学やその他の情報源から収集された生物学的データを提供するが、それらはしばしば不完全であり、保守は労働集約的であり、代替アプローチを必要とする。
本研究では,このような知識を科学文献から自動抽出し,大規模言語モデルの能力を活用することを提案する。
そこで本研究では,タンパク質の相互作用,経路,遺伝子制御関係の認識に関わるタスクにおいて,異なる大規模言語モデルの有効性を検討する。
我々は,様々なモデルの性能を徹底的に評価し,重要な知見を浮き彫りにし,今後の可能性と今後の課題を議論する。
コードとデータは、https://github.com/boxorange/bioie-llmで入手できる。
関連論文リスト
- Explainable AI Methods for Multi-Omics Analysis: A Survey [3.885941688264509]
マルチオミクス(multi-omics)とは、複数の「オム」から派生したデータの積分解析である。
深層学習の手法は、マルチオミクスデータの統合や、分子間相互作用の洞察、複雑な疾患の研究の強化にますます活用されている。
これらのモデルは、多くの相互接続層と非線形関係を持ち、しばしばブラックボックスとして機能し、意思決定プロセスにおける透明性を欠いている。
このレビューでは、マルチオミクス研究において、xAIが深層学習モデルの解釈可能性を改善する方法について検討し、臨床医に明確な洞察を与える可能性を強調した。
論文 参考訳(メタデータ) (2024-10-15T05:01:17Z) - Explainable Biomedical Hypothesis Generation via Retrieval Augmented Generation enabled Large Language Models [46.05020842978823]
大規模言語モデル(LLM)はこの複雑なデータランドスケープをナビゲートする強力なツールとして登場した。
RAGGEDは、知識統合と仮説生成を伴う研究者を支援するために設計された包括的なワークフローである。
論文 参考訳(メタデータ) (2024-07-17T07:44:18Z) - Optimal Transport for Latent Integration with An Application to Heterogeneous Neuronal Activity Data [1.5311478638611091]
本稿では,複雑な生物学的プロセスにおいて共有パターンを抽出する最適なトランスポートに基づく,新しい異種データ統合フレームワークを提案する。
本手法は,少数の被験者でも有効であり,アライメントに補助的なマッチング情報を必要としない。
論文 参考訳(メタデータ) (2024-06-27T04:29:21Z) - Cognitive Evolutionary Learning to Select Feature Interactions for Recommender Systems [59.117526206317116]
Cellはさまざまなタスクやデータに対して,さまざまなモデルに適応的に進化可能であることを示す。
4つの実世界のデータセットの実験では、細胞は最先端のベースラインを大幅に上回っている。
論文 参考訳(メタデータ) (2024-05-29T02:35:23Z) - BioDiscoveryAgent: An AI Agent for Designing Genetic Perturbation Experiments [112.25067497985447]
そこで,BioDiscoveryAgentを紹介した。このエージェントは,新しい実験を設計し,その結果の理由を明らかにし,仮説空間を効率的にナビゲートし,望ましい解に到達させる。
BioDiscoveryAgentは、機械学習モデルをトレーニングすることなく、新しい実験を独自に設計することができる。
6つのデータセットで関連する遺伝的摂動を予測することで、平均21%の改善が達成されている。
論文 参考訳(メタデータ) (2024-05-27T19:57:17Z) - Leveraging Biomolecule and Natural Language through Multi-Modal
Learning: A Survey [75.47055414002571]
生物分子モデリングと自然言語(BL)の統合は、人工知能、化学、生物学の交差点において有望な学際領域として現れてきた。
生体分子と自然言語の相互モデリングによって達成された最近の進歩について分析する。
論文 参考訳(メタデータ) (2024-03-03T14:59:47Z) - An Evaluation of Large Language Models in Bioinformatics Research [52.100233156012756]
本研究では,大規模言語モデル(LLM)の性能について,バイオインフォマティクスの幅広い課題について検討する。
これらのタスクには、潜在的なコーディング領域の同定、遺伝子とタンパク質の命名されたエンティティの抽出、抗微生物および抗がんペプチドの検出、分子最適化、教育生物情報学問題の解決が含まれる。
以上の結果から, GPT 変種のような LLM がこれらのタスクの多くをうまく処理できることが示唆された。
論文 参考訳(メタデータ) (2024-02-21T11:27:31Z) - Graph-Based Retriever Captures the Long Tail of Biomedical Knowledge [2.2814097119704058]
大規模言語モデル(LLM)は、膨大な知識を要約して提示することで、情報の検索方法を変えつつある。
LLMはトレーニングセットから最も頻繁に見られる情報を強調し、まれな情報を無視する傾向があります。
本稿では,これらのクラスタをダウンサンプリングし,情報過負荷問題を緩和するために知識グラフを活用する新しい情報検索手法を提案する。
論文 参考訳(メタデータ) (2024-02-19T18:31:11Z) - Causal machine learning for single-cell genomics [94.28105176231739]
単細胞ゲノミクスへの機械学習技術の応用とその課題について論じる。
まず, 単一細胞生物学における現在の因果的アプローチの基盤となるモデルについて述べる。
次に、単一セルデータへの因果的アプローチの適用におけるオープンな問題を特定する。
論文 参考訳(メタデータ) (2023-10-23T13:35:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。