論文の概要: GPTON: Generative Pre-trained Transformers enhanced with Ontology Narration for accurate annotation of biological data
- arxiv url: http://arxiv.org/abs/2410.10899v2
- Date: Thu, 17 Oct 2024 04:08:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-18 13:18:44.762530
- Title: GPTON: Generative Pre-trained Transformers enhanced with Ontology Narration for accurate annotation of biological data
- Title(参考訳): GPTON:生物データの正確なアノテーションのためのオントロジーナレーションで強化された生成事前学習変換器
- Authors: Rongbin Li, Wenbo Chen, Jinbo Li, Hanwen Xing, Hua Xu, Zhao Li, W. Jim Zheng,
- Abstract要約: GPTONは、構造化された知識を言語化されたオントロジーの用語を通じてLLMに注入し、上位5つの予測における遺伝子セットの68%の正確なテキストとアノテーションを達成している。
手動による評価により、GPTONの堅牢性は確認され、遺伝子セットアノテーションを超えるバイオメディカル研究を著しく前進させるLLMと構造化知識を活用する可能性を強調している。
- 参考スコア(独自算出の注目度): 12.975085314117889
- License:
- Abstract: By leveraging GPT-4 for ontology narration, we developed GPTON to infuse structured knowledge into LLMs through verbalized ontology terms, achieving accurate text and ontology annotations for over 68% of gene sets in the top five predictions. Manual evaluations confirm GPTON's robustness, highlighting its potential to harness LLMs and structured knowledge to significantly advance biomedical research beyond gene set annotation.
- Abstract(参考訳): GPT-4をオントロジーのナレーションに活用することにより、言語化されたオントロジー用語を用いて構造化知識をLLMに注入し、上位5つの予測において68%以上の遺伝子セットに対して正確なテキストおよびオントロジーアノテーションを達成した。
手動による評価により、GPTONの堅牢性は確認され、遺伝子セットアノテーションを超えるバイオメディカル研究を著しく前進させるLLMと構造化知識を活用する可能性を強調している。
関連論文リスト
- SciGisPy: a Novel Metric for Biomedical Text Simplification via Gist Inference Score [7.4751114996742]
我々は、Fizzy-Trace Theory(FTT)のGist Inference Score(GIS)にインスパイアされた新しい評価指標であるSciGisPyを紹介する。
SciGisPyは、単純化されたテキストが理解に必要な抽象的推論(gist)の形成をいかに促進するかを測定する。
The Cochrane Biomedical text simplification dataset on our experimental evaluation showed that SciGisPy developed outperforms the original GIS formulation。
論文 参考訳(メタデータ) (2024-10-12T19:53:56Z) - Reasoning-Enhanced Healthcare Predictions with Knowledge Graph Community Retrieval [61.70489848327436]
KAREは、知識グラフ(KG)コミュニティレベルの検索と大規模言語モデル(LLM)推論を統合する新しいフレームワークである。
MIMIC-IIIでは最大10.8~15.0%、MIMIC-IVでは12.6~12.7%である。
論文 参考訳(メタデータ) (2024-10-06T18:46:28Z) - VQDNA: Unleashing the Power of Vector Quantization for Multi-Species Genomic Sequence Modeling [60.91599380893732]
VQDNAは、ゲノムボキャブラリ学習の観点からゲノムのトークン化を改良する汎用フレームワークである。
ベクトル量子化されたコードブックを学習可能な語彙として活用することにより、VQDNAはゲノムをパターン認識の埋め込みに適応的にトークン化することができる。
論文 参考訳(メタデータ) (2024-05-13T20:15:03Z) - Thought Graph: Generating Thought Process for Biological Reasoning [40.24580620941457]
我々は、複雑な推論をサポートするための新しいフレームワークとして、Thought Graphを提示する。
我々は、生物学的プロセス間の意味的関係を明らかにするために、遺伝子セット分析を例に挙げる。
論文 参考訳(メタデータ) (2024-03-11T20:28:27Z) - Efficient and Scalable Fine-Tune of Language Models for Genome
Understanding [49.606093223945734]
textscLanguage prefix ftextscIne-tuning for textscGentextscOmes。
DNA基盤モデルとは異なり、textscLingoは自然言語基盤モデルの文脈的手がかりを戦略的に活用している。
textscLingoはさらに、適応的なランクサンプリング方法により、下流の細調整タスクを数多く許容する。
論文 参考訳(メタデータ) (2024-02-12T21:40:45Z) - Diversifying Knowledge Enhancement of Biomedical Language Models using
Adapter Modules and Knowledge Graphs [54.223394825528665]
我々は、軽量なアダプターモジュールを用いて、構造化された生体医学的知識を事前訓練された言語モデルに注入するアプローチを開発した。
バイオメディカル知識システムUMLSと新しいバイオケミカルOntoChemの2つの大きなKGと、PubMedBERTとBioLinkBERTの2つの著名なバイオメディカルPLMを使用している。
計算能力の要件を低く保ちながら,本手法がいくつかの事例において性能改善につながることを示す。
論文 参考訳(メタデータ) (2023-12-21T14:26:57Z) - Biomedical knowledge graph-optimized prompt generation for large language models [1.6658478064349376]
大規模言語モデル(LLM)は前例のない速度で採用されているが、バイオメディシンのような知識集約ドメインでは依然として課題に直面している。
本稿では,トークン最適化およびロバストな知識グラフに基づくRetrieval Augmented Generationフレームワークを紹介する。
論文 参考訳(メタデータ) (2023-11-29T03:07:00Z) - Exploring the Boundaries of GPT-4 in Radiology [46.30976153809968]
GPT-4は、複雑なコンテキストにおいて、時折エラーしか発生しない十分なレベルの放射線学知識を持っている。
結果の要約では、GPT-4の出力は、既存の手書きのインプレッションと総合的に比較できる。
論文 参考訳(メタデータ) (2023-10-23T05:13:03Z) - Tertiary Lymphoid Structures Generation through Graph-based Diffusion [54.37503714313661]
本研究では,最先端のグラフベース拡散モデルを用いて生物学的に意味のある細胞グラフを生成する。
本研究では, グラフ拡散モデルを用いて, 3次リンパ構造(TLS)の分布を正確に学習できることを示す。
論文 参考訳(メタデータ) (2023-10-10T14:37:17Z) - Gene Set Summarization using Large Language Models [1.312659265502151]
我々はGPTモデルを用いて遺伝子セット関数の要約を行う手法を開発した。
これらの手法は,遺伝子セットのGO項リストを,有用かつ生物学的に有効に作成できることを示す。
しかし、GPTベースのアプローチでは、信頼できるスコアやp値が得られず、統計的に重要でない項を返すこともしばしばある。
論文 参考訳(メタデータ) (2023-05-21T02:06:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。