論文の概要: From Single to Multi-Agent Reasoning: Advancing GeneGPT for Genomics QA
- arxiv url: http://arxiv.org/abs/2601.10581v1
- Date: Thu, 15 Jan 2026 16:54:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-16 19:43:19.233421
- Title: From Single to Multi-Agent Reasoning: Advancing GeneGPT for Genomics QA
- Title(参考訳): シングルエージェント推論からマルチエージェント推論へ:GeneGPTのゲノミクスQAへの応用
- Authors: Kimia Abedini, Farzad Shami, Gianmaria Silvello,
- Abstract要約: 大規模言語モデル(LLM)は、ゲノム質問応答(QA)の可能性を提供するが、ドメイン固有のデータベースへのアクセスが制限されているため制限に直面している。
我々は、複雑なゲノミクスクエリのための特殊エージェントを効率的にコーディネートするマルチエージェントフレームワークであるGenomAgentを提案する。
- 参考スコア(独自算出の注目度): 3.5140398997363853
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Comprehending genomic information is essential for biomedical research, yet extracting data from complex distributed databases remains challenging. Large language models (LLMs) offer potential for genomic Question Answering (QA) but face limitations due to restricted access to domain-specific databases. GeneGPT is the current state-of-the-art system that enhances LLMs by utilizing specialized API calls, though it is constrained by rigid API dependencies and limited adaptability. We replicate GeneGPT and propose GenomAgent, a multi-agent framework that efficiently coordinates specialized agents for complex genomics queries. Evaluated on nine tasks from the GeneTuring benchmark, GenomAgent outperforms GeneGPT by 12% on average, and its flexible architecture extends beyond genomics to various scientific domains needing expert knowledge extraction.
- Abstract(参考訳): ゲノム情報を補完することは生物医学研究に不可欠であるが、複雑な分散データベースからデータを抽出することは依然として困難である。
大規模言語モデル(LLM)は、ゲノム質問応答(QA)の可能性を提供するが、ドメイン固有のデータベースへのアクセスが制限されているため制限に直面している。
GeneGPTは、厳格なAPI依存性と限定的な適応性によって制約されているが、特殊なAPI呼び出しを利用することでLLMを強化する現在の最先端システムである。
我々はGeneGPTを複製し、複雑なゲノミクスクエリのための特殊エージェントを効率的にコーディネートするマルチエージェントフレームワークGenomAgentを提案する。
GeneTuringベンチマークから9つのタスクを評価したGenomAgentは、GeneGPTを平均で12%上回り、その柔軟なアーキテクチャはゲノム学を超えて、専門知識の抽出を必要とするさまざまな科学領域にまで拡張されている。
関連論文リスト
- Beyond GeneGPT: A Multi-Agent Architecture with Open-Source LLMs for Enhanced Genomic Question Answering [29.961363790887003]
我々は、Llama 3.1、Qwen2.5、Qwen2.5 Coderなどのオープンソースモデルを用いて、モノリシックなアーキテクチャでGeneGPTを再現する。
次に、ツールルーティング、クエリ生成、レスポンスバリデーションのためのエージェント特殊化を導入することで、GeneGPTを拡張するモジュール型マルチエージェントフレームワークであるOpenBioLLMを開発する。
OpenBioLLMは、ベンチマークタスクの90%以上でGeneGPTにマッチし、Gene-Turingで0.849、GeneHopで0.830を達成している。
論文 参考訳(メタデータ) (2025-11-19T03:08:20Z) - GenoMAS: A Multi-Agent Framework for Scientific Discovery via Code-Driven Gene Expression Analysis [12.311957227670598]
GenoMASは、タイプされたメッセージパッシングプロトコルを通じて6つの特殊エージェントを編成する。
GenoMASの中心には、ガイド付き計画フレームワークがある。
GenoMASは生物学的に証明可能な遺伝子フェノタイプ関連をその文献で裏付ける。
論文 参考訳(メタデータ) (2025-07-28T17:55:08Z) - GENERator: A Long-Context Generative Genomic Foundation Model [66.46537421135996]
本稿では,98k塩基対 (bp) と1.2Bパラメータからなるゲノム基盤モデル GENERator を提案する。
DNAの386Bbpからなる拡張データセットに基づいて、GENERatorは、確立されたベンチマークと新しく提案されたベンチマークの両方で最先端のパフォーマンスを実証する。
また、特に特定のアクティビティプロファイルを持つエンハンサーシーケンスを即応的に生成することで、シーケンス最適化において大きな可能性を秘めている。
論文 参考訳(メタデータ) (2025-02-11T05:39:49Z) - GenBench: A Benchmarking Suite for Systematic Evaluation of Genomic Foundation Models [56.63218531256961]
我々はGenomic Foundation Modelsの有効性を評価するためのベンチマークスイートであるGenBenchを紹介する。
GenBenchはモジュラーで拡張可能なフレームワークを提供し、様々な最先端の方法論をカプセル化している。
本稿では,タスク固有性能におけるモデルアーキテクチャとデータセット特性の相互作用のニュアンス解析を行う。
論文 参考訳(メタデータ) (2024-06-01T08:01:05Z) - BioDiscoveryAgent: An AI Agent for Designing Genetic Perturbation Experiments [112.25067497985447]
そこで,BioDiscoveryAgentを紹介した。このエージェントは,新しい実験を設計し,その結果の理由を明らかにし,仮説空間を効率的にナビゲートし,望ましい解に到達させる。
BioDiscoveryAgentは、機械学習モデルをトレーニングすることなく、新しい実験を独自に設計することができる。
6つのデータセットで関連する遺伝的摂動を予測することで、平均21%の改善が達成されている。
論文 参考訳(メタデータ) (2024-05-27T19:57:17Z) - GeneAgent: Self-verification Language Agent for Gene Set Knowledge Discovery using Domain Databases [5.831842925038342]
自己検証機能を備えた第一種言語エージェントGeneAgentを提案する。
様々な生物学的データベースと自律的に相互作用し、精度を高め、幻覚の発生を減らす。
異なるソースから1,106の遺伝子セットをベンチマークすると、GeneAgentは標準のGPT-4よりずっと優れています。
論文 参考訳(メタデータ) (2024-05-25T12:35:15Z) - Toward a Team of AI-made Scientists for Scientific Discovery from Gene Expression Data [21.766339368749872]
我々は、科学的な発見パイプラインを合理化するために設計された新しいフレームワーク、AIマニュフェストチーム(TAIS)を紹介する。
TAISは、プロジェクトマネージャ、データエンジニア、ドメインエキスパートを含むシミュレートされた役割で構成され、それぞれがLLM(Large Language Model)によって表現される。
これらの役割は、典型的にはデータ科学者が行うタスクを再現するために協力し、疾患予測遺伝子を特定することに焦点を当てている。
論文 参考訳(メタデータ) (2024-02-15T06:30:12Z) - Efficient and Scalable Fine-Tune of Language Models for Genome
Understanding [49.606093223945734]
textscLanguage prefix ftextscIne-tuning for textscGentextscOmes。
DNA基盤モデルとは異なり、textscLingoは自然言語基盤モデルの文脈的手がかりを戦略的に活用している。
textscLingoはさらに、適応的なランクサンプリング方法により、下流の細調整タスクを数多く許容する。
論文 参考訳(メタデータ) (2024-02-12T21:40:45Z) - Genetic InfoMax: Exploring Mutual Information Maximization in
High-Dimensional Imaging Genetics Studies [50.11449968854487]
遺伝子ワイド・アソシエーション(GWAS)は、遺伝的変異と特定の形質の関係を同定するために用いられる。
画像遺伝学の表現学習は、GWASによって引き起こされる固有の課題により、ほとんど探索されていない。
本稿では,GWAS の具体的な課題に対処するために,トランスモーダル学習フレームワーク Genetic InfoMax (GIM) を提案する。
論文 参考訳(メタデータ) (2023-09-26T03:59:21Z) - Cancer-inspired Genomics Mapper Model for the Generation of Synthetic
DNA Sequences with Desired Genomics Signatures [0.0]
がんに触発されたゲノムマッパーモデル(CGMM)は、遺伝的アルゴリズム(GA)とディープラーニング(DL)の手法を組み合わせたものである。
我々はCGMMが、祖先や癌などの選択された表現型の合成ゲノムを生成できることを実証した。
論文 参考訳(メタデータ) (2023-05-01T07:16:40Z) - Multi-modal Self-supervised Pre-training for Regulatory Genome Across
Cell Types [75.65676405302105]
我々は、GeneBERTと呼ばれる、多モードかつ自己管理的な方法でゲノムデータを事前学習するための、単純かつ効果的なアプローチを提案する。
我々はATAC-seqデータセットで1700万のゲノム配列でモデルを事前訓練する。
論文 参考訳(メタデータ) (2021-10-11T12:48:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。