Fugu-MT 論文翻訳(概要): Toward a Team of AI-made Scientists for Scientific Discovery from Gene Expression Data

論文の概要: Toward a Team of AI-made Scientists for Scientific Discovery from Gene Expression Data

arxiv url: http://arxiv.org/abs/2402.12391v2
Date: Wed, 21 Feb 2024 03:42:32 GMT
ステータス: 翻訳完了
システム内更新日: 2024-02-22 18:34:53.179338
Title: Toward a Team of AI-made Scientists for Scientific Discovery from Gene Expression Data
Title（参考訳）: 遺伝子発現データによる科学発見のためのAI製科学者チームを目指して
Authors: Haoyang Liu, Yijiang Li, Jinglin Jian, Yuxuan Cheng, Jianrong Lu, Shuyi Guo, Jinglei Zhu, Mianchen Zhang, Miantong Zhang, Haohan Wang
Abstract要約: 我々は、科学的な発見パイプラインを合理化するために設計された新しいフレームワーク、AIマニュフェストチーム(TAIS)を紹介する。 TAISは、プロジェクトマネージャ、データエンジニア、ドメインエキスパートを含むシミュレートされた役割で構成され、それぞれがLLM(Large Language Model)によって表現される。これらの役割は、典型的にはデータ科学者が行うタスクを再現するために協力し、疾患予測遺伝子を特定することに焦点を当てている。
参考スコア（独自算出の注目度）: 9.767546641019862
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Machine learning has emerged as a powerful tool for scientific discovery, enabling researchers to extract meaningful insights from complex datasets. For instance, it has facilitated the identification of disease-predictive genes from gene expression data, significantly advancing healthcare. However, the traditional process for analyzing such datasets demands substantial human effort and expertise for the data selection, processing, and analysis. To address this challenge, we introduce a novel framework, a Team of AI-made Scientists (TAIS), designed to streamline the scientific discovery pipeline. TAIS comprises simulated roles, including a project manager, data engineer, and domain expert, each represented by a Large Language Model (LLM). These roles collaborate to replicate the tasks typically performed by data scientists, with a specific focus on identifying disease-predictive genes. Furthermore, we have curated a benchmark dataset to assess TAIS's effectiveness in gene identification, demonstrating our system's potential to significantly enhance the efficiency and scope of scientific exploration. Our findings represent a solid step towards automating scientific discovery through large language models.
Abstract（参考訳）: 機械学習は科学的発見のための強力なツールとして登場し、研究者は複雑なデータセットから意味のある洞察を抽出できる。例えば、疾患予測遺伝子を遺伝子発現データから同定し、医療を大幅に進歩させた。しかし、そのようなデータセットを分析する従来のプロセスは、データの選択、処理、分析に多大な努力と専門知識を必要とする。この課題に対処するために,我々は新たなフレームワークであるai-made scientists(tais)を導入し,科学的発見パイプラインを合理化する。 TAISは、プロジェクトマネージャ、データエンジニア、ドメインエキスパートを含むシミュレーションされた役割で構成され、それぞれがLLM(Large Language Model)によって表現される。これらの役割は、データサイエンティストが一般的に行うタスクを再現するために協力し、特に疾患予測遺伝子を特定することに焦点を当てている。さらに、遺伝子同定におけるTAISの有効性を評価するためのベンチマークデータセットをキュレートし、科学的探索の効率と範囲を大幅に向上させるシステムの可能性を示した。我々の発見は、大規模な言語モデルによる科学的発見を自動化するための確かなステップである。

関連論文リスト

Self-supervised learning on gene expression data [3.8623569699070353]
遺伝子発現データから表現型を予測することは、疾患のメカニズム、薬物反応、パーソナライズド医療への洞察を可能にする生体医学研究において重要な課題である。従来の機械学習とディープラーニングは、大量のラベル付きデータを必要とする教師付き学習に依存している。自己教師付き学習は、ラベルのないデータ構造から直接情報を抽出することで、これらの制限を克服するための有望なアプローチとして現れてきた。
論文参考訳（メタデータ） (2025-07-18T13:43:04Z)
VitaGraph: Building a Knowledge Graph for Biologically Relevant Learning Tasks [8.962235896860294]
複数の公開データセットの統合と精錬によって構築された包括的生物学的知識グラフを提案する。得られたリソースは、計算生物学と精密医療の研究を進めるための最先端のプラットフォームとして機能する、一貫性があり信頼性の高い生物学的知識グラフである。
論文参考訳（メタデータ） (2025-05-16T12:43:04Z)
GENERator: A Long-Context Generative Genomic Foundation Model [66.46537421135996]
本稿では,98k塩基対 (bp) と1.2Bパラメータからなるゲノム基盤モデル GENERator を提案する。 DNAの386Bbpからなる拡張データセットに基づいて、GENERatorは、確立されたベンチマークと新しく提案されたベンチマークの両方で最先端のパフォーマンスを実証する。また、特に特定のアクティビティプロファイルを持つエンハンサーシーケンスを即応的に生成することで、シーケンス最適化において大きな可能性を秘めている。
論文参考訳（メタデータ） (2025-02-11T05:39:49Z)
GeneSUM: Large Language Model-based Gene Summary Extraction [20.181381276458488]
大規模言語モデル(LLM)を利用した2段階自動遺伝子サプリメント抽出装置であるGeneSUMを提案する。本手法は, 対象遺伝子文学の冗長性を検索し, 除去し, LLMを微調整し, 要約過程を洗練・合理化する。
論文参考訳（メタデータ） (2024-12-24T04:20:43Z)
AIGS: Generating Science from AI-Powered Automated Falsification [17.50867181053229]
本稿では,重要な研究プロセスを代表する役割を担ったマルチエージェントシステムである,フルプロセスAIGSシステムのベビーステップとして,Baby-AIGSを提案する。 3つのタスクの実験では、Baby-AIGSは経験豊富な人間の研究者と同等ではないが、有意義な科学的発見を産み出すことができた。
論文参考訳（メタデータ） (2024-11-17T13:40:35Z)
Knowledge-Driven Feature Selection and Engineering for Genotype Data with Large Language Models [35.084222907099644]
FREEFORM, Free-flow Reasoning, Ensembling for Enhanced Feature Output and Robust Modeling。 https://github.com/PennShenLab/FREEFORM.com/FreeFORMはGitHubのオープンソースフレームワークとして利用可能だ。
論文参考訳（メタデータ） (2024-10-02T17:53:08Z)
GenoTEX: A Benchmark for Evaluating LLM-Based Exploration of Gene Expression Data in Alignment with Bioinformaticians [13.837406082703756]
我々は、遺伝子発現データの自動探索のためのベンチマークデータセットであるGenoTEXを紹介する。 GenoTEXは、幅広い遺伝子識別問題を解決するための注釈付きコードと結果を提供する。我々は、文脈対応計画、反復的修正、ドメインエキスパートコンサルティングを設計したLLMベースのエージェントチームであるGenoAgentsを紹介する。
論文参考訳（メタデータ） (2024-06-21T17:55:24Z)
SciRIFF: A Resource to Enhance Language Model Instruction-Following over Scientific Literature [80.49349719239584]
SciRIFF(Scientific Resource for Instruction-Following and Finetuning, SciRIFF)は、54のタスクに対して137Kの命令追従デモのデータセットである。 SciRIFFは、幅広い科学分野の研究文献から情報を抽出し、合成することに焦点を当てた最初のデータセットである。
論文参考訳（メタデータ） (2024-06-10T21:22:08Z)
BioDiscoveryAgent: An AI Agent for Designing Genetic Perturbation Experiments [112.25067497985447]
そこで,BioDiscoveryAgentを紹介した。このエージェントは,新しい実験を設計し,その結果の理由を明らかにし,仮説空間を効率的にナビゲートし,望ましい解に到達させる。 BioDiscoveryAgentは、機械学習モデルをトレーニングすることなく、新しい実験を独自に設計することができる。 6つのデータセットで関連する遺伝的摂動を予測することで、平均21%の改善が達成されている。
論文参考訳（メタデータ） (2024-05-27T19:57:17Z)
CRISPR-GPT: An LLM Agent for Automated Design of Gene-Editing Experiments [51.41735920759667]
大規模言語モデル(LLM)は様々なタスクにおいて有望であるが、しばしば特定の知識が欠如し、生物学的設計の問題を正確に解くのに苦労する。本研究では,CRISPRに基づく遺伝子編集実験の設計プロセスを自動化するために,ドメイン知識と外部ツールを付加したLCMエージェントであるCRISPR-GPTを紹介する。
論文参考訳（メタデータ） (2024-04-27T22:59:17Z)
GENEVIC: GENetic data Exploration and Visualization via Intelligent interactive Console [6.786793669890866]
GENEVICは、遺伝的データ生成と生物医学的知識発見のギャップを埋める、AI駆動のチャットフレームワークである。カスタマイズされたドメイン固有の遺伝情報の分析、検索、可視化を自動化する。機能を統合して、タンパク質相互作用ネットワークの生成、遺伝子セットの強化、PubMed、Google Scholar、arXivから科学文献の検索を行う。
論文参考訳（メタデータ） (2024-04-04T20:53:30Z)
Causal machine learning for single-cell genomics [94.28105176231739]
単細胞ゲノミクスへの機械学習技術の応用とその課題について論じる。まず, 単一細胞生物学における現在の因果的アプローチの基盤となるモデルについて述べる。次に、単一セルデータへの因果的アプローチの適用におけるオープンな問題を特定する。
論文参考訳（メタデータ） (2023-10-23T13:35:24Z)
Genetic InfoMax: Exploring Mutual Information Maximization in High-Dimensional Imaging Genetics Studies [50.11449968854487]
遺伝子ワイド・アソシエーション(GWAS)は、遺伝的変異と特定の形質の関係を同定するために用いられる。画像遺伝学の表現学習は、GWASによって引き起こされる固有の課題により、ほとんど探索されていない。本稿では,GWAS の具体的な課題に対処するために,トランスモーダル学習フレームワーク Genetic InfoMax (GIM) を提案する。
論文参考訳（メタデータ） (2023-09-26T03:59:21Z)
A New Deep Learning and XAI-Based Algorithm for Features Selection in Genomics [5.787117733071415]
本稿では,ゲノム規模のデータに基づいて特徴選択を行う新しいアルゴリズムを提案する。慢性リンパ性白血病データセットへの応用の結果は、アルゴリズムの有効性を証明している。
論文参考訳（メタデータ） (2023-03-29T16:44:13Z)
Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文参考訳（メタデータ） (2020-09-02T02:50:30Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。