論文の概要: OLAF: An Open Life Science Analysis Framework for Conversational Bioinformatics Powered by Large Language Models
- arxiv url: http://arxiv.org/abs/2504.03976v2
- Date: Thu, 10 Apr 2025 19:32:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-14 14:15:08.649958
- Title: OLAF: An Open Life Science Analysis Framework for Conversational Bioinformatics Powered by Large Language Models
- Title(参考訳): OLAF:大規模言語モデルを用いた対話型バイオインフォマティクスのためのオープンライフサイエンス分析フレームワーク
- Authors: Dylan Riffle, Nima Shirooni, Cody He, Manush Murali, Sovit Nayak, Rishikumar Gopalan, Diego Gonzalez Lopez,
- Abstract要約: OLAF(Open Life Science Analysis Framework)は、自然言語を用いてバイオインフォマティクス分析を行うオープンソースプラットフォームである。
大規模言語モデル(LLM)とモジュール型のエージェント-パイプ-ルータアーキテクチャを組み合わせることで、OLAFは実際の科学的データに基づいてバイオインフォマティクスコードを生成し、実行します。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: OLAF (Open Life Science Analysis Framework) is an open-source platform that enables researchers to perform bioinformatics analyses using natural language. By combining large language models (LLMs) with a modular agent-pipe-router architecture, OLAF generates and executes bioinformatics code on real scientific data, including formats like .h5ad. The system includes an Angular front end and a Python/Firebase backend, allowing users to run analyses such as single-cell RNA-seq workflows, gene annotation, and data visualization through a simple web interface. Unlike general-purpose AI tools, OLAF integrates code execution, data handling, and scientific libraries in a reproducible, user-friendly environment. It is designed to lower the barrier to computational biology for non-programmers and support transparent, AI-powered life science research.
- Abstract(参考訳): OLAF(Open Life Science Analysis Framework)は、自然言語を用いてバイオインフォマティクス分析を行うオープンソースプラットフォームである。
大規模言語モデル(LLM)とモジュール型のエージェント-パイプ-ルータアーキテクチャを組み合わせることで、OLAFは.NETのようなフォーマットを含む実際の科学データ上でバイオインフォマティクスコードを生成し、実行します。
H5AD
このシステムにはAngularフロントエンドとPython/Firebaseバックエンドが含まれており、ユーザーは単純なWebインターフェースを通じてシングルセルRNA-seqワークフロー、遺伝子アノテーション、データ視覚化などの分析を実行することができる。
汎用AIツールとは異なり、OLAFはコード実行、データハンドリング、科学ライブラリを再現可能なユーザフレンドリな環境に統合する。
非プログラマの計算生物学への障壁を低くし、透明でAIを活用した生命科学研究をサポートするように設計されている。
関連論文リスト
- Language Model Powered Digital Biology with BRAD [5.309032614374711]
大規模言語モデル(LLM)は構造化されていない統合に適しています。
バイオインフォマティクス検索デジタルアシスタント(BRAD)の試作について紹介する。
論文 参考訳(メタデータ) (2024-09-04T16:43:14Z) - SeqMate: A Novel Large Language Model Pipeline for Automating RNA Sequencing [0.0]
SeqMateは、大規模言語モデル(LLM)のパワーを活用してワンクリック分析を可能にするツールで、データ準備と分析の両方を自動化する。
生成AIの力を利用することで、SeqMateはこれらの発見を分析し、制御/制御/ユーザプロンプトされた遺伝子について書かれたレポートを作成することができる。
論文 参考訳(メタデータ) (2024-07-02T20:28:30Z) - An Evaluation of Large Language Models in Bioinformatics Research [52.100233156012756]
本研究では,大規模言語モデル(LLM)の性能について,バイオインフォマティクスの幅広い課題について検討する。
これらのタスクには、潜在的なコーディング領域の同定、遺伝子とタンパク質の命名されたエンティティの抽出、抗微生物および抗がんペプチドの検出、分子最適化、教育生物情報学問題の解決が含まれる。
以上の結果から, GPT 変種のような LLM がこれらのタスクの多くをうまく処理できることが示唆された。
論文 参考訳(メタデータ) (2024-02-21T11:27:31Z) - Advancing bioinformatics with large language models: components, applications and perspectives [12.728981464533918]
LLM(Large Language Model)は、ディープラーニングに基づく人工知能モデルのクラスである。
バイオインフォマティクスにおける大規模言語モデル(LLM)の本質的構成要素について概観する。
主な側面としては、さまざまなデータ型に対するトークン化メソッド、トランスフォーマーモデルのアーキテクチャ、コアアテンションメカニズムなどがある。
論文 参考訳(メタデータ) (2024-01-08T17:26:59Z) - Large Language Models for Generative Information Extraction: A Survey [89.71273968283616]
大規模言語モデル(LLM)は、テキスト理解と生成において顕著な能力を示した。
各種IEサブタスクと技術の観点から,これらの作品を分類して概観する。
我々は,最も先進的な手法を実証的に分析し,LLMによるIEタスクの出現傾向を明らかにする。
論文 参考訳(メタデータ) (2023-12-29T14:25:22Z) - GenoCraft: A Comprehensive, User-Friendly Web-Based Platform for High-Throughput Omics Data Analysis and Visualization [23.53674358126236]
GenoCraftは、オミクスデータ処理のパイプライン全体を扱うように設計された、Webベースの包括的なソフトウェアソリューションである。
GenoCraftは高度なバイオインフォマティクスツールを備えた統一プラットフォームを提供し、オミクスデータ分析のあらゆる側面をカバーする。
論文 参考訳(メタデータ) (2023-12-21T19:06:34Z) - Diversifying Knowledge Enhancement of Biomedical Language Models using
Adapter Modules and Knowledge Graphs [54.223394825528665]
我々は、軽量なアダプターモジュールを用いて、構造化された生体医学的知識を事前訓練された言語モデルに注入するアプローチを開発した。
バイオメディカル知識システムUMLSと新しいバイオケミカルOntoChemの2つの大きなKGと、PubMedBERTとBioLinkBERTの2つの著名なバイオメディカルPLMを使用している。
計算能力の要件を低く保ちながら,本手法がいくつかの事例において性能改善につながることを示す。
論文 参考訳(メタデータ) (2023-12-21T14:26:57Z) - SelfEEG: A Python library for Self-Supervised Learning in
Electroencephalography [0.0]
SelfEEGは、研究者が脳波(EEG)データに対して自己監視学習(SSL)実験を行うのを支援するために開発されたオープンソースのPythonライブラリである。
その主な目的は、ユーザフレンドリで高度にカスタマイズ可能な環境を提供することで、EEGデータ上で、自己教師付き学習タスクを効率的に設計し、実行できるようにすることである。
論文 参考訳(メタデータ) (2023-12-20T14:58:07Z) - Unsupervised Sentiment Analysis of Plastic Surgery Social Media Posts [91.3755431537592]
ソーシャルメディアプラットフォームにまたがる膨大なユーザー投稿は、主に人工知能(AI)のユースケースに使われていない。
自然言語処理(NLP)は、コーパス(corpora)として知られるドキュメントの体系を利用して、人間のような言語理解でコンピュータを訓練するAIのサブフィールドである。
本研究は, 教師なし解析の応用により, コンピュータがプラスティック手術に対する否定的, 肯定的, 中立的なユーザ感情を予測できることを示した。
論文 参考訳(メタデータ) (2023-07-05T20:16:20Z) - GAIA Search: Hugging Face and Pyserini Interoperability for NLP Training
Data Exploration [97.68234051078997]
我々はPyseriniを、オープンソースのAIライブラリとアーティファクトのHugging Faceエコシステムに統合する方法について論じる。
Jupyter NotebookベースのウォークスルーがGitHubで公開されている。
GAIA Search - 前述した原則に従って構築された検索エンジンで、人気の高い4つの大規模テキストコレクションへのアクセスを提供する。
論文 参考訳(メタデータ) (2023-06-02T12:09:59Z) - GenNI: Human-AI Collaboration for Data-Backed Text Generation [102.08127062293111]
Table2Textシステムは、機械学習を利用した構造化データに基づいてテキスト出力を生成する。
GenNI (Generation Negotiation Interface) は、対話型ビジュアルシステムである。
論文 参考訳(メタデータ) (2021-10-19T18:07:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。