論文の概要: From Prompt to Pipeline: Large Language Models for Scientific Workflow Development in Bioinformatics
- arxiv url: http://arxiv.org/abs/2507.20122v1
- Date: Sun, 27 Jul 2025 04:08:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-29 16:23:56.977188
- Title: From Prompt to Pipeline: Large Language Models for Scientific Workflow Development in Bioinformatics
- Title(参考訳): PromptからPipelineへ:バイオインフォマティクスにおける科学ワークフロー開発のための大規模言語モデル
- Authors: Khairul Alam, Banani Roy,
- Abstract要約: 本研究では,現代大規模言語モデル(LLM)が正確な,完全かつ有用なバイオインフォマティクスタスクの生成を支援することができるかどうかを考察する。
各種SNP解析、RNA-seq、DNAメチル化、データ検索プラットフォームを用いてこれらのモデルを評価する。
その結果,Gemini 2.5 Flash は Galaxy の生成に優れており,DeepSeek-V3 は Nextflow で強く機能していることがわかった。
- 参考スコア(独自算出の注目度): 2.2160604288512324
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The increasing complexity of bioinformatics data analysis has made Scientific Workflow Systems (SWSs) like Galaxy and Nextflow essential for enabling scalable, reproducible, and automated workflows. However, creating and understanding these workflows remains challenging, particularly for domain experts without programming expertise. This study investigates whether modern Large Language Models (LLMs), GPT-4o, Gemini 2.5 Flash, and DeepSeek-V3, can support the generation of accurate, complete, and usable bioinformatics workflows, and examines which prompting strategies most effectively guide this process. We evaluate these models using diverse tasks such as SNP analysis, RNA-seq, DNA methylation, and data retrieval, spanning both graphical (Galaxy) and script-based (Nextflow) platforms. Expert reviewers assess the generated workflows against community-curated baselines from the Galaxy Training Network and nf-core repositories. The results show that Gemini 2.5 Flash excels in generating Galaxy workflows, while DeepSeek-V3 performs strongly in Nextflow. Prompting strategies significantly impact quality, with role-based and chain-of-thought prompts improving completeness and correctness. While GPT-4o benefits from structured inputs, DeepSeek-V3 offers rich technical detail, albeit with some verbosity. Overall, the findings highlight the potential of LLMs to lower the barrier for workflow development, improve reproducibility, and democratize access to computational tools in bioinformatics, especially when combined with thoughtful prompt engineering.
- Abstract(参考訳): バイオインフォマティクスデータ分析の複雑さの増大により、GalaxyやNextflowのようなSWS(Scientific Workflow Systems)は、スケーラブルで再現性があり、自動化されたワークフローを実現する上で不可欠になった。
しかし、これらのワークフローの作成と理解は、特にプログラミングの専門知識のないドメインの専門家にとって、依然として難しい。
本研究では,現代大規模言語モデル (LLMs) や GPT-4o, Gemini 2.5 Flash, DeepSeek-V3 が正確なバイオインフォマティクスワークフローの生成を支援することができるかどうかを検証し,このプロセスを最も効果的に導く戦略について検討する。
SNP解析,RNA-seq,DNAメチル化,データ検索など,グラフィカル(Galaxy)とスクリプトベース(Nextflow)の両プラットフォームにまたがる多様なタスクを用いて,これらのモデルを評価する。
専門家レビュアーは、Galaxy Training Networkとnf-coreレポジトリからコミュニティが作成したベースラインに対して生成されたワークフローを評価する。
その結果、Gemini 2.5 FlashはGalaxyワークフローの生成に優れており、DeepSeek-V3はNextflowで強く機能していることがわかった。
プロンプティング戦略は品質に大きな影響を与え、ロールベースとチェーンオブ思想は完全性と正確性を改善する。
GPT-4oは構造化された入力から恩恵を受けるが、DeepSeek-V3は冗長性はあるものの、豊富な技術的詳細を提供する。
全体としては、LLMがワークフロー開発における障壁を減らし、再現性を改善し、バイオインフォマティクスにおける計算ツールへのアクセスを民主化する可能性を強調している。
関連論文リスト
- Making a Pipeline Production-Ready: Challenges and Lessons Learned in the Healthcare Domain [2.0905671861214894]
SPIRAはML-Enabled System(MLES)を作成し、音声分析によって呼吸不全を診断するプロジェクトである。
本稿では,MLESのアーキテクチャの概要を述べるとともに,その連続訓練サブシステムの3つのバージョンを比較した。
論文は、学習した課題と教訓を共有し、パイプラインを生産しようとする研究者や実践者に洞察を提供する。
論文 参考訳(メタデータ) (2025-06-07T23:00:13Z) - ComfyGPT: A Self-Optimizing Multi-Agent System for Comprehensive ComfyUI Workflow Generation [71.31634636156384]
タスク記述に基づいてComfyUIを生成するように設計された,最初の自己最適化型マルチエージェントシステムであるComfyGPTを紹介する。
ComfyGPTは、ReformatAgent、FlowAgent、RefineAgent、ExecuteAgentの4つの特殊エージェントで構成されている。
FlowDatasetは、13,571のワークフロー記述ペアを含む大規模なデータセットであり、FlowBenchはワークフロー生成システムを評価するためのベンチマークである。
論文 参考訳(メタデータ) (2025-03-22T06:48:50Z) - WorkflowLLM: Enhancing Workflow Orchestration Capability of Large Language Models [105.46456444315693]
ワークフローオーケストレーションにおける大規模言語モデルの能力を高めるための,データ中心のフレームワークであるLLMを提案する。
最初は106,763のサンプルで大規模な微調整Benchを構築し、28のカテゴリにわたる83のアプリケーションから1,503のAPIをカバーしている。
LlamaLlamaは複雑なAPIをオーケストレーションする能力を示しながら、優れた一般化性能を実現している。
論文 参考訳(メタデータ) (2024-11-08T09:58:02Z) - Benchmarking Agentic Workflow Generation [80.74757493266057]
複数面シナリオと複雑なグラフワークフロー構造を備えた統合ワークフロー生成ベンチマークであるWorfBenchを紹介する。
また,サブシーケンスとサブグラフマッチングアルゴリズムを利用したシステム評価プロトコルWorfEvalを提案する。
我々は、生成されたタスクが下流のタスクを強化し、推論中により少ない時間で優れたパフォーマンスを達成することを観察する。
論文 参考訳(メタデータ) (2024-10-10T12:41:19Z) - Spider2-V: How Far Are Multimodal Agents From Automating Data Science and Engineering Workflows? [73.81908518992161]
我々は、プロのデータサイエンスとエンジニアリングに焦点を当てた最初のマルチモーダルエージェントベンチマークであるSpider2-Vを紹介する。
Spider2-Vは、本物のコンピュータ環境における現実世界のタスクを特徴とし、20のエンタープライズレベルのプロフェッショナルアプリケーションを組み込んでいる。
これらのタスクは、エンタープライズデータソフトウェアシステムにおいて、コードを書き、GUIを管理することで、マルチモーダルエージェントがデータ関連のタスクを実行する能力を評価する。
論文 参考訳(メタデータ) (2024-07-15T17:54:37Z) - MASSW: A New Dataset and Benchmark Tasks for AI-Assisted Scientific Workflows [58.56005277371235]
我々は,Multi-Aspect Summarization of ScientificAspectsに関する総合テキストデータセットであるMASSWを紹介する。
MASSWには過去50年間にわたる17の主要なコンピュータサイエンスカンファレンスから152,000以上の査読論文が含まれている。
我々は、この新しいデータセットを用いてベンチマーク可能な、複数の新しい機械学習タスクを通じて、MASSWの有用性を実証する。
論文 参考訳(メタデータ) (2024-06-10T15:19:09Z) - Large Language Models to the Rescue: Reducing the Complexity in
Scientific Workflow Development Using ChatGPT [11.410608233274942]
科学システムは、大規模なデータセット上で複雑なデータ分析パイプラインを表現および実行するためにますます人気がある。
しかし、多くのブラックボックスツールと実行に必要な深いインフラストラクチャスタックが関与しているため、実装は難しい。
本研究では,大規模言語モデル,特にChatGPTの効率性を検討した。
論文 参考訳(メタデータ) (2023-11-03T10:28:53Z) - Nemo: Guiding and Contextualizing Weak Supervision for Interactive Data
Programming [77.38174112525168]
私たちは、WS 学習パイプラインの全体的な生産性を、一般的な WS 監督アプローチと比較して平均20%(最大 47% のタスク)改善する、エンドツーエンドのインタラクティブなスーパービジョンシステムである Nemo を紹介します。
論文 参考訳(メタデータ) (2022-03-02T19:57:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。