論文の概要: Generative Artificial Intelligence in Bioinformatics: A Systematic Review of Models, Applications, and Methodological Advances
- arxiv url: http://arxiv.org/abs/2511.03354v1
- Date: Wed, 05 Nov 2025 10:48:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-06 18:19:32.407017
- Title: Generative Artificial Intelligence in Bioinformatics: A Systematic Review of Models, Applications, and Methodological Advances
- Title(参考訳): バイオインフォマティクスにおける生成的人工知能:モデル・応用・方法論の体系的レビュー
- Authors: Riasad Alvi, Sayeem Been Zaman, Wasimul Karim, Arefin Ittesafun Abian, Mohaimenul Azam Khan Raiaan, Saddam Mukta, Md Rafi Ur Rashid, Md Rafiqul Islam, Yakub Sebastian, Sami Azam,
- Abstract要約: 生成人工知能(GenAI)はバイオインフォマティクスにおける転換的アプローチとなっている。
本研究の目的は, 方法論の進歩, 予測性能, 特殊化における影響のあるGenAI戦略を評価することである。
- 参考スコア(独自算出の注目度): 2.802544514846773
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Generative artificial intelligence (GenAI) has become a transformative approach in bioinformatics that often enables advancements in genomics, proteomics, transcriptomics, structural biology, and drug discovery. To systematically identify and evaluate these growing developments, this review proposed six research questions (RQs), according to the preferred reporting items for systematic reviews and meta-analysis methods. The objective is to evaluate impactful GenAI strategies in methodological advancement, predictive performance, and specialization, and to identify promising approaches for advanced modeling, data-intensive discovery, and integrative biological analysis. RQ1 highlights diverse applications across multiple bioinformatics subfields (sequence analysis, molecular design, and integrative data modeling), which demonstrate superior performance over traditional methods through pattern recognition and output generation. RQ2 reveals that adapted specialized model architectures outperformed general-purpose models, an advantage attributed to targeted pretraining and context-aware strategies. RQ3 identifies significant benefits in the bioinformatics domains, focusing on molecular analysis and data integration, which improves accuracy and reduces errors in complex analysis. RQ4 indicates improvements in structural modeling, functional prediction, and synthetic data generation, validated by established benchmarks. RQ5 suggests the main constraints, such as the lack of scalability and biases in data that impact generalizability, and proposes future directions focused on robust evaluation and biologically grounded modeling. RQ6 examines that molecular datasets (such as UniProtKB and ProteinNet12), cellular datasets (such as CELLxGENE and GTEx) and textual resources (such as PubMedQA and OMIM) broadly support the training and generalization of GenAI models.
- Abstract(参考訳): ジェネレーティブ人工知能(GenAI)は、ゲノム学、プロテオミクス、転写学、構造生物学、薬物発見の進歩を可能にするバイオインフォマティクスにおける転換的アプローチとなっている。
本研究は,これらの発展過程を体系的に把握し,評価するために,体系的レビューやメタ分析手法を推奨する報告項目に基づき,6つの研究課題(RQ)を提案した。
本研究の目的は, 方法論の進歩, 予測性能, 特殊化における影響のあるGenAI戦略を評価し, 高度なモデリング, データ集約的発見, 統合的生物学的分析のための有望なアプローチを特定することである。
RQ1は、複数のバイオインフォマティクスサブフィールド(シーケンス解析、分子設計、統合データモデリング)にまたがる多様な応用を強調し、パターン認識と出力生成を通じて従来の手法よりも優れた性能を示す。
RQ2は、適応された特殊なモデルアーキテクチャが汎用モデルよりも優れていることを明らかにしている。
RQ3は、分子解析とデータ統合に焦点を当て、バイオインフォマティクス領域における重要な利点を認識し、精度を改善し、複雑な解析におけるエラーを減らす。
RQ4は、確立されたベンチマークによって検証された構造モデリング、機能予測、合成データ生成の改善を示す。
RQ5は、一般化可能性に影響を与えるデータのスケーラビリティやバイアスの欠如などの主な制約を提案し、堅牢な評価と生物学的基盤モデリングに焦点を当てた今後の方向性を提案する。
RQ6は、分子データセット(UniProtKBやProteinNet12など)、細胞データセット(CellxGENEやGTExなど)、テキストリソース(PubMedQAやOMIMなど)がGenAIモデルのトレーニングと一般化を広くサポートすることを検証している。
関連論文リスト
- Benchmarking and Evaluation of AI Models in Biology: Outcomes and Recommendations from the CZI Virtual Cells Workshop [18.00029758641004]
我々は、AI駆動の仮想細胞のための堅牢なベンチマークの開発を加速することを目指している。
これらのベンチマークは、厳格さ、関連性、生物学的関連性を保証するために不可欠である。
これらのベンチマークは、新たな発見、治療的洞察、細胞系のより深い理解を促進する統合モデルに向けて、分野を前進させるだろう。
論文 参考訳(メタデータ) (2025-07-14T17:25:28Z) - MindGYM: What Matters in Question Synthesis for Thinking-Centric Fine-Tuning? [51.85759493254735]
MindGYMは、質問合成のための構造化されスケーラブルなフレームワークである。
モデル合成の振る舞いを形作るために、高レベルの推論目的を注入する。
より深い推論のために、QAシードに基づいてより複雑なマルチホップ質問を構成する。
論文 参考訳(メタデータ) (2025-03-12T16:03:03Z) - Large Language Models in Bioinformatics: A Survey [13.722344139230827]
大規模言語モデル(LLM)は生物情報学に革命をもたらし、DNA、RNA、タンパク質、単細胞データの高度な解析を可能にしている。
この調査は、ゲノム配列モデリング、RNA構造予測、タンパク質機能推論、単細胞転写学など、最近の進歩の体系的なレビューを提供する。
論文 参考訳(メタデータ) (2025-03-06T14:38:20Z) - GENERator: A Long-Context Generative Genomic Foundation Model [66.46537421135996]
本稿では,98k塩基対 (bp) と1.2Bパラメータからなるゲノム基盤モデル GENERator を提案する。
DNAの386Bbpからなる拡張データセットに基づいて、GENERatorは、確立されたベンチマークと新しく提案されたベンチマークの両方で最先端のパフォーマンスを実証する。
また、特に特定のアクティビティプロファイルを持つエンハンサーシーケンスを即応的に生成することで、シーケンス最適化において大きな可能性を秘めている。
論文 参考訳(メタデータ) (2025-02-11T05:39:49Z) - GenBench: A Benchmarking Suite for Systematic Evaluation of Genomic Foundation Models [56.63218531256961]
我々はGenomic Foundation Modelsの有効性を評価するためのベンチマークスイートであるGenBenchを紹介する。
GenBenchはモジュラーで拡張可能なフレームワークを提供し、様々な最先端の方法論をカプセル化している。
本稿では,タスク固有性能におけるモデルアーキテクチャとデータセット特性の相互作用のニュアンス解析を行う。
論文 参考訳(メタデータ) (2024-06-01T08:01:05Z) - Data-Driven Logistic Regression Ensembles With Applications in Genomics [0.0]
本稿では,正規化とアンサンブル技術を融合した高次元バイナリ分類手法を提案する。
医学ゲノミクスの応用において,本手法は競合する手法によって見落とされた重要なバイオマーカーを同定する。
論文 参考訳(メタデータ) (2021-02-17T05:57:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。