論文の概要: The limits of bio-molecular modeling with large language models : a cross-scale evaluation
- arxiv url: http://arxiv.org/abs/2604.03361v1
- Date: Fri, 03 Apr 2026 17:38:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-07 15:49:18.538161
- Title: The limits of bio-molecular modeling with large language models : a cross-scale evaluation
- Title(参考訳): 大規模言語モデルを用いた生体分子モデリングの限界 : クロススケール評価
- Authors: Yaxin Xu, Yue Zhou, Tianyu Zhao, Fengwei An, Zhixiang Ren,
- Abstract要約: 大規模言語モデル(LLM)は、生体分子発見にますます応用されている。
我々は,LLM性能と機械的理解の体系的なギャップを,生物分子間ベンチマークBioMol-LLM-Benchを用いて明らかにした。
- 参考スコア(独自算出の注目度): 10.137315614435176
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The modeling of bio-molecular system across molecular scales remains a central challenge in scientific research. Large language models (LLMs) are increasingly applied to bio-molecular discovery, yet systematic evaluation across multi-scale biological problems and rigorous assessment of their tool-augmented capabilities remain limited. We reveal a systematic gap between LLM performance and mechanistic understanding through the proposed cross-scale bio-molecular benchmark: BioMol-LLM-Bench, a unified framework comprising 26 downstream tasks that covers 4 distinct difficulty levels, and computational tools are integrated for a more comprehensive evaluation. Evaluation on 13 representative models reveals 4 main findings: chain-of-thought data provides limited benefit and may even reduce performance on biological tasks; hybrid mamba-attention architectures are more effective for long bio-molecular sequences; supervised fine-tuning improves specialization at the cost of generalization; and current LLMs perform well on classification tasks but remain weak on challenging regression tasks. Together, these findings provide practical guidance for future LLM-based modeling of molecular systems.
- Abstract(参考訳): 分子スケールでの生体分子系のモデリングは、科学研究における中心的な課題である。
大規模言語モデル (LLM) は, 生物分子の発見にますます応用されているが, 大規模生物問題に対する体系的な評価や, ツール強化能力の厳密な評価は限定的のままである。
より総合的な評価のために計算ツールを統合したBioMol-LLM-Benchという,26の下流タスクからなる統合フレームワークを開発した。
13の代表的なモデルに対する評価では、4つの主な発見が示される: チェーン・オブ・シント・データは限られた利益を提供し、生物学的タスクのパフォーマンスを低下させる可能性がある; ハイブリッド・マンバ・アテンション・アーキテクチャは長い生体分子配列に対してより効果的である; 教師付き微調整は一般化のコストで特殊化を改善する; 現在のLSMは分類タスクでうまく機能するが、挑戦的な回帰タスクでは弱いままである。
これらの知見は、分子系の将来のLCMに基づくモデリングのための実践的なガイダンスを提供する。
関連論文リスト
- BIOME-Bench: A Benchmark for Biomolecular Interaction Inference and Multi-Omics Pathway Mechanism Elucidation from Scientific Literature [12.185152549393152]
BIOME-Benchは、マルチオミクス解析において、大規模言語モデル(LLM)の2つのコア機能を評価するために、厳格な4段階のワークフローによって構築される。
両タスクの評価プロトコルを開発し、複数の強力な現代モデルにまたがる包括的実験を行う。
論文 参考訳(メタデータ) (2025-12-31T09:01:27Z) - Learning Cell-Aware Hierarchical Multi-Modal Representations for Robust Molecular Modeling [74.25438319700929]
分子と細胞応答の局所的グローバル依存性をモデル化する堅牢なフレームワークであるCHMR(Cell-aware Hierarchical Multi-modal Representations)を提案する。
728タスクにまたがる9つの公開ベンチマークで評価され、CHMRは最先端のベースラインを上回っている。
その結果, 階層認識型マルチモーダル学習による分子表現の信頼性, 生物学的基盤化の利点が示された。
論文 参考訳(メタデータ) (2025-11-26T07:15:00Z) - Knowledge-Augmented Long-CoT Generation for Complex Biomolecular Reasoning [51.673503054645415]
生体分子機構は、分子間相互作用、シグナルカスケード、代謝経路の多段階的推論を必要とする。
既存のアプローチはしばしばこれらの問題を悪化させる: 推論ステップは生物学的事実から逸脱したり、長い機械的依存関係を捉えるのに失敗する。
本稿では,LLMと知識グラフに基づくマルチホップ推論チェーンを統合したLong-CoT推論フレームワークを提案する。
論文 参考訳(メタデータ) (2025-11-11T09:26:32Z) - BioMD: All-atom Generative Model for Biomolecular Dynamics Simulation [14.323362384234441]
長大なタンパク質-リガンドダイナミクスをシミュレートする最初の全原子生成モデルであるBioMDを紹介する。
両方のデータセットに対して、BioMDは極めて現実的なコンフォーメーションを生成し、高い物理的妥当性と低い再構成エラーを示す。
これらの結果は、複雑な生体分子過程をシミュレートするツールとしてBioMDを確立し、計算化学と薬物発見に幅広い応用性を提供する。
論文 参考訳(メタデータ) (2025-09-02T07:12:50Z) - A Scalable and Quantum-Accurate Foundation Model for Biomolecular Force Field via Linearly Tensorized Quadrangle Attention [6.749581549330875]
我々は、原子性生体分子シミュレーションのための新しいAIベースの力場フレームワークLiTENを紹介する。
LiTENをベースとしたLiTEN-FFは、幅広い化学一般化のためのnablaDFTデータセットで事前訓練された堅牢なAIFF基盤モデルである。
LiTENは、rMD17、MD22、Chignolinのほとんどの評価サブセットでSOTA(State-of-the-art)のパフォーマンスを達成し、MACE、NequIP、EquiFormerといった主要なモデルよりも優れている。
論文 参考訳(メタデータ) (2025-07-01T15:52:39Z) - Biological Sequence with Language Model Prompting: A Survey [14.270959261105968]
大きな言語モデル(LLM)は、さまざまなドメインにまたがる課題に対処するための強力なツールとして登場した。
本稿では, LLMを用いたプロンプトベース手法の生物学的配列への応用を系統的に検討する。
論文 参考訳(メタデータ) (2025-03-06T06:28:36Z) - BioMaze: Benchmarking and Enhancing Large Language Models for Biological Pathway Reasoning [49.487327661584686]
実際の研究から5.1Kの複雑な経路問題を持つデータセットであるBioMazeを紹介する。
CoT法やグラフ拡張推論法などの手法の評価は,LLMが経路推論に苦慮していることを示している。
そこで本稿では,インタラクティブなサブグラフベースのナビゲーションにより推論を強化するLLMエージェントであるPathSeekerを提案する。
論文 参考訳(メタデータ) (2025-02-23T17:38:10Z) - Knowledge Hierarchy Guided Biological-Medical Dataset Distillation for Domain LLM Training [10.701353329227722]
学術文献から高品質なテキストトレーニングデータの蒸留を自動化する枠組みを提案する。
われわれのアプローチは、バイオメディカル領域とより密接に一致した質問を自己評価し、生成する。
本手法は,生命科学領域の事前学習モデルと比較して,質問応答タスクを大幅に改善する。
論文 参考訳(メタデータ) (2025-01-25T07:20:44Z) - Biology-Instructions: A Dataset and Benchmark for Multi-Omics Sequence Understanding Capability of Large Language Models [55.74944165932666]
本稿では,生物配列の大規模学習データセットであるBiology-Instructionsを紹介する。
このデータセットは、大きな言語モデル(LLM)と複雑な生物学的シーケンス関連タスクをブリッジし、その汎用性と推論を強化する。
また,マルチオミクスタスクにおける現状のLLMの,専門訓練なしでの大幅な制限を強調した。
論文 参考訳(メタデータ) (2024-12-26T12:12:23Z) - ProBio: A Protocol-guided Multimodal Dataset for Molecular Biology Lab [67.24684071577211]
研究結果を複製するという課題は、分子生物学の分野に重大な障害をもたらしている。
まず、この目的に向けた最初のステップとして、ProBioという名前の包括的なマルチモーダルデータセットをキュレートする。
次に、透明なソリューショントラッキングとマルチモーダルなアクション認識という2つの挑戦的なベンチマークを考案し、BioLab設定におけるアクティビティ理解に関連する特徴と難しさを強調した。
論文 参考訳(メタデータ) (2023-11-01T14:44:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。