論文の概要: Hierarchical Molecular Language Models (HMLMs)
- arxiv url: http://arxiv.org/abs/2512.00696v1
- Date: Sun, 30 Nov 2025 02:09:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-02 19:46:34.366157
- Title: Hierarchical Molecular Language Models (HMLMs)
- Title(参考訳): 階層型分子言語モデル(HMLM)
- Authors: Hasi Hays, Yue Yu, William Richardson,
- Abstract要約: 階層型分子言語モデル(英:hierarchical molecular language model, HMLMs)は、細胞内通信を特殊な分子言語として使用する分子ネットワーク特異的な大規模言語モデル(LLM)を提案する新しいアーキテクチャである。
HMLMは、分子、経路、細胞スケールの情報を階層的な注意パターンを通じて統合しながら、シグナルネットワークトポロジーを許容するグラフ構造化された注意機構を用いる。
- 参考スコア(独自算出の注目度): 10.241798338676155
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Cellular signaling networks represent complex information processing systems that have been modeled via traditional mathematical or statistical approaches. However, these methods often struggle to capture context-dependent signaling, pathway cross-talk, and temporal dynamics across multiple biological scales. Here, we introduce hierarchical molecular language models (HMLMs), a novel architecture that proposes a molecular network-specific large language model (LLM) to use in intracellular communication as a specialized molecular language, which includes molecules as tokens, protein interactions, post-translational modifications, and regulatory events modeled as semantic relationships within an adapted transformer architecture. HMLMs employ graph-structured attention mechanisms to accommodate signaling network topology while integrating information across the molecular, pathway, and cellular scales through hierarchical attention patterns. We demonstrate HMLM superiority using a cardiac fibroblast signaling network comprising over 100 molecular species across functional modules connected by regulatory edges. HMLM achieved a mean squared error (MSE) of 0.058 for temporal signaling predictions, representing 30% improvement over graph neural networks (GNNs: 0.083) and 52% improvement over ordinary differential equation models (ODEs: 0.121), with particular advantages under sparse temporal sampling conditions where HMLM maintained MSE = 0.041 with only 4 time-points. The HMLMs offer a foundation for AI-driven biology and medicine with predictable scaling characteristics suitable for interactive applications. By bridging molecular mechanisms with cellular phenotypes through AI-driven molecular language representation, HMLMs provide a powerful paradigm for systems biology that advances precision medicine applications and therapeutic discovery in the era of AI.
- Abstract(参考訳): セルシグナリングネットワークは、従来の数学的または統計的アプローチによってモデル化された複雑な情報処理システムを表す。
しかしながら、これらの手法はしばしば、複数の生物学的スケールにわたる文脈依存的なシグナル、経路交叉、時間的ダイナミクスを捉えるのに苦労する。
本稿では, 分子をトークンとして, タンパク質間相互作用, 翻訳後修飾, 適応型トランスフォーマーアーキテクチャ内の意味的関係としてモデル化した規制イベントを含む, 細胞内通信を特殊な分子言語として使用する分子ネットワーク特異的大規模言語モデル (LLM) を提案する新しいアーキテクチャである階層型分子言語モデル (HMLM) を紹介する。
HMLMは、分子、経路、細胞スケールの情報を階層的な注意パターンを通じて統合しながら、シグナルネットワークトポロジーを許容するグラフ構造化された注意機構を用いる。
我々は,100種以上の分子種からなる心臓線維芽細胞シグナルネットワークを用いて,調節エッジで接続された機能モジュール間のHMLMの優位性を実証した。
HMLMは時間的シグナリング予測の0.058の平均2乗誤差(MSE)を達成し、グラフニューラルネットワーク(GNN:0.083)よりも30%改善し、通常の微分方程式モデル(ODE:0.121)よりも52%改善した。
HMLMは、対話型アプリケーションに適した予測可能なスケーリング特性を備えた、AI駆動の生物学と医学の基礎を提供する。
HMLMは、AI駆動の分子言語表現を通じて、細胞性表現型で分子機構をブリッジすることで、AI時代における精密な医学的応用と治療発見を促進する、システム生物学の強力なパラダイムを提供する。
関連論文リスト
- Learning Cell-Aware Hierarchical Multi-Modal Representations for Robust Molecular Modeling [74.25438319700929]
分子と細胞応答の局所的グローバル依存性をモデル化する堅牢なフレームワークであるCHMR(Cell-aware Hierarchical Multi-modal Representations)を提案する。
728タスクにまたがる9つの公開ベンチマークで評価され、CHMRは最先端のベースラインを上回っている。
その結果, 階層認識型マルチモーダル学習による分子表現の信頼性, 生物学的基盤化の利点が示された。
論文 参考訳(メタデータ) (2025-11-26T07:15:00Z) - Multi-Level Fusion Graph Neural Network for Molecule Property Prediction [8.629821238312621]
グラフアテンションネットワークと新しいグラフ変換器を統合したマルチレベルフュージョングラフニューラルネットワーク(MLFGNN)を提案する。
複数のベンチマークデータセットの実験により、MLFGNNは、分類タスクと回帰タスクの両方において、最先端のメソッドを一貫して上回っていることが示された。
論文 参考訳(メタデータ) (2025-07-04T09:38:19Z) - Learning Hierarchical Interaction for Accurate Molecular Property Prediction [8.488251667425887]
Hierarchical Interaction Message Net (HimNet)は、ADMETプロファイルを予測するための新しいディープラーニングモデルである。
HimNetは、ほとんどの分子特性予測タスクにおいて、最高の、または最も近いパフォーマンスを達成する。
HimNetは、分子活性とADMET特性予測のための正確で効率的なソリューションであると考えています。
論文 参考訳(メタデータ) (2025-04-28T15:19:28Z) - Graph-based Molecular In-context Learning Grounded on Morgan Fingerprints [28.262593876388397]
In-context Learning (ICL) では、プロパティ予測や分子キャプションなどの分子タスクのための大規模言語モデル(LLM)を、慎重に選択された実演例を入力プロンプトに埋め込む。
しかし、現在の分子タスクのプロンプト検索法は、モーガン指紋のような分子の特徴的類似性に依存しており、これはグローバル分子と原子結合の関係を適切に捉えていない。
本稿では,グローバル分子構造をグラフニューラルネットワーク(GNN)とテキストキャプション(記述)に整合させ,モーガン指紋による局所的特徴類似性を活用する自己教師付き学習手法GAMICを提案する。
論文 参考訳(メタデータ) (2025-02-08T02:46:33Z) - Pre-trained Molecular Language Models with Random Functional Group Masking [54.900360309677794]
SMILESをベースとしたアンダーリネム分子アンダーリネム言語アンダーリネムモデルを提案し,特定の分子原子に対応するSMILESサブシーケンスをランダムにマスキングする。
この技術は、モデルに分子構造や特性をよりよく推測させ、予測能力を高めることを目的としている。
論文 参考訳(メタデータ) (2024-11-03T01:56:15Z) - FARM: Functional Group-Aware Representations for Small Molecules [55.281754551202326]
小型分子のための機能的グループ認識表現(FARM)について紹介する。
FARMはSMILES、自然言語、分子グラフのギャップを埋めるために設計された新しいモデルである。
我々は、13のタスクのうち11のタスクで最先端のパフォーマンスを達成するMoleculeNetデータセット上で、FARMを評価した。
論文 参考訳(メタデータ) (2024-10-02T23:04:58Z) - Towards Predicting Equilibrium Distributions for Molecular Systems with
Deep Learning [60.02391969049972]
本稿では,分子系の平衡分布を予測するために,分散グラフマー(DiG)と呼ばれる新しいディープラーニングフレームワークを導入する。
DiGはディープニューラルネットワークを用いて分子系の記述子に条件付き平衡分布に単純な分布を変換する。
論文 参考訳(メタデータ) (2023-06-08T17:12:08Z) - Implicit Geometry and Interaction Embeddings Improve Few-Shot Molecular
Property Prediction [53.06671763877109]
我々は, 複雑な分子特性を符号化した分子埋め込みを開発し, 数発の分子特性予測の性能を向上させる。
我々の手法は大量の合成データ、すなわち分子ドッキング計算の結果を利用する。
複数の分子特性予測ベンチマークでは、埋め込み空間からのトレーニングにより、マルチタスク、MAML、プロトタイプラーニング性能が大幅に向上する。
論文 参考訳(メタデータ) (2023-02-04T01:32:40Z) - Accelerated Simulations of Molecular Systems through Learning of their
Effective Dynamics [4.276697874428501]
本稿では,最大3桁のシミュレーションを行うための新しい枠組みを提案する。
ledは分子系の効果的なダイナミクスを学ぶ。
我々は、M"ueller-Brown電位、Trp Cageタンパク質、およびアラニンジペプチドにおけるLEDの有効性を実証する。
論文 参考訳(メタデータ) (2021-02-17T15:15:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。