論文の概要: Bolek: A Multimodal Language Model for Molecular Reasoning
- arxiv url: http://arxiv.org/abs/2605.02745v1
- Date: Mon, 04 May 2026 15:46:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:50.387966
- Title: Bolek: A Multimodal Language Model for Molecular Reasoning
- Title(参考訳): Bolek: 分子推論のためのマルチモーダル言語モデル
- Authors: Frederic Grabowski, Jacek Szczerbiński, Maciej Jaśkowski, Kalina Jasińska-Kobus, Paweł Dąbrowski-Tumański, Tomasz Jetka, Bartosz Topolski,
- Abstract要約: 本稿では,分子構造における自然言語推論の基礎となる,コンパクトな多モーダル言語モデルであるBolekを紹介する。
Bolekは分子記述、RDKit記述子予測、サブ構造検出などの分子アライメントタスクに微調整されている。
また、TxGemma-9B-Chatは、そのサイズの半分以下であるにもかかわらず、15のバイナリ分類タスクのうち13でパフォーマンスが向上した。
- 参考スコア(独自算出の注目度): 0.39089069256361736
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Molecular property models increasingly support high-stakes drug-discovery decisions, but their outputs are often difficult to audit: classical predictors return scores without rationale, while language models can produce fluent explanations weakly grounded in the input molecule. We introduce Bolek, a compact multimodal language model that grounds natural-language reasoning in molecular structure by injecting a Morgan fingerprint embedding into an instruction-tuned text decoder. Bolek is fine-tuned on molecular alignment tasks, including molecule description, RDKit descriptor prediction, and substructure detection, and on downstream reasoning over 15 TDC binary classification tasks using synthetic chains-of-thought anchored in concrete molecular features. Across these tasks, Bolek outperforms its Qwen3-4B-Instruct base on all endpoints in yes/no mode and on 13 of 15 in chain-of-thought mode, raising mean ROC/PR AUC from 0.55 to 0.76. It also outperforms TxGemma-9B-Chat on 13 of 15 binary classification tasks despite being less than half its size. Bolek's explanations are more grounded than those of the baseline LLMs: it cites numerical descriptors 10-100x more often per chain-of-thought, and the cited values agree strongly with RDKit for key descriptors such as TPSA, MolLogP, and MolWt (Spearman rho = 0.87-0.91). Generalisation extends beyond the training panel: on 15 unseen TDC classification endpoints, Bolek matches TxGemma on five, and it produces non-trivial rank correlations on three held-out regression endpoints despite never seeing downstream regression during training. These results suggest that targeted modality injection and reasoning supervision tied to verifiable molecular features can yield compact, auditable molecular reasoning models.
- Abstract(参考訳): 分子特性モデルは、薬品発見の意思決定をますます支持するが、そのアウトプットは、しばしば監査が難しい:古典的予測子は、合理的にスコアを返すが、言語モデルは、入力分子に弱い基底を持つ流動的な説明を生成することができる。
分子構造における自然言語推論の基盤となる,命令付きテキストデコーダにMorganの指紋を注入した,コンパクトなマルチモーダル言語モデルであるBolekを紹介する。
Bolekは分子記述、RDKit記述子予測、サブ構造検出などの分子アライメントタスク、およびコンクリート分子に固定された合成鎖を用いた15のTDCバイナリ分類タスクの下流での推論など、分子アライメントタスクに微調整されている。
これらのタスク全体で、BolekはQwen3-4B-インストラクトベースをye/noモードで、そして15点中13点をチェーン・オブ・シントモードで上回り、平均ROC/PR AUCを0.55から0.76に引き上げている。
また、TxGemma-9B-Chatは、そのサイズの半分以下であるにもかかわらず、15のバイナリ分類タスクのうち13でパフォーマンスが向上した。
Bolek氏の説明は、ベースライン LLM のそれよりも基礎を成している: 数値記述子 10-100 倍頻繁に考えること、引用された値は、TPSA、MollLogP、MolWt (Spearman rho = 0.87-0.91) のようなキー記述子に対してRDKitと強く一致する。
15のTDC分類エンドポイントでは、Bolekは5つのTxGemmaにマッチし、トレーニング中に下流の回帰を見ることなく、3つの保持された回帰エンドポイントで非自明なランク相関を生成する。
これらの結果から, 分子特性の検証に係わる目的のモダリティ注入と推論の監督が, コンパクトで監査可能な分子推論モデルをもたらすことが示唆された。
関連論文リスト
- ARCHE: A Novel Task to Evaluate LLMs on Latent Reasoning Chain Extraction [70.53044880892196]
本稿では、複雑な推論引数を標準推論パラダイムの組み合わせに分解し、Reasoning Logic Tree (RLT) という形で分解しなければならない、ARCHE(Latent Reasoning Chain extract)という新しいタスクを紹介する。
この作業を容易にするために,我々は,1,900以上の参照と38,000の視点を含む70のNature Communicationsの記事から得られた新しいベンチマークであるARCHE Benchをリリースする。
ARCHE Bench上での10のLLMの評価では、モデルがREAとECのトレードオフを示しており、完全な標準推論チェーンを抽出することはできません。
論文 参考訳(メタデータ) (2025-11-16T07:37:09Z) - Peeling Context from Cause for Multimodal Molecular Property Prediction [12.900046337617546]
CLaP(Causal Layerwise Peeling)は、因果信号をコンテキストから階層的に分離するフレームワークである。
CLaPは、競争ベースラインよりもMAE、MSE、R2$を一貫して改善する。
原子レベルの因果正性マップを生成し、予測に責任を負う部分構造をハイライトする。
論文 参考訳(メタデータ) (2025-11-10T04:29:33Z) - MobileLLM-R1: Exploring the Limits of Sub-Billion Language Model Reasoners with Open Training Recipes [60.57770396565211]
強い推論能力は、はるかに少ないデータで実現可能であることを示す。
MobileLLM-R50MのAIMEスコアは15.5であり、OLMo-2-1.48Bは0.6、SmolLM-2-1.7Bは0.3である。
論文 参考訳(メタデータ) (2025-09-29T15:43:59Z) - Mol-R1: Towards Explicit Long-CoT Reasoning in Molecule Discovery [21.895481477176475]
Mol-R1は、テキストベースの分子生成におけるR1のようなExplicit Long-CoT推論モデルの説明可能性と推論性能を改善するために設計された新しいフレームワークである。
分子反復適応(英: Molecular Iterative Adaptation)とは、分子発見のためのR1ライクな推論モデルの推論性能を高めるために、SFT(Supervised Fine-tuning)とRPO(Reinforced Policy Optimization)を反復的に組み合わせたトレーニング戦略である。
論文 参考訳(メタデータ) (2025-08-11T18:50:05Z) - MedS$^3$: Towards Medical Slow Thinking with Self-Evolved Soft Dual-sided Process Supervision [42.03114317779815]
Moneは、小規模でデプロイ可能なモデルに堅牢な推論機能を提供する、自己進化型のフレームワークである。
moneは過去の最先端の医療モデルを+6.45の精度で上回り、32Bスケールの汎用推論モデルを+8.57の精度で上回っている。
論文 参考訳(メタデータ) (2025-01-21T11:24:55Z) - Pre-trained Molecular Language Models with Random Functional Group Masking [54.900360309677794]
SMILESをベースとしたアンダーリネム分子アンダーリネム言語アンダーリネムモデルを提案し,特定の分子原子に対応するSMILESサブシーケンスをランダムにマスキングする。
この技術は、モデルに分子構造や特性をよりよく推測させ、予測能力を高めることを目的としている。
論文 参考訳(メタデータ) (2024-11-03T01:56:15Z) - MolecularGPT: Open Large Language Model (LLM) for Few-Shot Molecular Property Prediction [20.92779223471019]
数発の分子特性予測のための分子GPTを提案する。
10のダウンストリーム評価データセットで競合するコンテキスト内推論機能を示す。
また、最先端のLCMベースラインを最大15.7%増加させ、ゼロショット下の回帰指標(例えばRMSE)で17.9減少させる。
論文 参考訳(メタデータ) (2024-06-18T12:54:47Z) - MolCPT: Molecule Continuous Prompt Tuning to Generalize Molecular
Representation Learning [77.31492888819935]
分子表現学習のための「プリトレイン,プロンプト,ファインチューン」という新しいパラダイム,分子連続プロンプトチューニング(MolCPT)を提案する。
MolCPTは、事前訓練されたモデルを使用して、スタンドアロンの入力を表現的なプロンプトに投影するモチーフプロンプト関数を定義する。
いくつかのベンチマークデータセットの実験により、MollCPTは分子特性予測のために学習済みのGNNを効率的に一般化することが示された。
論文 参考訳(メタデータ) (2022-12-20T19:32:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。