論文の概要: DrugReasoner: Interpretable Drug Approval Prediction with a Reasoning-augmented Language Model
- arxiv url: http://arxiv.org/abs/2508.18579v1
- Date: Tue, 26 Aug 2025 01:14:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-27 17:42:38.633301
- Title: DrugReasoner: Interpretable Drug Approval Prediction with a Reasoning-augmented Language Model
- Title(参考訳): DrugReasoner:Reasoning-augmented Language Modelによる解釈可能な薬物承認予測
- Authors: Mohammadreza Ghaffarzadeh-Esfahani, Ali Motahharynia, Nahid Yousefian, Navid Mazrouei, Jafar Ghaisari, Yousof Gheisari,
- Abstract要約: 我々はLLaMAアーキテクチャ上に構築された推論に基づく大規模言語モデル(LLM)であるPaldrReasonerを提案する。
DrugReasonerは、構造的に類似した承認されていない化合物に対する比較推論と分子記述子を統合している。
AUCが0.732、F1が0.729、テストセットが0.725、0.718で堅牢な性能を達成した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Drug discovery is a complex and resource-intensive process, making early prediction of approval outcomes critical for optimizing research investments. While classical machine learning and deep learning methods have shown promise in drug approval prediction, their limited interpretability constraints their impact. Here, we present DrugReasoner, a reasoning-based large language model (LLM) built on the LLaMA architecture and fine-tuned with group relative policy optimization (GRPO) to predict the likelihood of small-molecule approval. DrugReasoner integrates molecular descriptors with comparative reasoning against structurally similar approved and unapproved compounds, generating predictions alongside step-by-step rationales and confidence scores. DrugReasoner achieved robust performance with an AUC of 0.732 and an F1 score of 0.729 on the validation set and 0.725 and 0.718 on the test set, respectively. These results outperformed conventional baselines, including logistic regression, support vector machine, and k-nearest neighbors and had competitive performance relative to XGBoost. On an external independent dataset, DrugReasoner outperformed both baseline and the recently developed ChemAP model, achieving an AUC of 0.728 and an F1-score of 0.774, while maintaining high precision and balanced sensitivity, demonstrating robustness in real-world scenarios. These findings demonstrate that DrugReasoner not only delivers competitive predictive accuracy but also enhances transparency through its reasoning outputs, thereby addressing a key bottleneck in AI-assisted drug discovery. This study highlights the potential of reasoning-augmented LLMs as interpretable and effective tools for pharmaceutical decision-making.
- Abstract(参考訳): 薬物発見は複雑で資源集約的なプロセスであり、研究投資を最適化するために承認結果の早期予測が重要である。
古典的な機械学習とディープラーニングの手法は、薬物承認の予測において有望であることを示しているが、その限定的な解釈可能性の影響は制限されている。
本稿では,LLaMAアーキテクチャ上に構築され,グループ相対ポリシー最適化(GRPO)によって微調整された推論に基づく大規模言語モデル(LLM)について述べる。
DrugReasonerは、分子記述子と、構造的に類似した承認されていない化合物に対する比較推論を統合し、ステップバイステップの合理性と信頼スコアとともに予測を生成する。
DrugReasonerはAUCが0.732、F1が0.729、テストセットが0.725、0.718で堅牢な性能を達成した。
これらの結果は、ロジスティック回帰、サポートベクターマシン、k-アネレスト隣人など従来のベースラインよりも優れ、XGBoostと比較して競争性能が高かった。
外部の独立データセットでは、DrarmReasonerはベースラインと最近開発されたChemAPモデルの両方より優れており、AUCは0.728、F1スコアは0.774で、高精度でバランスの取れた感度を維持し、現実世界のシナリオでは堅牢性を実証している。
これらの結果は、DragonReasonerが競争力のある予測精度を提供するだけでなく、推論アウトプットを通じて透明性を高め、AIによる薬物発見における重要なボトルネックに対処していることを示している。
本研究は、薬品意思決定における解釈可能かつ効果的なツールとして、推理強化LDMの可能性を強調した。
関連論文リスト
- CausalWrap: Model-Agnostic Causal Constraint Wrappers for Tabular Synthetic Data [4.08271266107383]
CausalWrapは、事前訓練されたベースジェネレータに部分的な因果知識を注入するモデルに依存しないラッパーである。
CWは、ベースジェネレータからのサンプルに適用された軽量で微分可能なポストホック補正マップを学習する。
CWは多様なベースジェネレータ間の因果性を改善する。
論文 参考訳(メタデータ) (2026-03-02T15:59:46Z) - STAR : Bridging Statistical and Agentic Reasoning for Large Model Performance Prediction [78.0692157478247]
本稿では,知識駆動型エージェント推論を用いて,データ駆動型静的予測を橋渡しするフレームワークSTARを提案する。
STARはスコアベースとランクベースの両方の基準線を一貫して上回ることを示す。
論文 参考訳(メタデータ) (2026-02-12T16:30:07Z) - Outcome Accuracy is Not Enough: Aligning the Reasoning Process of Reward Models [108.26461635308796]
Rationale Consistencyは、モデルの推論プロセスと人間の判断のアライメントを定量化する、きめ細かい計量である。
我々のフロンティアモデルの評価では,最先端モデル間で合理的な一貫性が効果的に識別できることが示されている。
我々は、GenRMトレーニングの合理性一貫性と結果精度を組み合わせたハイブリッド信号を導入する。
論文 参考訳(メタデータ) (2026-02-04T15:24:52Z) - Chunking, Retrieval, and Re-ranking: An Empirical Evaluation of RAG Architectures for Policy Document Question Answering [0.0]
大規模言語モデル(LLM)の公衆衛生政策分野への統合は、疾病管理予防センター(CDC)などの機関が管理する規制ガイダンスの膨大なリポジトリをナビゲートするための変革的なアプローチを提供する。
LLMが幻覚を発生させることの正当性は、情報整合性が不可能なハイテイク環境において、これらの技術を採用する上で重要な障壁となる。
この経験的評価は、信頼できる文書コンテキストにおける生成出力を基盤として、これらのリスクを軽減するために、検索型拡張生成(RAG)アーキテクチャの有効性を探求するものである。
論文 参考訳(メタデータ) (2026-01-21T20:52:48Z) - Case Prompting to Mitigate Large Language Model Bias for ICU Mortality Prediction [17.91443453604627]
大規模言語モデル(LLM)は、構造化された医療データから結果を予測することを約束している。
LLMは性、年齢、人種に関する人口統計バイアスを示し、臨床実践における信頼に値する使用を制限することができる。
本研究では,公正さとパフォーマンスを同時に向上するトレーニングフリー,臨床適応型プロンプトフレームワークを提案する。
論文 参考訳(メタデータ) (2025-12-17T12:29:53Z) - Efficient Thought Space Exploration through Strategic Intervention [54.35208611253168]
本稿では,この知見を2つの相乗的コンポーネントを通して操作するHint-Practice Reasoning(HPR)フレームワークを提案する。
フレームワークの中核となる革新は、動的に介入点を識別する分散不整合低減(DIR)である。
算術的および常識的推論ベンチマークによる実験は、HPRの最先端の効率-精度トレードオフを実証している。
論文 参考訳(メタデータ) (2025-11-13T07:26:01Z) - A Hybrid Computational Intelligence Framework with Metaheuristic Optimization for Drug-Drug Interaction Prediction [0.8602553195689512]
薬物と薬物の相互作用(DDI)は予防可能な有害事象の主要な原因であり、しばしば治療を複雑にし、医療費を増大させる。
本稿では、DDI予測を改善するために、現代の機械学習とドメイン知識を融合した解釈可能かつ効率的なフレームワークを提案する。
提案手法は, フラグメントレベルの構造パターンをキャプチャする Mol2Vec と, 文脈化学的特徴を学習する SMILES-BERT の2つの補完的な埋め込みを組み合わせる。
論文 参考訳(メタデータ) (2025-10-08T09:55:18Z) - LLM-based Agents for Automated Confounder Discovery and Subgroup Analysis in Causal Inference [1.1538255621565348]
本稿では,共同創設者の自動発見とサブグループ分析のための大規模言語モデルに基づくエージェントを提案する。
本フレームワークは,サブグループ識別と構造発見を体系的に行う。
以上の結果から,LSMをベースとしたエージェントは,スケーラブルで信頼性が高く,セマンティックに認識された因果推論へ有望な道をたどることが示唆された。
論文 参考訳(メタデータ) (2025-08-10T07:45:49Z) - T2I-Eval-R1: Reinforcement Learning-Driven Reasoning for Interpretable Text-to-Image Evaluation [60.620408007636016]
T2I-Eval-R1は,大まかな品質スコアのみを用いて,オープンソースのMLLMを訓練する新しい強化学習フレームワークである。
提案手法では,グループ相対政策最適化を命令調整プロセスに統合し,スカラースコアと解釈可能な推論チェーンの両方を生成する。
論文 参考訳(メタデータ) (2025-05-23T13:44:59Z) - A Generative Framework for Causal Estimation via Importance-Weighted Diffusion Distillation [55.53426007439564]
観察データから個別化された治療効果を推定することは因果推論における中心的な課題である。
逆確率重み付け(IPW)は、この問題に対するよく確立された解決策であるが、現代のディープラーニングフレームワークへの統合は依然として限られている。
本稿では,拡散モデルの事前学習と重み付きスコア蒸留を組み合わせた新しい生成フレームワークであるIWDDを提案する。
論文 参考訳(メタデータ) (2025-05-16T17:00:52Z) - DrugImproverGPT: A Large Language Model for Drug Optimization with Fine-Tuning via Structured Policy Optimization [53.27954325490941]
大規模言語モデル(LLM)の微調整は、特定の目的に向けて結果を生成するために不可欠である。
本研究は,薬物最適化LSMに基づく生成モデルを微調整するための新しい強化学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-02-11T04:00:21Z) - Bridging Internal Probability and Self-Consistency for Effective and Efficient LLM Reasoning [53.25336975467293]
パープレキシティや自己整合性などの手法の第一理論誤差分解解析について述べる。
パープレキシティ法は、適切な整合関数が存在しないため、かなりのモデル誤差に悩まされる。
本稿では、自己整合性とパープレキシティを統合したReasoning-Pruning Perplexity Consistency(RPC)と、低確率推論経路を排除したReasoning Pruningを提案する。
論文 参考訳(メタデータ) (2025-02-01T18:09:49Z) - YZS-model: A Predictive Model for Organic Drug Solubility Based on Graph Convolutional Networks and Transformer-Attention [9.018408514318631]
伝統的な手法は複雑な分子構造を見逃し、不正確な結果をもたらすことが多い。
本稿では,グラフ畳み込みネットワーク(GCN),トランスフォーマーアーキテクチャ,Long Short-Term Memory(LSTM)ネットワークを統合するディープラーニングフレームワークであるYZS-Modelを紹介する。
YZS-Modelは、R2$ 0.59、RMSE$ 0.57を達成し、ベンチマークモデルを上回った。
論文 参考訳(メタデータ) (2024-06-27T12:40:29Z) - Deep Learning for Virtual Screening: Five Reasons to Use ROC Cost
Functions [80.12620331438052]
深層学習は サイリコの何十億もの分子を 迅速にスクリーニングする 重要なツールとなりました
その重要性にもかかわらず、厳密なクラス不均衡、高い決定しきい値、いくつかのデータセットにおける基底真理ラベルの欠如など、これらのモデルのトレーニングにおいて重大な課題が続いている。
このような場合、クラス不均衡に対するロバスト性から、レシーバ動作特性(ROC)を直接最適化することを好んで論じる。
論文 参考訳(メタデータ) (2020-06-25T08:46:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。