論文の概要: Fast Leave-One-Out Approximation from Fragment-Target Prevalence Vectors (molFTP) : From Dummy Masking to Key-LOO for Leakage-Free Feature Construction
- arxiv url: http://arxiv.org/abs/2510.06029v1
- Date: Tue, 07 Oct 2025 15:27:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-08 17:57:08.31437
- Title: Fast Leave-One-Out Approximation from Fragment-Target Prevalence Vectors (molFTP) : From Dummy Masking to Key-LOO for Leakage-Free Feature Construction
- Title(参考訳): フラグメント目標精度ベクトル(molFTP)の高速残差近似 : ダミーマスキングからキーLOOまで
- Authors: Guillaume Godin,
- Abstract要約: molFTP (molecular fragment-target prevalence) は、強力な予測性能を提供するコンパクトな表現である。
保持分子に存在する断片に関する情報を除去するダミーマスキング手法を実装した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We introduce molFTP (molecular fragment-target prevalence), a compact representation that delivers strong predictive performance. To prevent feature leakage across cross-validation folds, we implement a dummy-masking procedure that removes information about fragments present in the held-out molecules. We further show that key leave-one-out (key-loo) closely approximates true molecule-level leave-one-out (LOO), with deviation below 8% on our datasets. This enables near full data training while preserving unbiased cross-validation estimates of model performance. Overall, molFTP provides a fast, leakage-resistant fragment-target prevalence vectorization with practical safeguards (dummy masking or key-LOO) that approximate LOO at a fraction of its cost.
- Abstract(参考訳): 高い予測性能を実現するコンパクトな表現であるmolFTP(分子フラグメントターゲットの精度)を導入する。
クロスバリデーションフォールド間の機能漏洩を防止するため,ホールドアウト分子に存在するフラグメントに関する情報を除去するダミーマスキング手法を実装した。
さらに、キー・ワン・アウト(キー・ルー)が真の分子レベル・ワン・アウト(LOO)を近似しており、データセットでは8%以下であることを示す。
これにより、モデルパフォーマンスの非バイアス付きクロスバリデーション見積を保持しながら、ほぼ完全なデータトレーニングが可能になる。
全体として、molFTPは高速で漏れやすいフラグメントターゲットの精度ベクタライゼーションを提供し、実用的なセーフガード(ダミーマスクやキー-LOO)により、LOOをそのコストのごく一部で近似する。
関連論文リスト
- Flow-Based Fragment Identification via Binding Site-Specific Latent Representations [7.729885628667701]
我々は,分子断片とタンパク質表面の両方を共有潜在空間にマッピングする,対照的な学習手法に依存するタンパク質フラグメントエンコーダを開発した。
エンコーダは、インタラクションに関連する機能をキャプチャし、新しいメソッドであるLatentFragで仮想スクリーニングと生成設計を行うことができる。
我々の生成法は, 仮想スクリーニングなどの一般的な手法を計算コストのごく一部で上回り, フラグメントヒット発見の出発点となる。
論文 参考訳(メタデータ) (2025-09-16T16:20:45Z) - Learning Flexible Forward Trajectories for Masked Molecular Diffusion [35.326540193307345]
仮面拡散モデル (MDMs) は離散データのモデリングにおいて顕著な進歩を遂げているが、分子生成におけるそのポテンシャルは未解明のままである。
標準MDMを適用すると、性能が著しく低下するという驚くべき結果が紹介される。
本研究では, 分子グラフ間の衝突を避けるため, 要素ごとの分解軌道を編成するMasked Element-wise Learnable Diffusion (MELD)を提案する。
論文 参考訳(メタデータ) (2025-05-22T15:30:17Z) - Mitigating Shortcut Learning with Diffusion Counterfactuals and Diverse Ensembles [104.60508550106618]
拡散確率モデル(DPM)を利用したアンサンブル多様化フレームワークDiffDivを提案する。
DPMは、相関した入力特徴を示すサンプルを用いて訓練しても、新しい特徴の組み合わせで画像を生成することができることを示す。
そこで本研究では,DPM誘導の多様化は,教師付き信号の追加を必要とせず,ショートカットキューへの依存を取り除くのに十分であることを示す。
論文 参考訳(メタデータ) (2023-11-23T15:47:33Z) - Equivariant 3D-Conditional Diffusion Models for Molecular Linker Design [82.23006955069229]
分子リンカ設計のためのE(3)等価な3次元拡散モデルDiffLinkerを提案する。
我々のモデルは、欠落した原子を中間に配置し、初期フラグメントを全て組み込んだ分子を設計する。
DiffLinkerは、より多種多様な合成可能な分子を生成する標準データセット上で、他の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-10-11T09:13:37Z) - DAAIN: Detection of Anomalous and Adversarial Input using Normalizing
Flows [52.31831255787147]
我々は、アウト・オブ・ディストリビューション(OOD)インプットと敵攻撃(AA)を検出する新しい手法であるDAINを導入する。
本手法は,ニューラルネットワークの内部動作を監視し,活性化分布の密度推定器を学習する。
当社のモデルは,特別なアクセラレータを必要とせずに,効率的な計算とデプロイが可能な単一のGPUでトレーニングすることが可能です。
論文 参考訳(メタデータ) (2021-05-30T22:07:13Z) - MIMOSA: Multi-constraint Molecule Sampling for Molecule Optimization [51.00815310242277]
生成モデルと強化学習アプローチは、最初の成功をおさめたが、複数の薬物特性を同時に最適化する上で、依然として困難に直面している。
本稿では,MultI-Constraint MOlecule SAmpling (MIMOSA)アプローチ,初期推定として入力分子を用いるサンプリングフレームワーク,ターゲット分布からのサンプル分子を提案する。
論文 参考訳(メタデータ) (2020-10-05T20:18:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。