論文の概要: Rethinking Molecular OOD Generalization via Target-Aware Source Selection
- arxiv url: http://arxiv.org/abs/2605.13932v1
- Date: Wed, 13 May 2026 16:09:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-15 21:45:34.425822
- Title: Rethinking Molecular OOD Generalization via Target-Aware Source Selection
- Title(参考訳): ターゲット・アウェア・ソース選択による分子OOD一般化の再考
- Authors: Zhuohao Lin, Kun Li, Jiameng Chen, Jiajun Yu, Duanhua Cao, Yizhen Zheng, Wenbin Hu,
- Abstract要約: SCOPE-BENCHは、明示的な物理化学的記述空間におけるクラスタレベルのパーティショニングに基づいて構築されたベンチマークである。
POMAは、知識伝達を検索-合成-適応パイプラインとして定式化するフレームワークである。
SCOPE-BENCHにおける最先端の3D分子モデルの予測誤差は平均5.9倍である。
- 参考スコア(独自算出の注目度): 10.102858221967791
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Robust prediction of molecular properties under extreme out-of-distribution (OOD) scenarios is a pivotal bottleneck in AI-driven drug discovery. Current scaffold-splitting protocols fail to obstruct microscopic semantic overlap, predisposing models to shortcut learning and overestimating their true extrapolation capability; meanwhile, conventional domain adaptation paradigms suffer under extreme structural shifts, as blindly aligning heterogeneous source libraries injects topological noise and triggers negative transfer. To address these two challenges, scaffold-cluster out-of-distribution performance evaluation benchmark (SCOPE-BENCH), a benchmark built on cluster-level partitioning in an explicit physicochemical descriptor space, is proposed alongside policy optimization for multi-source adaptation (POMA), a framework that formulates knowledge transfer as a retrieve-compose-adapt pipeline: labeled source scaffolds structurally close to the unlabeled target are first identified as proxy targets; a reinforcement learning policy then adaptively selects the optimal source subset from an exponentially large candidate pool; and dual-scale domain adaptation is finally performed at macroscopic topological and microscopic pharmacophore scales. Evaluations show that prediction errors of state-of-the-art 3D molecular models surge by up to 8.0x on SCOPE-BENCH with a mean of 5.9x, while POMA achieves up to an 11.2% reduction in mean absolute error with an average relative improvement of 6.2% across diverse backbone architectures. Code is available at https://anonymous.4open.science/r/Molecular-OOD-Code-73F6.
- Abstract(参考訳): 極端なアウト・オブ・ディストリビューション(OOD)シナリオ下での分子特性のロバストな予測は、AIによる薬物発見における重要なボトルネックである。
現在の足場分割プロトコルは、微妙なセマンティックオーバーラップを防げず、学習を短くし、真の補間能力を過大評価するためのモデルを事前に定義するが、一方、従来のドメイン適応パラダイムは、不均一なソースライブラリを盲目的に整列させることで、トポロジカルノイズを注入し、負の転送を引き起こすため、極端な構造シフトに苦しむ。
これら2つの課題に対処するために、クラスタレベルのパーティショニングを明示的な物理化学的記述空間に構築したベンチマークであるSCOPE-BENCH(scack-cluster out-of-distriion performance evaluation benchmark)が提案され、マルチソース適応のためのポリシー最適化(POMA)とともに、検索-compose-adapt Pipelineとして知識伝達を定式化するフレームワークが提案されている。
評価の結果、SCOPE-BENCHでは最先端の3D分子モデルの予測誤差が平均5.9倍、POMAでは平均絶対誤差が11.2%減少し、バックボーンアーキテクチャの平均相対的改善は6.2%に達した。
コードはhttps://anonymous.4open.science/r/Molecular-OOD-Code-73F6で公開されている。
関連論文リスト
- Decomposing the Generalization Gap in PROTAC Activity Prediction: Variance Attribution and the Inter-Laboratory Ceiling [11.472625518731173]
我々は、これを評価科学的な問題とみなし、実験的なテストベッドとして標的タンパク質の分解を利用する。
ProTAC-Bench (10,748 測定,173 ターゲット,65 LOTO フォルダ),分散復号化フレームワーク,ターゲットごとのキャリブレーションプロトコル,評価コードをリリースする。
論文 参考訳(メタデータ) (2026-05-12T08:35:02Z) - Architecture-Agnostic Modality-Isolated Gated Fusion for Robust Multi-Modal Prostate MRI Segmentation [0.0]
多重化前立腺MRIは、T2パラメトリック(T2W)、見かけ拡散係数(ADC)、高b値拡散強調(HBV)配列を組み合わせる。
実際には、拡散配列は、T2Wよりも、取得のばらつき、動き、アーティファクトの影響を受けることが多い。
我々は、学習ゲーティングステージの前に、個別のモダリティ固有の符号化ストリームを維持するために、Modality-Isolated Gated Fusion (MIGF)を提案する。
論文 参考訳(メタデータ) (2026-04-12T15:54:21Z) - Function-Space Decoupled Diffusion for Forward and Inverse Modeling in Carbon Capture and Storage [65.51149575007149]
本稿では,Fun-DDPSについて述べる。Fun-DDPSは,関数空間拡散モデルと微分可能なニューラル演算子サロゲートを結合した生成フレームワークである。
Fun-DDPSは、ジョイントステートベースラインで観察される高周波アーティファクトから、物理的に一貫した実現をもたらす。
論文 参考訳(メタデータ) (2026-02-12T18:58:12Z) - Learning a Generative Meta-Model of LLM Activations [75.30161960337892]
ネットワークの内部状態の分布を学習する"メタモデル"を作成します。
ステアリング介入前に学んだメタモデルを適用することで、損失が減少するにつれて、流速が向上する。
これらの結果は、生成的メタモデルが制限的な構造的仮定を伴わずに、解釈可能性へのスケーラブルな経路を提供することを示唆している。
論文 参考訳(メタデータ) (2026-02-06T18:59:56Z) - Diagnosing Heteroskedasticity and Resolving Multicollinearity Paradoxes in Physicochemical Property Prediction [0.2330146832085843]
PubChem, ChEMBL, eMoleculesデータベースから426,850個の生物活性分子を解析した。
計算された logP 値を予測する線形モデルでは, 重度のヘテロスケダスト性が確認された。
木に基づくアンサンブル法は本質的にヘテロスケダスティック性に強く,予測性能は優れていた。
論文 参考訳(メタデータ) (2025-12-31T05:32:13Z) - Latent Sculpting for Zero-Shot Generalization: A Manifold Learning Approach to Out-of-Distribution Anomaly Detection [2.8547732086436306]
教師付きディープラーニングの基本的限界は「一般化崩壊」である
階層型2段階表現学習フレームワークであるLatent Sculptingを提案する。
我々は「浸潤」のシナリオについて88.89%の検知率を報告した。
論文 参考訳(メタデータ) (2025-12-19T11:37:02Z) - OTSurv: A Novel Multiple Instance Learning Framework for Survival Prediction with Heterogeneity-aware Optimal Transport [58.5751036808652]
全スライド画像(WSI)を用いた生存予測は、多重インスタンス学習(MIL)問題として定式化することができる。
我々は、最適な輸送の観点から、新しいMILフレームワークであるOTSurvを提案する。
我々は6つの人気のあるベンチマークで新しい結果を設定し、平均的なCインデックスで絶対3.6%の改善を達成した。
論文 参考訳(メタデータ) (2025-06-25T18:09:42Z) - Model Inversion Attacks Through Target-Specific Conditional Diffusion Models [54.69008212790426]
モデル反転攻撃(MIA)は、ターゲット分類器のトレーニングセットからプライベートイメージを再構築することを目的としており、それによってAIアプリケーションにおけるプライバシー上の懸念が高まる。
従来のGANベースのMIAは、GANの固有の欠陥と潜伏空間における最適化の偏りにより、劣った遺伝子的忠実度に悩まされる傾向にある。
これらの問題を緩和するために拡散モデル反転(Diff-MI)攻撃を提案する。
論文 参考訳(メタデータ) (2024-07-16T06:38:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。