論文の概要: Mixing Vector Model for Copolymer Inference via Mixed Integer Linear Programming
- arxiv url: http://arxiv.org/abs/2605.29329v1
- Date: Thu, 28 May 2026 04:05:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-30 02:45:55.658728
- Title: Mixing Vector Model for Copolymer Inference via Mixed Integer Linear Programming
- Title(参考訳): 混合整数線形計画法による共重合体推論のための混合ベクトルモデル
- Authors: Jianshen Zhu, Raveena Rai, Taiyo Sohkawa, Naveed Ahmed Azam, Kazuya Haraguchi, Liang Zhao, Tatsuya Akutsu,
- Abstract要約: 新規な二相分子推論フレームワークであるmol-inferは、最近、所定の抽象構造と所望の特性値を持つ化学グラフを推論するために開発された。
混合ベクトル(MV)モデルと呼ばれる単純な特徴表現を導入することで、この枠組みを共重合体に拡張する。
- 参考スコア(独自算出の注目度): 7.66131041673865
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: A novel two-phase molecule inference framework, mol-infer, has recently been developed to infer chemical graphs with prescribed abstract structures and desired property values through mixed integer linear programming (MILP) under the two-layered model, with guaranteed optimality and exactness relative to the given learned prediction function and structural constraints. In this study, we extend this framework to copolymers by introducing a simple feature representation, called the mixing vector (MV) model. In the proposed model, a copolymer feature vector is represented as a convex combination of MILP-tractable monomer descriptors weighted by the mixing ratio of the constituent monomers. This representation does not require explicit sequence-class information and is therefore naturally compatible with MILP-based inverse design. Under this model, we construct prediction functions for several copolymer property datasets using artificial neural networks, reduced quadratic multiple linear regression, and random forests. The proposed representation achieves practically useful predictive performance across multiple physicochemical property datasets; in particular, the best test R^2 score exceeds 0.7 for nine of the ten datasets and exceeds 0.9 for six datasets. We also formulate a multi-monomer inverse-design problem under the MV representation with a prescribed mixing ratio and show that the resulting MILP instances remain tractable, even for three-monomer settings. Finally, we perform an external consistency check by re-evaluating the inferred candidates and comparing the re-computed property values with those predicted by the learned model. Overall, the proposed framework gives a tractable first step toward model-level exact inverse design of copolymers under the two-layered model.
- Abstract(参考訳): 新しい二相分子推論フレームワーク mol-infer は、2層モデルの下での混合整数線形計画法(MILP)により、所定の抽象構造を持つ化学グラフと所望の特性値を推定し、与えられた学習された予測関数と構造制約に対して最適性と正確性を保証するために最近開発された。
本研究では, 混合ベクトルモデル (MV) と呼ばれる単純な特徴表現を導入することで, この枠組みを共重合体に拡張する。
提案モデルでは, 共重合体の特徴ベクトルを, 成分モノマーの混合比で重み付けしたMILPトラクタブルモノマーディスクリプタの凸結合として表現する。
この表現は明示的なシーケンスクラス情報を必要としないため、MILPベースの逆設計と自然に互換性がある。
このモデルでは, 人工ニューラルネットワーク, 二次多重回帰の低減, ランダム森林を用いた共重合特性データセットの予測関数を構築した。
提案した表現は, 複数の物理化学的特性データセットに対して実用的に有用な予測性能を達成し, 特に, ベストテストR^2スコアは10データセット中9データセットの0.7を超え, 6データセットの0.9を超えている。
また, MV表現の下で所定の混合比で多モノマー逆設計問題を定式化し, 3つのモノマー設定においてもMILPインスタンスが抽出可能であることを示す。
最後に、推論された候補を再評価し、再計算された特性値と学習モデルによる予測値を比較することにより、外部整合性チェックを行う。
提案するフレームワークは, 2層モデル下での共重合体のモデルレベルでの正確な逆設計に向けた, 難易度の高い第1ステップを提供する。
関連論文リスト
- Influence-Guided Symbolic Regression: Scientific Discovery via LLM-Driven Equation Search with Granular Feedback [56.69850045068714]
逐次的2段階プロセスとして方程式発見をフレーム化する方法である textitInfluence-Guided Regression (IGSR) を導入する。
LLM-SRBench, 薬理学的PKPDモデル, 疫学シミュレーション, 実世界のゲノムデータなど, IGSRの有効性を示す。
論文 参考訳(メタデータ) (2026-05-27T23:48:01Z) - Fast and Effective Computation of Generalized Symmetric Matrix Factorization [16.011610920688998]
非滑らかで非Lipschitz一般化対称行列分解モデルを提案する。
このモデルは、機械学習、画像科学、工学、および関連する領域において、幅広い種類の行列分解の定式化を統一する。
実際のデータセットに関する数値実験は、ANAUMの効率を実証する。
論文 参考訳(メタデータ) (2026-03-19T17:03:52Z) - Improving Predictions of Molecular Properties with Graph Featurisation and Heterogeneous Ensemble Models [0.0]
機械学習(ML)モデルの多種多様なセットから予測を集約するメタモデルフレームワークを導入する。
テストされたすべての回帰データセットにおいて、我々のフレームワークが最先端のChemPropモデルより優れていることを示す。
幅広い課題にまたがって最適な性能を達成するためには,汎用記述子とタスク固有の学習機能を組み合わせることが不可欠である。
論文 参考訳(メタデータ) (2025-10-27T15:33:05Z) - Preventing Model Collapse Under Overparametrization: Optimal Mixing Ratios for Interpolation Learning and Ridge Regression [4.71547360356314]
モデル崩壊は、生成モデルが自身の合成出力を繰り返し訓練した後で劣化するときに起こる。
この反復スキームの下で最小$$$-normとリッジ回帰の正確な誤差式を導出する。
本分析により, 長期予測誤差を最小化する混合重量の興味深い特性が明らかとなった。
論文 参考訳(メタデータ) (2025-09-26T13:34:48Z) - Sequential-Parallel Duality in Prefix Scannable Models [68.39855814099997]
近年では Gated Linear Attention (GLA) や Mamba など様々なモデルが開発されている。
ニアコンスタント時間並列評価と線形時間、定数空間シーケンシャル推論をサポートするニューラルネットワークモデルの全クラスを特徴付けることができるだろうか?
論文 参考訳(メタデータ) (2025-06-12T17:32:02Z) - Material Microstructure Design Using VAE-Regression with Multimodal
Prior [39.47342980650674]
本稿では,フォワードおよび逆構造-プロパティ結合を構築するための変分オートエンコーダに基づくモデルを提案する。
我々のモデルは最先端のフォワードオンリーモデルと同じくらい正確であることを示す。
論文 参考訳(メタデータ) (2024-02-27T11:27:32Z) - Sample Complexity Characterization for Linear Contextual MDPs [67.79455646673762]
文脈決定プロセス(CMDP)は、遷移カーネルと報酬関数がコンテキスト変数によってインデックス付けされた異なるMDPで時間とともに変化できる強化学習のクラスを記述する。
CMDPは、時間とともに変化する環境で多くの現実世界のアプリケーションをモデル化するための重要なフレームワークとして機能する。
CMDPを2つの線形関数近似モデルで検討する: 文脈変化表現とすべての文脈に対する共通線形重み付きモデルIと、すべての文脈に対する共通表現と文脈変化線形重み付きモデルIIである。
論文 参考訳(メタデータ) (2024-02-05T03:25:04Z) - Sampling Approximately Low-Rank Ising Models: MCMC meets Variational
Methods [35.24886589614034]
一般相互作用が$J$である超キューブ上の二次定値イジングモデルを考える。
我々の一般的な結果は、低ランクのIsingモデルに対する最初のサンプリングアルゴリズムを示唆している。
論文 参考訳(メタデータ) (2022-02-17T21:43:50Z) - Bilinear Classes: A Structural Framework for Provable Generalization in
RL [119.42509700822484]
Bilinear Classesは強化学習の一般化を可能にする新しい構造フレームワークである。
このフレームワークは、サンプルの複雑さが達成可能な、ほとんどすべての既存のモデルを取り込んでいる。
我々の主な成果は、双線形クラスのためのサンプル複雑性を持つRLアルゴリズムである。
論文 参考訳(メタデータ) (2021-03-19T16:34:20Z) - Robust Finite Mixture Regression for Heterogeneous Targets [70.19798470463378]
本稿では,サンプルクラスタの探索と,複数の不完全な混合型ターゲットを同時にモデル化するFMRモデルを提案する。
我々は、高次元の学習フレームワークの下で、無症状のオラクルのパフォーマンス境界をモデルに提供します。
その結果,我々のモデルは最先端の性能を達成できることがわかった。
論文 参考訳(メタデータ) (2020-10-12T03:27:07Z) - Goal-directed Generation of Discrete Structures with Conditional
Generative Models [85.51463588099556]
本稿では,強化学習目標を直接最適化し,期待される報酬を最大化するための新しいアプローチを提案する。
提案手法は、ユーザ定義プロパティを持つ分子の生成と、所定の目標値を評価する短いピソン表現の同定という2つのタスクで検証する。
論文 参考訳(メタデータ) (2020-10-05T20:03:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。