論文の概要: Molecular Design Based on Integer Programming and Splitting Data Sets by
Hyperplanes
- arxiv url: http://arxiv.org/abs/2305.00801v1
- Date: Thu, 27 Apr 2023 04:18:41 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-02 13:24:06.914282
- Title: Molecular Design Based on Integer Programming and Splitting Data Sets by
Hyperplanes
- Title(参考訳): ハイパープレーンによる整数計画と分割データセットに基づく分子設計
- Authors: Jianshen Zhu, Naveed Ahmed Azam, Kazuya Haraguchi, Liang Zhao, Hiroshi
Nagamochi and Tatsuya Akutsu
- Abstract要約: 化学物質の分子構造を所望の化学的性質で設計するための枠組みを提案する。
提案フレームワークは,混合整数線形プログラム (MILP) と機械学習によって構築された予測関数を解くことで,所望の化学グラフを推定する。
計算実験の結果,提案手法は,優れた予測関数の構築が困難であったいくつかの化学特性の学習性能を向上させることが示唆された。
- 参考スコア(独自算出の注目度): 6.504869613326338
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: A novel framework for designing the molecular structure of chemical compounds
with a desired chemical property has recently been proposed. The framework
infers a desired chemical graph by solving a mixed integer linear program
(MILP) that simulates the computation process of a feature function defined by
a two-layered model on chemical graphs and a prediction function constructed by
a machine learning method. To improve the learning performance of prediction
functions in the framework, we design a method that splits a given data set
$\mathcal{C}$ into two subsets $\mathcal{C}^{(i)},i=1,2$ by a hyperplane in a
chemical space so that most compounds in the first (resp., second) subset have
observed values lower (resp., higher) than a threshold $\theta$. We construct a
prediction function $\psi$ to the data set $\mathcal{C}$ by combining
prediction functions $\psi_i,i=1,2$ each of which is constructed on
$\mathcal{C}^{(i)}$ independently. The results of our computational experiments
suggest that the proposed method improved the learning performance for several
chemical properties to which a good prediction function has been difficult to
construct.
- Abstract(参考訳): 近年, 化合物の分子構造を望ましい化学的性質で設計するための新しい枠組みが提案されている。
このフレームワークは、化学グラフ上の2層モデルで定義された特徴関数の計算過程と、機械学習法で構築された予測関数をシミュレートする混合整数線形プログラム(MILP)を解くことにより、所望の化学グラフを推論する。
フレームワークにおける予測関数の学習性能を改善するため、与えられたデータセットの$\mathcal{C}$を化学空間内の超平面によって$\mathcal{C}^{(i)},i=1,2$に分割する手法を設計し、第1(resp., Second)サブセットのほとんどの化合物が閾値$\theta$よりも低い値(resp., higher)を観測できるようにした。
予測関数 $\psi_i,i=1,2$ を組み合わせて、データセット $\mathcal{C}$ に予測関数 $\psi$ を構築し、それぞれが $\mathcal{C}^{(i)}$ 上に独立に構築される。
計算実験の結果,提案手法は,優れた予測関数の構築が困難であったいくつかの化学特性の学習性能を向上させることが示唆された。
関連論文リスト
- $\nabla^2$DFT: A Universal Quantum Chemistry Dataset of Drug-Like Molecules and a Benchmark for Neural Network Potentials [35.949502493236146]
この研究は、nablaDFTをベースにした$nabla2$DFTと呼ばれる新しいデータセットとベンチマークを提示している。
分子構造の2倍、コンフォーメーションの3倍、新しいデータタイプとタスク、最先端のモデルを含んでいる。
$nabla2$DFTは、大量の薬物様分子の緩和軌道を含む最初のデータセットである。
論文 参考訳(メタデータ) (2024-06-20T14:14:59Z) - Projection by Convolution: Optimal Sample Complexity for Reinforcement Learning in Continuous-Space MDPs [56.237917407785545]
本稿では,円滑なベルマン作用素を持つ連続空間マルコフ決定過程(MDP)の一般クラスにおいて,$varepsilon$-optimal Policyを学習する問題を考察する。
我々のソリューションの鍵となるのは、調和解析のアイデアに基づく新しい射影技術である。
我々の結果は、連続空間 MDP における2つの人気と矛盾する視点のギャップを埋めるものである。
論文 参考訳(メタデータ) (2024-05-10T09:58:47Z) - Molecular Design Based on Integer Programming and Quadratic Descriptors
in a Two-layered Model [5.845754795753478]
混合整数線形プログラム(MILP)を解くことにより、所望の化学グラフを推論する。
特徴関数におけるグラフ理論記述子の集合は、そのようなMILPのコンパクトな定式化を導出するために重要な役割を果たす。
計算実験の結果,提案手法は最大50個の非水素原子を持つ化学構造を推定可能であることが示唆された。
論文 参考訳(メタデータ) (2022-09-13T08:27:25Z) - Quantum Resources Required to Block-Encode a Matrix of Classical Data [56.508135743727934]
回路レベルの実装とリソース推定を行い、古典データの高密度な$Ntimes N$行列をブロックエンコードして$epsilon$を精度良くすることができる。
異なるアプローチ間のリソーストレードオフを調査し、量子ランダムアクセスメモリ(QRAM)の2つの異なるモデルの実装を検討する。
我々の結果は、単純なクエリの複雑さを超えて、大量の古典的データが量子アルゴリズムにアクセスできると仮定された場合のリソースコストの明確な図を提供する。
論文 参考訳(メタデータ) (2022-06-07T18:00:01Z) - An Inverse QSAR Method Based on Linear Regression and Integer
Programming [6.519339570726759]
人工ニューラルネットワーク(ANN)と混合整数線形計画(MILP)の両方を用いて化合物の分子構造を設計するための枠組みを提案する。
本稿では,線形回帰を用いて予測関数をANNの代わりに$eta$で構築する。
計算実験の結果, 約50個の非水素原子を持つ化学グラフを推定できることが示唆された。
論文 参考訳(メタデータ) (2021-07-06T04:37:55Z) - Tightening the Dependence on Horizon in the Sample Complexity of
Q-Learning [59.71676469100807]
この研究は、同期Q-ラーニングのサンプルの複雑さを、任意の$0varepsilon 1$に対して$frac|mathcalS| (1-gamma)4varepsilon2$の順序に絞る。
計算やストレージを余分に必要とせずに、高速なq-learningにマッチするvanilla q-learningの有効性を明らかにした。
論文 参考訳(メタデータ) (2021-02-12T14:22:05Z) - Advanced Graph and Sequence Neural Networks for Molecular Property
Prediction and Drug Discovery [53.00288162642151]
計算モデルや分子表現にまたがる包括的な機械学習ツール群であるMoleculeKitを開発した。
これらの表現に基づいて構築されたMoeculeKitには、ディープラーニングと、グラフとシーケンスデータのための従来の機械学習方法の両方が含まれている。
オンラインおよびオフラインの抗生物質発見と分子特性予測のタスクの結果から、MoneculeKitは以前の方法よりも一貫した改善を実現していることがわかる。
論文 参考訳(メタデータ) (2020-12-02T02:09:31Z) - Learning to extrapolate using continued fractions: Predicting the
critical temperature of superconductor materials [5.905364646955811]
人工知能(AI)と機械学習(ML)の分野では、未知のターゲット関数 $y=f(mathbfx)$ の近似が共通の目的である。
トレーニングセットとして$S$を参照し、新しいインスタンス$mathbfx$に対して、このターゲット関数を効果的に近似できる低複雑さの数学的モデルを特定することを目的としている。
論文 参考訳(メタデータ) (2020-11-27T04:57:40Z) - Supervised deep learning prediction of the formation enthalpy of the
full set of configurations in complex phases: the $\sigma-$phase as an
example [1.8369974607582582]
固体化学におけるいくつかの特性の予測に機械学習をどのように利用できるかを示す。
特に、与えられた複雑な結晶相の形成熱を予測するのに使用できる。
論文 参考訳(メタデータ) (2020-11-21T22:07:15Z) - On Function Approximation in Reinforcement Learning: Optimism in the
Face of Large State Spaces [208.67848059021915]
強化学習のコアにおける探索・探索トレードオフについて検討する。
特に、関数クラス $mathcalF$ の複雑さが関数の複雑さを特徴づけていることを証明する。
私たちの後悔の限界はエピソードの数とは無関係です。
論文 参考訳(メタデータ) (2020-11-09T18:32:22Z) - Sample Complexity of Asynchronous Q-Learning: Sharper Analysis and
Variance Reduction [63.41789556777387]
非同期Q-ラーニングはマルコフ決定過程(MDP)の最適行動値関数(またはQ-関数)を学習することを目的としている。
Q-関数の入出力$varepsilon$-正確な推定に必要なサンプルの数は、少なくとも$frac1mu_min (1-gamma)5varepsilon2+ fract_mixmu_min (1-gamma)$の順である。
論文 参考訳(メタデータ) (2020-06-04T17:51:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。