論文の概要: Stochastic Threshold Model Trees: A Tree-Based Ensemble Method for
Dealing with Extrapolation
- arxiv url: http://arxiv.org/abs/2009.09171v1
- Date: Sat, 19 Sep 2020 05:48:01 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-16 21:03:33.265400
- Title: Stochastic Threshold Model Trees: A Tree-Based Ensemble Method for
Dealing with Extrapolation
- Title(参考訳): 確率的しきい値モデル木:外挿を扱う木に基づくアンサンブル法
- Authors: Kohei Numata and Kenichi Tanaka
- Abstract要約: 新規材料の開発においては, 前例のない物性を持つ化合物を探索することが望ましい。
本稿では,従来の手法の精度を維持しつつ,データの傾向を反映した開発閾値モデルツリー(STMT)を提案する。
実データの場合、精度が大幅に向上することはないが、予測精度が顕著に向上する化合物が1つ存在する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In the field of chemistry, there have been many attempts to predict the
properties of unknown compounds from statistical models constructed using
machine learning. In an area where many known compounds are present (the
interpolation area), an accurate model can be constructed. In contrast, data in
areas where there are no known compounds (the extrapolation area) are generally
difficult to predict. However, in the development of new materials, it is
desirable to search this extrapolation area and discover compounds with
unprecedented physical properties. In this paper, we propose Stochastic
Threshold Model Trees (STMT), an extrapolation method that reflects the trend
of the data, while maintaining the accuracy of conventional interpolation
methods. The behavior of STMT is confirmed through experiments using both
artificial and real data. In the case of the real data, although there is no
significant overall improvement in accuracy, there is one compound for which
the prediction accuracy is notably improved, suggesting that STMT reflects the
data trends in the extrapolation area. We believe that the proposed method will
contribute to more efficient searches in situations such as new material
development.
- Abstract(参考訳): 化学の分野では、機械学習を用いて構築された統計モデルから未知の化合物の性質を予測する多くの試みがある。
多くの既知の化合物が存在する領域(補間領域)では、正確なモデルを構築することができる。
対照的に、既知の化合物(外挿領域)が存在しない地域のデータは一般的に予測が難しい。
しかし, 新規材料の開発においては, この外挿領域を探索し, 前例のない物性を持つ化合物を発見することが望ましい。
本稿では,従来の補間法の精度を維持しつつ,データの傾向を反映した外挿法である確率的しきい値モデル木(stmt)を提案する。
人工データと実データの両方を用いてSTMTの挙動を確認する。
実データの場合、精度が大幅に向上することはないが、予測精度が顕著に向上する化合物が1つ存在し、STMTが外挿領域のデータ傾向を反映していることが示唆されている。
提案手法は,新素材開発などの状況において,より効率的な探索に寄与すると考えられる。
関連論文リスト
- Extrapolative ML Models for Copolymers [1.901715290314837]
機械学習モデルは、材料特性の予測に徐々に使われてきた。
これらのモデルは本質的に補間的であり、物質の既知の特性範囲外の候補を探索するための有効性は未解決である。
本稿では,MLモデルの外挿能力,トレーニングデータセットのサイズと範囲,学習アプローチとの関係について検討する。
論文 参考訳(メタデータ) (2024-09-15T11:02:01Z) - Emerging-properties Mapping Using Spatial Embedding Statistics: EMUSES [0.0]
EMUSESは、データ内の潜伏構造を明らかにする高次元埋め込みを作成する革新的なアプローチである。
予測精度と解釈可能性のギャップを埋めることで、EMUSESは複雑な現象の多因子的起源を理解する強力なツールを提供する。
論文 参考訳(メタデータ) (2024-06-20T13:39:14Z) - Balancing Molecular Information and Empirical Data in the Prediction of Physico-Chemical Properties [8.649679686652648]
本稿では,分子記述子と表現学習を組み合わせた一般的な手法を提案する。
提案したハイブリッドモデルは,グラフニューラルネットワークを用いた化学構造情報を利用する。
構造に基づく予測が信頼できない場合を自動的に検出し、表現学習に基づく予測によって修正する。
論文 参考訳(メタデータ) (2024-06-12T10:51:00Z) - Optimizing OOD Detection in Molecular Graphs: A Novel Approach with Diffusion Models [71.39421638547164]
本稿では,入力分子と再構成グラフの類似性を比較する補助拡散モデルに基づくフレームワークを用いてOOD分子を検出することを提案する。
IDトレーニングサンプルの再構成に向けた生成バイアスのため、OOD分子の類似度スコアは検出を容易にするためにはるかに低い。
本研究は,PGR-MOOD(PGR-MOOD)とよばれる分子OOD検出のためのプロトタイプグラフ再構成のアプローチを開拓し,3つのイノベーションを生かした。
論文 参考訳(メタデータ) (2024-04-24T03:25:53Z) - Diffusion posterior sampling for simulation-based inference in tall data settings [53.17563688225137]
シミュレーションベース推論(SBI)は、入力パラメータを所定の観測に関連付ける後部分布を近似することができる。
本研究では、モデルのパラメータをより正確に推測するために、複数の観測値が利用できる、背の高いデータ拡張について考察する。
提案手法を,最近提案した各種数値実験の競合手法と比較し,数値安定性と計算コストの観点から,その優位性を実証した。
論文 参考訳(メタデータ) (2024-04-11T09:23:36Z) - Exploring the Effectiveness of Dataset Synthesis: An application of
Apple Detection in Orchards [68.95806641664713]
本研究では,リンゴ樹の合成データセットを生成するための安定拡散2.1-baseの有用性について検討する。
我々は、現実世界のリンゴ検出データセットでリンゴを予測するために、YOLOv5mオブジェクト検出モデルを訓練する。
その結果、実世界の画像でトレーニングされたベースラインモデルと比較して、生成データでトレーニングされたモデルはわずかに性能が劣っていることがわかった。
論文 参考訳(メタデータ) (2023-06-20T09:46:01Z) - ALMERIA: Boosting pairwise molecular contrasts with scalable methods [0.0]
ALMERIAは、一対の分子コントラストに基づく化合物の類似性と活性予測を推定するためのツールである。
大量のデータを利用するスケーラブルなソフトウェアと手法を使って実装されている。
分子活性予測の最先端性能を示す実験を行った。
論文 参考訳(メタデータ) (2023-04-28T16:27:06Z) - Combining Observational and Randomized Data for Estimating Heterogeneous
Treatment Effects [82.20189909620899]
不均一な治療効果を推定することは、多くの領域において重要な問題である。
現在、現存するほとんどの作品は観測データにのみ依存している。
本稿では、大量の観測データと少量のランダム化データを組み合わせることで、不均一な処理効果を推定する。
論文 参考訳(メタデータ) (2022-02-25T18:59:54Z) - Mixed Effects Neural ODE: A Variational Approximation for Analyzing the
Dynamics of Panel Data [50.23363975709122]
パネルデータ解析に(固定・ランダムな)混合効果を取り入れたME-NODEという確率モデルを提案する。
我々は、Wong-Zakai定理によって提供されるSDEの滑らかな近似を用いて、我々のモデルを導出できることを示す。
次に、ME-NODEのためのエビデンスに基づく下界を導出し、(効率的な)トレーニングアルゴリズムを開発する。
論文 参考訳(メタデータ) (2022-02-18T22:41:51Z) - TACTiS: Transformer-Attentional Copulas for Time Series [76.71406465526454]
時間変化量の推定は、医療や金融などの分野における意思決定の基本的な構成要素である。
本稿では,アテンションベースデコーダを用いて関節分布を推定する多元的手法を提案する。
本研究では,本モデルが実世界の複数のデータセットに対して最先端の予測を生成することを示す。
論文 参考訳(メタデータ) (2022-02-07T21:37:29Z) - Chemical Property Prediction Under Experimental Biases [26.407895054724452]
本研究は,実験データセットにおけるバイアス軽減に焦点を当てた。
我々は因果推論とグラフニューラルネットワークを組み合わせた2つの手法を用いて分子構造を表現した。
4つのバイアスシナリオによる実験結果から,逆確率スコアリング法と反実回帰法が確固たる改善をもたらしたことが示唆された。
論文 参考訳(メタデータ) (2020-09-18T08:40:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。