Fugu-MT 論文翻訳(概要): Stochastic Threshold Model Trees: A Tree-Based Ensemble Method for Dealing with Extrapolation

論文の概要: Stochastic Threshold Model Trees: A Tree-Based Ensemble Method for Dealing with Extrapolation

arxiv url: http://arxiv.org/abs/2009.09171v1
Date: Sat, 19 Sep 2020 05:48:01 GMT
ステータス: 翻訳完了
システム内更新日: 2022-10-16 21:03:33.265400
Title: Stochastic Threshold Model Trees: A Tree-Based Ensemble Method for Dealing with Extrapolation
Title（参考訳）: 確率的しきい値モデル木:外挿を扱う木に基づくアンサンブル法
Authors: Kohei Numata and Kenichi Tanaka
Abstract要約: 新規材料の開発においては, 前例のない物性を持つ化合物を探索することが望ましい。本稿では,従来の手法の精度を維持しつつ,データの傾向を反映した開発閾値モデルツリー(STMT)を提案する。実データの場合、精度が大幅に向上することはないが、予測精度が顕著に向上する化合物が1つ存在する。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: In the field of chemistry, there have been many attempts to predict the properties of unknown compounds from statistical models constructed using machine learning. In an area where many known compounds are present (the interpolation area), an accurate model can be constructed. In contrast, data in areas where there are no known compounds (the extrapolation area) are generally difficult to predict. However, in the development of new materials, it is desirable to search this extrapolation area and discover compounds with unprecedented physical properties. In this paper, we propose Stochastic Threshold Model Trees (STMT), an extrapolation method that reflects the trend of the data, while maintaining the accuracy of conventional interpolation methods. The behavior of STMT is confirmed through experiments using both artificial and real data. In the case of the real data, although there is no significant overall improvement in accuracy, there is one compound for which the prediction accuracy is notably improved, suggesting that STMT reflects the data trends in the extrapolation area. We believe that the proposed method will contribute to more efficient searches in situations such as new material development.
Abstract（参考訳）: 化学の分野では、機械学習を用いて構築された統計モデルから未知の化合物の性質を予測する多くの試みがある。多くの既知の化合物が存在する領域(補間領域)では、正確なモデルを構築することができる。対照的に、既知の化合物(外挿領域)が存在しない地域のデータは一般的に予測が難しい。しかし, 新規材料の開発においては, この外挿領域を探索し, 前例のない物性を持つ化合物を発見することが望ましい。本稿では,従来の補間法の精度を維持しつつ,データの傾向を反映した外挿法である確率的しきい値モデル木(stmt)を提案する。人工データと実データの両方を用いてSTMTの挙動を確認する。実データの場合、精度が大幅に向上することはないが、予測精度が顕著に向上する化合物が1つ存在し、STMTが外挿領域のデータ傾向を反映していることが示唆されている。提案手法は,新素材開発などの状況において,より効率的な探索に寄与すると考えられる。

関連論文リスト

Robust Molecular Property Prediction via Densifying Scarce Labeled Data [51.55434084913129]
薬物発見において、研究を進める上で最も重要な化合物は、しばしば訓練セットを越えている。本稿では,未ラベルデータを利用したメタラーニングに基づく新しい手法を提案する。実世界のデータセットに挑戦する上で、大きなパフォーマンス向上を示す。
論文参考訳（メタデータ） (2025-06-13T15:27:40Z)
Sparse mixed linear modeling with anchor-based guidance for high-entropy alloy discovery [0.12499537119440242]
本研究では,実験データ取得に固有の欲求探索行動から生じる局所データ構造に着目した。予測と特徴選択を同時に行うアルゴリズムを開発した。高エントロピー合金のケーススタディを通じて,アンカー誘導クラスタリングとスパース線形モデリングを組み合わせた手法を提案する。
論文参考訳（メタデータ） (2025-04-29T01:44:15Z)
Extrapolative ML Models for Copolymers [1.901715290314837]
機械学習モデルは、材料特性の予測に徐々に使われてきた。これらのモデルは本質的に補間的であり、物質の既知の特性範囲外の候補を探索するための有効性は未解決である。本稿では,MLモデルの外挿能力,トレーニングデータセットのサイズと範囲,学習アプローチとの関係について検討する。
論文参考訳（メタデータ） (2024-09-15T11:02:01Z)
Discovering physical laws with parallel combinatorial tree search [57.05912962368898]
記号回帰は、データから簡潔で解釈可能な数学的表現を発見する能力のおかげで、科学研究において重要な役割を果たす。既存のアルゴリズムは10年以上にわたって精度と効率の重大なボトルネックに直面してきた。制約データから汎用数学的表現を効率的に抽出する並列木探索(PCTS)モデルを提案する。
論文参考訳（メタデータ） (2024-07-05T10:41:15Z)
Emerging-properties Mapping Using Spatial Embedding Statistics: EMUSES [0.0]
EMUSESは、データ内の潜伏構造を明らかにする高次元埋め込みを作成する革新的なアプローチである。予測精度と解釈可能性のギャップを埋めることで、EMUSESは複雑な現象の多因子的起源を理解する強力なツールを提供する。
論文参考訳（メタデータ） (2024-06-20T13:39:14Z)
Balancing Molecular Information and Empirical Data in the Prediction of Physico-Chemical Properties [8.649679686652648]
本稿では,分子記述子と表現学習を組み合わせた一般的な手法を提案する。提案したハイブリッドモデルは,グラフニューラルネットワークを用いた化学構造情報を利用する。構造に基づく予測が信頼できない場合を自動的に検出し、表現学習に基づく予測によって修正する。
論文参考訳（メタデータ） (2024-06-12T10:51:00Z)
Optimizing OOD Detection in Molecular Graphs: A Novel Approach with Diffusion Models [71.39421638547164]
本稿では,入力分子と再構成グラフの類似性を比較する補助拡散モデルに基づくフレームワークを用いてOOD分子を検出することを提案する。 IDトレーニングサンプルの再構成に向けた生成バイアスのため、OOD分子の類似度スコアは検出を容易にするためにはるかに低い。本研究は,PGR-MOOD(PGR-MOOD)とよばれる分子OOD検出のためのプロトタイプグラフ再構成のアプローチを開拓し,3つのイノベーションを生かした。
論文参考訳（メタデータ） (2024-04-24T03:25:53Z)
Diffusion posterior sampling for simulation-based inference in tall data settings [53.17563688225137]
シミュレーションベース推論(SBI)は、入力パラメータを所定の観測に関連付ける後部分布を近似することができる。本研究では、モデルのパラメータをより正確に推測するために、複数の観測値が利用できる、背の高いデータ拡張について考察する。提案手法を,最近提案した各種数値実験の競合手法と比較し,数値安定性と計算コストの観点から,その優位性を実証した。
論文参考訳（メタデータ） (2024-04-11T09:23:36Z)
Exploring the Effectiveness of Dataset Synthesis: An application of Apple Detection in Orchards [68.95806641664713]
本研究では,リンゴ樹の合成データセットを生成するための安定拡散2.1-baseの有用性について検討する。我々は、現実世界のリンゴ検出データセットでリンゴを予測するために、YOLOv5mオブジェクト検出モデルを訓練する。その結果、実世界の画像でトレーニングされたベースラインモデルと比較して、生成データでトレーニングされたモデルはわずかに性能が劣っていることがわかった。
論文参考訳（メタデータ） (2023-06-20T09:46:01Z)
ALMERIA: Boosting pairwise molecular contrasts with scalable methods [0.0]
ALMERIAは、一対の分子コントラストに基づく化合物の類似性と活性予測を推定するためのツールである。大量のデータを利用するスケーラブルなソフトウェアと手法を使って実装されている。分子活性予測の最先端性能を示す実験を行った。
論文参考訳（メタデータ） (2023-04-28T16:27:06Z)
Combining Observational and Randomized Data for Estimating Heterogeneous Treatment Effects [82.20189909620899]
不均一な治療効果を推定することは、多くの領域において重要な問題である。現在、現存するほとんどの作品は観測データにのみ依存している。本稿では、大量の観測データと少量のランダム化データを組み合わせることで、不均一な処理効果を推定する。
論文参考訳（メタデータ） (2022-02-25T18:59:54Z)
Mixed Effects Neural ODE: A Variational Approximation for Analyzing the Dynamics of Panel Data [50.23363975709122]
パネルデータ解析に(固定・ランダムな)混合効果を取り入れたME-NODEという確率モデルを提案する。我々は、Wong-Zakai定理によって提供されるSDEの滑らかな近似を用いて、我々のモデルを導出できることを示す。次に、ME-NODEのためのエビデンスに基づく下界を導出し、(効率的な)トレーニングアルゴリズムを開発する。
論文参考訳（メタデータ） (2022-02-18T22:41:51Z)
TACTiS: Transformer-Attentional Copulas for Time Series [76.71406465526454]
時間変化量の推定は、医療や金融などの分野における意思決定の基本的な構成要素である。本稿では,アテンションベースデコーダを用いて関節分布を推定する多元的手法を提案する。本研究では,本モデルが実世界の複数のデータセットに対して最先端の予測を生成することを示す。
論文参考訳（メタデータ） (2022-02-07T21:37:29Z)
Chemical Property Prediction Under Experimental Biases [26.407895054724452]
本研究は,実験データセットにおけるバイアス軽減に焦点を当てた。我々は因果推論とグラフニューラルネットワークを組み合わせた2つの手法を用いて分子構造を表現した。 4つのバイアスシナリオによる実験結果から,逆確率スコアリング法と反実回帰法が確固たる改善をもたらしたことが示唆された。
論文参考訳（メタデータ） (2020-09-18T08:40:57Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。