論文の概要: MetaRF: Differentiable Random Forest for Reaction Yield Prediction with
a Few Trails
- arxiv url: http://arxiv.org/abs/2208.10083v1
- Date: Mon, 22 Aug 2022 06:40:13 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-23 14:33:39.069884
- Title: MetaRF: Differentiable Random Forest for Reaction Yield Prediction with
a Few Trails
- Title(参考訳): MetaRF:わずかなトレイルでの反応収量予測のための微分可能なランダムフォレスト
- Authors: Kexin Chen, Guangyong Chen, Junyou Li, Yuansheng Huang, Pheng-Ann Heng
- Abstract要約: 本稿では,反応収率予測問題に焦点をあてる。
筆者らはまず,数発の収量予測のために特別に設計された,注意に基づく識別可能なランダム森林モデルであるMetaRFを紹介した。
数発の学習性能を改善するために,さらに次元還元に基づくサンプリング手法を導入する。
- 参考スコア(独自算出の注目度): 58.47364143304643
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Artificial intelligence has deeply revolutionized the field of medicinal
chemistry with many impressive applications, but the success of these
applications requires a massive amount of training samples with high-quality
annotations, which seriously limits the wide usage of data-driven methods. In
this paper, we focus on the reaction yield prediction problem, which assists
chemists in selecting high-yield reactions in a new chemical space only with a
few experimental trials. To attack this challenge, we first put forth MetaRF,
an attention-based differentiable random forest model specially designed for
the few-shot yield prediction, where the attention weight of a random forest is
automatically optimized by the meta-learning framework and can be quickly
adapted to predict the performance of new reagents while given a few additional
samples. To improve the few-shot learning performance, we further introduce a
dimension-reduction based sampling method to determine valuable samples to be
experimentally tested and then learned. Our methodology is evaluated on three
different datasets and acquires satisfactory performance on few-shot
prediction. In high-throughput experimentation (HTE) datasets, the average
yield of our methodology's top 10 high-yield reactions is relatively close to
the results of ideal yield selection.
- Abstract(参考訳): 人工知能は、多くの印象的な応用で医学化学の分野に深く革命をもたらしたが、これらの応用の成功には、高品質なアノテーションを備えた大量のトレーニングサンプルが必要である。
本稿では, 反応収率予測問題に焦点をあて, 数回の実験実験を行い, 新規な化学空間における高yield反応の選択を支援する。
この課題に対処するため,我々はまず,無作為林の注意重みをメタラーニングフレームワークによって自動的に最適化し,新たな試薬の性能を予測し,いくつかの追加サンプルを付与した,注意に基づく識別可能な無作為林モデルであるMetaRFを考案した。
数発の学習性能を向上させるため,実験で検証し,学習する貴重なサンプルを抽出する次元還元法を提案する。
提案手法は,3つの異なるデータセットで評価し,少ない予測で十分な性能を得る。
高スループット実験(hte)データセットでは、我々の方法論のトップ10の高yield反応の平均収率は、理想的な収率選択の結果に比較的近い。
関連論文リスト
- Optimizing Probabilistic Conformal Prediction with Vectorized Non-Conformity Scores [6.059745771017814]
本研究では,まず非整合性スコアをランク付きサンプルでベクトル化し,次に同じランクのサンプルに対して定量値を変化させることで,予測値の形状を最適化することにより,効率を向上させる新しいフレームワークを提案する。
提案手法は,不連続かつ効率的な予測セットを生成しながら,有効なカバレッジを提供する。
論文 参考訳(メタデータ) (2024-10-17T16:37:03Z) - From Prediction to Action: Critical Role of Performance Estimation for
Machine-Learning-Driven Materials Discovery [2.3243389656894595]
我々は,事前計算したデータ収集から得られる適切な性能推定手法が欠如していることが,データ駆動材料発見の改善の根本的課題であると主張している。
本研究では,「予測された改善」獲得関数を用いてガウス過程の予測を成功させる手法を提案する。
論文 参考訳(メタデータ) (2023-11-27T05:29:43Z) - Data Pruning via Moving-one-Sample-out [61.45441981346064]
我々は移動1サンプルアウト(MoSo)と呼ばれる新しいデータ処理手法を提案する。
MoSoは、トレーニングセットから最も分かりにくいサンプルを特定し、削除することを目的としている。
実験結果から,MoSoは高プルーニング比で高い性能劣化を効果的に緩和することが示された。
論文 参考訳(メタデータ) (2023-10-23T08:00:03Z) - ReSmooth: Detecting and Utilizing OOD Samples when Training with Data
Augmentation [57.38418881020046]
最近のDA技術は、常に強化トレーニングサンプルの多様性の必要性を満たす。
多様性の高い増分戦略は、通常、アウト・オブ・ディストリビューション(OOD)の増分サンプルを導入する。
ReSmoothは、まず、拡張サンプル中のOODサンプルを検知し、それらを活用するフレームワークである。
論文 参考訳(メタデータ) (2022-05-25T09:29:27Z) - Multimodal Transformer-based Model for Buchwald-Hartwig and
Suzuki-Miyaura Reaction Yield Prediction [0.0]
このモデルは、事前訓練された双方向トランスフォーマーベースのエンコーダ(BERT)と、回帰ヘッドを備えた多層パーセプトロン(MLP)から構成され、収量を予測する。
我々は、Buchwald-Hartwigのサンプル外のデータセット分割でモデルのパフォーマンスをテストし、最先端技術で同等の結果を得た。
論文 参考訳(メタデータ) (2022-04-27T07:28:27Z) - SURF: Semi-supervised Reward Learning with Data Augmentation for
Feedback-efficient Preference-based Reinforcement Learning [168.89470249446023]
我々は、大量のラベルなしサンプルとデータ拡張を利用する半教師付き報酬学習フレームワークSURFを提案する。
報奨学習にラベルのないサンプルを活用するために,選好予測器の信頼性に基づいてラベルのないサンプルの擬似ラベルを推定する。
本実験は, ロボット操作作業における嗜好に基づく手法のフィードバック効率を有意に向上させることを実証した。
論文 参考訳(メタデータ) (2022-03-18T16:50:38Z) - Active Learning-Based Optimization of Scientific Experimental Design [1.9705094859539976]
Active Learning(AL)は、ラベル付きトレーニングインスタンスを少なくすることで、より精度の高い機械学習アルゴリズムである。
本稿では,提案したALスキームを用いた薬物応答データセットの振り返り研究を行う。
これは、手動で設定するのではなく、科学的な実験設計がALによって最適化可能であることを示している。
論文 参考訳(メタデータ) (2021-12-29T20:02:35Z) - SelectAugment: Hierarchical Deterministic Sample Selection for Data
Augmentation [72.58308581812149]
そこで我々は,SelectAugmentと呼ばれる効果的な手法を提案し,決定論的かつオンラインに拡張するサンプルを選択する。
具体的には、各バッチにおいて、まず増分比率を決定し、次にこの比で各トレーニングサンプルを増分するかを決定する。
これにより、サンプルを増量する際のランダム性による負の効果を効果的に軽減し、DAの有効性を向上させることができる。
論文 参考訳(メタデータ) (2021-12-06T08:38:38Z) - Jo-SRC: A Contrastive Approach for Combating Noisy Labels [58.867237220886885]
Jo-SRC (Joint Sample Selection and Model Regularization based on Consistency) というノイズロバスト手法を提案する。
具体的には、対照的な学習方法でネットワークをトレーニングする。
各サンプルの2つの異なるビューからの予測は、クリーンまたは分布不足の「可能性」を推定するために使用されます。
論文 参考訳(メタデータ) (2021-03-24T07:26:07Z) - Chemical Property Prediction Under Experimental Biases [26.407895054724452]
本研究は,実験データセットにおけるバイアス軽減に焦点を当てた。
我々は因果推論とグラフニューラルネットワークを組み合わせた2つの手法を用いて分子構造を表現した。
4つのバイアスシナリオによる実験結果から,逆確率スコアリング法と反実回帰法が確固たる改善をもたらしたことが示唆された。
論文 参考訳(メタデータ) (2020-09-18T08:40:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。