論文の概要: All You Need Is Synthetic Task Augmentation
- arxiv url: http://arxiv.org/abs/2505.10120v1
- Date: Thu, 15 May 2025 09:46:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-16 22:29:06.263274
- Title: All You Need Is Synthetic Task Augmentation
- Title(参考訳): synthetic Task Augmentationは必要なだけ
- Authors: Guillaume Godin,
- Abstract要約: 本研究では,1つのグラフトランスフォーマーニューラルネットワークを,スパースマルチタスク分子特性実験ターゲットと合成ターゲットの両方で協調的にトレーニングする新しい手法を提案する。
その結果,19の分子特性予測タスクにおいて,一貫した,重要な性能向上が得られた。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Injecting rule-based models like Random Forests into differentiable neural network frameworks remains an open challenge in machine learning. Recent advancements have demonstrated that pretrained models can generate efficient molecular embeddings. However, these approaches often require extensive pretraining and additional techniques, such as incorporating posterior probabilities, to boost performance. In our study, we propose a novel strategy that jointly trains a single Graph Transformer neural network on both sparse multitask molecular property experimental targets and synthetic targets derived from XGBoost models trained on Osmordred molecular descriptors. These synthetic tasks serve as independent auxiliary tasks. Our results show consistent and significant performance improvement across all 19 molecular property prediction tasks. For 16 out of 19 targets, the multitask Graph Transformer outperforms the XGBoost single-task learner. This demonstrates that synthetic task augmentation is an effective method for enhancing neural model performance in multitask molecular property prediction without the need for feature injection or pretraining.
- Abstract(参考訳): Random Forestsのようなルールベースのモデルを差別化可能なニューラルネットワークフレームワークに注入することは、マシンラーニングにおけるオープンな課題である。
最近の進歩は、事前訓練されたモデルが効率的な分子埋め込みを生成できることを実証している。
しかし、これらのアプローチは、性能を高めるために、広範囲な事前訓練と、後続の確率を組み込むといった追加のテクニックを必要とすることが多い。
本研究では, マルチタスク分子特性実験ターゲットとOsmordred分子記述子で訓練されたXGBoostモデルから得られた合成ターゲットの両方において, 単一のグラフトランスフォーマーニューラルネットワークを協調的に訓練する新しい手法を提案する。
これらの合成タスクは独立した補助タスクとして機能する。
その結果,19の分子特性予測タスクにおいて,一貫した,重要な性能向上が得られた。
19のターゲットのうち16は、マルチタスクグラフトランスフォーマーがXGBoostシングルタスク学習者より優れている。
このことは、合成タスク増強が、特徴注入や事前訓練を必要とせず、マルチタスク分子特性予測におけるニューラルモデル性能を向上させる効果的な方法であることを示している。
関連論文リスト
- UniGenX: Unified Generation of Sequence and Structure with Autoregressive Diffusion [61.690978792873196]
既存のアプローチは自己回帰シーケンスモデルか拡散モデルのいずれかに依存している。
自己回帰的次トーケン予測と条件拡散モデルを組み合わせた統合フレームワークUniGenXを提案する。
材料および小分子生成タスクにおけるUniGenXの有効性を検証する。
論文 参考訳(メタデータ) (2025-03-09T16:43:07Z) - Fine-Tuning Discrete Diffusion Models via Reward Optimization with Applications to DNA and Protein Design [56.957070405026194]
拡散モデルにより生成された軌道全体を通して報酬の直接バックプロパゲーションを可能にするアルゴリズムを提案する。
DRAKESは自然に似ており、高い報酬をもたらすシーケンスを生成することができる。
論文 参考訳(メタデータ) (2024-10-17T15:10:13Z) - UniGEM: A Unified Approach to Generation and Property Prediction for Molecules [33.94641403669206]
分子生成と特性予測をうまく統合する最初の統一モデルUniGEMを提案する。
我々の重要な革新は、分子足場が形成された後、後段で予測タスクが活性化される新しい2相生成プロセスにある。
UniGEMの背景にある原則は、自然言語処理やコンピュータビジョンなど幅広い応用を約束している。
論文 参考訳(メタデータ) (2024-10-14T13:58:13Z) - Molecule Design by Latent Prompt Transformer [76.2112075557233]
本研究は、分子設計の課題を条件付き生成モデリングタスクとしてフレーミングすることによって検討する。
本研究では,(1)学習可能な事前分布を持つ潜伏ベクトル,(2)プロンプトとして潜伏ベクトルを用いる因果トランスフォーマーに基づく分子生成モデル,(3)潜在プロンプトを用いた分子の目標特性および/または制約値を予測する特性予測モデルからなる新しい生成モデルを提案する。
論文 参考訳(メタデータ) (2024-02-27T03:33:23Z) - AdaMR: Adaptable Molecular Representation for Unified Pre-training Strategy [11.710702202071573]
分子調節性表現(AdaMR)と呼ばれる,小分子薬物の大規模均一事前学習戦略を提案する。
AdaMRは、分子正準化と呼ばれる事前訓練ジョブによって達成される粒度調整可能な分子エンコーディング戦略を利用する。
6つの分子特性予測タスクと2つの生成タスクに関する事前学習モデルを微調整し、8つのタスクのうち5つについてSOTA(State-of-the-art)の結果を得た。
論文 参考訳(メタデータ) (2023-12-28T10:53:17Z) - PIGNet2: A Versatile Deep Learning-based Protein-Ligand Interaction
Prediction Model for Binding Affinity Scoring and Virtual Screening [0.0]
タンパク質-リガンド相互作用の予測(PLI)は、薬物発見において重要な役割を果たす。
結合親和性を正確に評価し、効率的な仮想スクリーニングを行う汎用モデルの開発は依然として課題である。
本稿では、物理インフォームドグラフニューラルネットワークと組み合わせて、新しいデータ拡張戦略を導入することにより、実現可能なソリューションを提案する。
論文 参考訳(メタデータ) (2023-07-03T14:46:49Z) - An Adversarial Active Sampling-based Data Augmentation Framework for
Manufacturable Chip Design [55.62660894625669]
リソグラフィーモデリングは、チップ設計マスクが製造可能であることを保証するため、チップ設計において重要な問題である。
機械学習の最近の進歩は、時間を要するリソグラフィーシミュレーションをディープニューラルネットワークに置き換えるための代替ソリューションを提供している。
本稿では,限られたデータのジレンマを解消し,機械学習モデルの性能を向上させるために,データ拡張フレームワークを提案する。
論文 参考訳(メタデータ) (2022-10-27T20:53:39Z) - Towards an Automatic Analysis of CHO-K1 Suspension Growth in
Microfluidic Single-cell Cultivation [63.94623495501023]
我々は、人間の力で抽象化されたニューラルネットワークをデータレベルで注入できる新しい機械学習アーキテクチャを提案する。
具体的には、自然データと合成データに基づいて生成モデルを同時に訓練し、細胞数などの対象変数を確実に推定できる共有表現を学習する。
論文 参考訳(メタデータ) (2020-10-20T08:36:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。