論文の概要: Metric Learning-enhanced Optimal Transport for Biochemical Regression
Domain Adaptation
- arxiv url: http://arxiv.org/abs/2202.06208v2
- Date: Wed, 16 Feb 2022 09:38:40 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-17 12:37:47.447990
- Title: Metric Learning-enhanced Optimal Transport for Biochemical Regression
Domain Adaptation
- Title(参考訳): バイオケミカル回帰ドメイン適応のためのメトリック学習による最適輸送
- Authors: Fang Wu, Nicolas Courty, Zhang Qiang, jiyu Cui, Ziqing Li
- Abstract要約: ソースドメインを超えて知識を一般化することは、多くの生体医学応用にとって重要な前提条件である。
本稿では,領域距離を計測し,輸送計画に後方分散正規化器を導入するための新しい指標を提案する。
生化学における教師なしと半教師なしの両方の学習課題について,本手法の評価を行った。
- 参考スコア(独自算出の注目度): 8.20544613742774
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generalizing knowledge beyond source domains is a crucial prerequisite for
many biomedical applications such as drug design and molecular property
prediction. To meet this challenge, researchers have used optimal transport
(OT) to perform representation alignment between the source and target domains.
Yet existing OT algorithms are mainly designed for classification tasks.
Accordingly, we consider regression tasks in the unsupervised and
semi-supervised settings in this paper. To exploit continuous labels, we
propose novel metrics to measure domain distances and introduce a posterior
variance regularizer on the transport plan. Further, while computationally
appealing, OT suffers from ambiguous decision boundaries and biased local data
distributions brought by the mini-batch training. To address those issues, we
propose to couple OT with metric learning to yield more robust boundaries and
reduce bias. Specifically, we present a dynamic hierarchical triplet loss to
describe the global data distribution, where the cluster centroids are
progressively adjusted among consecutive iterations. We evaluate our method on
both unsupervised and semi-supervised learning tasks in biochemistry.
Experiments show the proposed method significantly outperforms state-of-the-art
baselines across various benchmark datasets of small molecules and material
crystals.
- Abstract(参考訳): ソースドメインを超えて知識を一般化することは、薬物設計や分子特性予測のような多くの生物医学的応用において重要な前提条件である。
この課題に対処するために、研究者は最適なトランスポート(OT)を使用して、ソースとターゲットドメイン間の表現アライメントを実行した。
しかし、既存のOTアルゴリズムは主に分類タスク用に設計されている。
そこで本論文では,非教師なしおよび半教師なし設定における回帰タスクについて検討する。
連続ラベルを利用するために, 領域距離を測定するための新しい指標を提案し, 輸送計画に後方分散正則化器を導入する。
さらに、計算上魅力的である一方で、otは曖昧な決定バウンダリと、ミニバッチトレーニングによってもたらされた偏ったローカルデータ分散に苦しむ。
これらの問題に対処するため、我々は、OTとメトリックラーニングを組み合わせて、より堅牢な境界を導き、バイアスを減らすことを提案する。
具体的には,クラスタセントロイドを逐次繰り返し調整するグローバルデータ分布を記述するために,動的階層的三重項損失を提案する。
生化学における教師なしと半教師なしの両方の学習課題について,本手法の評価を行った。
実験により, 提案手法は, 小分子および材料結晶の様々なベンチマークデータセットにおいて, 最先端のベースラインを著しく上回ることを示した。
関連論文リスト
- Pre-trained Molecular Language Models with Random Functional Group Masking [54.900360309677794]
SMILESをベースとしたアンダーリネム分子アンダーリネム言語アンダーリネムモデルを提案し,特定の分子原子に対応するSMILESサブシーケンスをランダムにマスキングする。
この技術は、モデルに分子構造や特性をよりよく推測させ、予測能力を高めることを目的としている。
論文 参考訳(メタデータ) (2024-11-03T01:56:15Z) - Analysis of Atom-level pretraining with Quantum Mechanics (QM) data for Graph Neural Networks Molecular property models [0.0]
量子力学(QM)データを用いた原子レベルの事前トレーニングは、トレーニングデータとテストデータ間の分布類似性に関する仮定違反を軽減することができることを示す。
隠れ状態の分子表現を解析し、QMデータに対する分子レベルと原子レベルの事前学習の効果を比較するのは、これが初めてである。
論文 参考訳(メタデータ) (2024-05-23T17:51:05Z) - Active Causal Learning for Decoding Chemical Complexities with Targeted Interventions [0.0]
そこで本研究では,戦略的サンプリングを通じて原因・影響関係を識別する能動的学習手法を提案する。
この方法は、より大きな化学空間の最も多くの情報を符号化できるデータセットの最小サブセットを特定する。
その後、同定された因果関係を利用して体系的な介入を行い、モデルがこれまで遭遇していなかった化学空間における設計タスクを最適化する。
論文 参考訳(メタデータ) (2024-04-05T17:15:48Z) - Contextual Molecule Representation Learning from Chemical Reaction
Knowledge [24.501564702095937]
本稿では,共通化学における原子結合規則をうまく利用した自己教師型学習フレームワークREMOを紹介する。
REMOは、文献における170万の既知の化学反応に関するグラフ/トランスフォーマーエンコーダを事前訓練する。
論文 参考訳(メタデータ) (2024-02-21T12:58:40Z) - ChemVise: Maximizing Out-of-Distribution Chemical Detection with the
Novel Application of Zero-Shot Learning [60.02503434201552]
本研究は,簡単な学習セットから複雑な露光の学習近似を提案する。
合成センサ応答に対するこのアプローチは, 分布外の化学分析物の検出を驚くほど改善することを示した。
論文 参考訳(メタデータ) (2023-02-09T20:19:57Z) - Transfer learning for chemically accurate interatomic neural network
potentials [0.0]
密度汎関数計算から得られたデータに基づいてネットワークパラメータを事前学習することにより、より正確なab-initioデータに基づいてトレーニングされたモデルのサンプル効率が向上することを示す。
ANI-1x および ANI-1ccx データセット上で事前訓練および微調整されたGM-NN電位を提供する。
論文 参考訳(メタデータ) (2022-12-07T19:21:01Z) - Retrieval-based Controllable Molecule Generation [63.44583084888342]
制御可能な分子生成のための検索に基づく新しいフレームワークを提案する。
我々は、与えられた設計基準を満たす分子の合成に向けて、事前学習された生成モデルを操るために、分子の小さなセットを使用します。
提案手法は生成モデルの選択に非依存であり,タスク固有の微調整は不要である。
論文 参考訳(メタデータ) (2022-08-23T17:01:16Z) - Semi-Supervised Junction Tree Variational Autoencoder for Molecular
Property Prediction [0.0]
本研究では, 化学特性予測における半教師付き学習を容易にするため, 最先端分子生成法であるJT-VAEを改良した。
我々はJT-VAEアーキテクチャを活用し、分子特性予測から条件付き分子生成までのタスクに最適な解釈可能な表現を学習する。
論文 参考訳(メタデータ) (2022-08-10T03:06:58Z) - Accurate Machine Learned Quantum-Mechanical Force Fields for
Biomolecular Simulations [51.68332623405432]
分子動力学(MD)シミュレーションは、化学的および生物学的プロセスに関する原子論的な洞察を可能にする。
近年,MDシミュレーションの代替手段として機械学習力場(MLFF)が出現している。
本研究は、大規模分子シミュレーションのための正確なMLFFを構築するための一般的なアプローチを提案する。
論文 参考訳(メタデータ) (2022-05-17T13:08:28Z) - BIGDML: Towards Exact Machine Learning Force Fields for Materials [55.944221055171276]
機械学習力場(MLFF)は正確で、計算的で、データ効率が良く、分子、材料、およびそれらのインターフェースに適用できなければならない。
ここでは、Bravais-Inspired Gradient-Domain Machine Learningアプローチを導入し、わずか10-200原子のトレーニングセットを用いて、信頼性の高い力場を構築する能力を実証する。
論文 参考訳(メタデータ) (2021-06-08T10:14:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。