論文の概要: Removing Biases from Molecular Representations via Information
Maximization
- arxiv url: http://arxiv.org/abs/2312.00718v1
- Date: Fri, 1 Dec 2023 16:53:15 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-04 13:45:28.208323
- Title: Removing Biases from Molecular Representations via Information
Maximization
- Title(参考訳): 情報最大化による分子表現からのバイアスの除去
- Authors: Chenyu Wang, Sharut Gupta, Caroline Uhler, Tommi Jaakkola
- Abstract要約: InfoCOREは、COnfounder Removalがバッチ効果を扱うための情報アプローチである。
インプリートされたバッチ分布を等化するために、サンプルを適応的にリウィージする。
汎用的なフレームワークを提供し、データ公平性の一般的な分散シフトと課題を解決する。
- 参考スコア(独自算出の注目度): 16.38589836748167
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: High-throughput drug screening -- using cell imaging or gene expression
measurements as readouts of drug effect -- is a critical tool in biotechnology
to assess and understand the relationship between the chemical structure and
biological activity of a drug. Since large-scale screens have to be divided
into multiple experiments, a key difficulty is dealing with batch effects,
which can introduce systematic errors and non-biological associations in the
data. We propose InfoCORE, an Information maximization approach for COnfounder
REmoval, to effectively deal with batch effects and obtain refined molecular
representations. InfoCORE establishes a variational lower bound on the
conditional mutual information of the latent representations given a batch
identifier. It adaptively reweighs samples to equalize their implied batch
distribution. Extensive experiments on drug screening data reveal InfoCORE's
superior performance in a multitude of tasks including molecular property
prediction and molecule-phenotype retrieval. Additionally, we show results for
how InfoCORE offers a versatile framework and resolves general distribution
shifts and issues of data fairness by minimizing correlation with spurious
features or removing sensitive attributes. The code is available at
https://github.com/uhlerlab/InfoCORE.
- Abstract(参考訳): 細胞イメージングや遺伝子発現測定を薬物効果の読み出しとして用いる高スループット薬物スクリーニングは、薬物の化学構造と生物活性の関係を評価・理解するためのバイオテクノロジーの重要なツールである。
大規模なスクリーンを複数の実験に分割する必要があるため、バッチ効果に対処することが重要な課題であり、データの体系的なエラーや非生物学的関連を導入することができる。
我々は,COnfounder Removalのための情報最大化手法であるInfoCOREを提案し,バッチ効果を効果的に処理し,洗練された分子表現を得る。
InfoCOREは、バッチ識別子が与えられた潜在表現の条件付き相互情報に基づいて変動的な下界を確立する。
適応的にサンプルを改良し、含意されたバッチ分布を等化します。
薬物スクリーニングデータに対する大規模な実験は、分子特性予測や分子フェノタイプ検索を含む様々なタスクにおいてInfoCOREの優れた性能を示す。
さらに、InfoCOREが汎用的なフレームワークを提供し、突発的特徴との相関を最小化したり、機密属性を削除したりすることで、データフェアネスの一般的な分散シフトと問題を解消する結果を示す。
コードはhttps://github.com/uhlerlab/infocoreで入手できる。
関連論文リスト
- Learning Invariant Molecular Representation in Latent Discrete Space [52.13724532622099]
本稿では,分散シフトに対する不変性とロバスト性を示す分子表現を学習するための新しい枠組みを提案する。
我々のモデルは、様々な分布シフトが存在する場合に、最先端のベースラインに対してより強力な一般化を実現する。
論文 参考訳(メタデータ) (2023-10-22T04:06:44Z) - Self-Supervised Neuron Segmentation with Multi-Agent Reinforcement
Learning [53.00683059396803]
マスク画像モデル(MIM)は,マスク画像から元の情報を復元する簡便さと有効性から広く利用されている。
本稿では、強化学習(RL)を利用して最適な画像マスキング比とマスキング戦略を自動検索する決定に基づくMIMを提案する。
本手法は,ニューロン分節の課題において,代替自己監督法に対して有意な優位性を有する。
論文 参考訳(メタデータ) (2023-10-06T10:40:46Z) - Multi-objective Molecular Optimization for Opioid Use Disorder Treatment
Using Generative Network Complex [5.33208055504216]
オピオイド・ユース障害(OUD)が世界的な健康問題として浮上している。
本研究では,微分方程式(SDE)に基づく拡散モデルと事前学習された自己エンコーダモデルの潜在空間を結合した深部生成モデルを提案する。
分子発生器は、複数の標的に有効である分子の効率的な生成を可能にする。
論文 参考訳(メタデータ) (2023-06-13T01:12:31Z) - Mitigating Molecular Aggregation in Drug Discovery with Predictive
Insights from Explainable AI [1.0499611180329804]
分子凝集の原因の理解の欠如は、凝集分子を検出するための予測ツールの開発に困難をもたらす。
本稿では, 凝集分子と非凝集分子のデータセットを識別する分子特性と, 分子凝集を予測する機械学習アプローチについて検討する。
提案手法では,解析可能なグラフニューラルネットワークとファクトファクトを使用して,アグリゲーションを確実に予測し,説明し,将来のスクリーニングのための追加の洞察と設計ルールを提供する。
論文 参考訳(メタデータ) (2023-06-03T22:30:45Z) - Drug Synergistic Combinations Predictions via Large-Scale Pre-Training
and Graph Structure Learning [82.93806087715507]
薬物併用療法は、より有効で安全性の低い疾患治療のための確立された戦略である。
ディープラーニングモデルは、シナジスティックな組み合わせを発見する効率的な方法として登場した。
我々のフレームワークは、他のディープラーニングベースの手法と比較して最先端の結果を達成する。
論文 参考訳(メタデータ) (2023-01-14T15:07:43Z) - Differentiable Agent-based Epidemiology [71.81552021144589]
GradABM(GradABM)は、エージェントベースのモデリングのためのスケーラブルで微分可能な設計で、勾配に基づく学習と自動微分が可能である。
GradABMは、コモディティハードウェア上で数秒で数百万の人口をシミュレートし、ディープニューラルネットワークと統合し、異種データソースを取り込みます。
論文 参考訳(メタデータ) (2022-07-20T07:32:02Z) - Modular multi-source prediction of drug side-effects with DruGNN [3.229607826010618]
薬物副作用(DSE)は公衆衛生、医療システムコスト、薬物発見プロセスに高い影響を与える。
それらの発生を予測するためには、異種源からのデータを統合する必要がある。
この研究において、そのような異種データはグラフデータセットに統合され、異なるエンティティ間の関係情報を表現的に表現する。
グラフニューラルネットワーク(GNN)は、データセット上のDSEを非常に有望な結果で予測するために利用される。
論文 参考訳(メタデータ) (2022-02-15T09:41:05Z) - Improving VAE based molecular representations for compound property
prediction [0.0]
機械学習モデルの化学特性予測性能を簡易に向上する手法を提案する。
本稿では,プロパティ予測モデルの性能と,プロパティ予測データセットとより大きなラベル付きデータセットとの距離の関係を示す。
論文 参考訳(メタデータ) (2022-01-13T12:57:11Z) - MOOMIN: Deep Molecular Omics Network for Anti-Cancer Drug Combination
Therapy [2.446672595462589]
本稿では,がん治療における薬物併用の相乗効果を予測できるマルチモーダルグラフニューラルネットワークを提案する。
本モデルでは,薬物とタンパク質の相互作用ネットワークとメタデータに基づいて,薬物のコンテキストを複数スケールで表現する。
このモデルが癌細胞株の組織を広範囲にわたって高い品質で予測できることを実証した。
論文 参考訳(メタデータ) (2021-10-28T13:10:25Z) - ASGN: An Active Semi-supervised Graph Neural Network for Molecular
Property Prediction [61.33144688400446]
本稿では,ラベル付き分子とラベルなし分子の両方を組み込んだ,アクティブ半教師付きグラフニューラルネットワーク(ASGN)を提案する。
教師モデルでは,分子構造や分子分布から情報を共同で活用する汎用表現を学習するための,新しい半教師付き学習手法を提案する。
最後に,分子多様性の観点から,フレームワーク学習全体を通して情報的データを選択するための新しい能動的学習戦略を提案する。
論文 参考訳(メタデータ) (2020-07-07T04:22:39Z) - MolTrans: Molecular Interaction Transformer for Drug Target Interaction
Prediction [68.5766865583049]
薬物標的相互作用(DTI)予測は、シリコ薬物発見の基本的な課題である。
近年、DTI予測におけるディープラーニングの進歩が期待されている。
これらの制約に対処する分子間相互作用変換器(TransMol)を提案する。
論文 参考訳(メタデータ) (2020-04-23T18:56:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。