論文の概要: Removing Biases from Molecular Representations via Information
Maximization
- arxiv url: http://arxiv.org/abs/2312.00718v1
- Date: Fri, 1 Dec 2023 16:53:15 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-04 13:45:28.208323
- Title: Removing Biases from Molecular Representations via Information
Maximization
- Title(参考訳): 情報最大化による分子表現からのバイアスの除去
- Authors: Chenyu Wang, Sharut Gupta, Caroline Uhler, Tommi Jaakkola
- Abstract要約: InfoCOREは、COnfounder Removalがバッチ効果を扱うための情報アプローチである。
インプリートされたバッチ分布を等化するために、サンプルを適応的にリウィージする。
汎用的なフレームワークを提供し、データ公平性の一般的な分散シフトと課題を解決する。
- 参考スコア(独自算出の注目度): 16.38589836748167
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: High-throughput drug screening -- using cell imaging or gene expression
measurements as readouts of drug effect -- is a critical tool in biotechnology
to assess and understand the relationship between the chemical structure and
biological activity of a drug. Since large-scale screens have to be divided
into multiple experiments, a key difficulty is dealing with batch effects,
which can introduce systematic errors and non-biological associations in the
data. We propose InfoCORE, an Information maximization approach for COnfounder
REmoval, to effectively deal with batch effects and obtain refined molecular
representations. InfoCORE establishes a variational lower bound on the
conditional mutual information of the latent representations given a batch
identifier. It adaptively reweighs samples to equalize their implied batch
distribution. Extensive experiments on drug screening data reveal InfoCORE's
superior performance in a multitude of tasks including molecular property
prediction and molecule-phenotype retrieval. Additionally, we show results for
how InfoCORE offers a versatile framework and resolves general distribution
shifts and issues of data fairness by minimizing correlation with spurious
features or removing sensitive attributes. The code is available at
https://github.com/uhlerlab/InfoCORE.
- Abstract(参考訳): 細胞イメージングや遺伝子発現測定を薬物効果の読み出しとして用いる高スループット薬物スクリーニングは、薬物の化学構造と生物活性の関係を評価・理解するためのバイオテクノロジーの重要なツールである。
大規模なスクリーンを複数の実験に分割する必要があるため、バッチ効果に対処することが重要な課題であり、データの体系的なエラーや非生物学的関連を導入することができる。
我々は,COnfounder Removalのための情報最大化手法であるInfoCOREを提案し,バッチ効果を効果的に処理し,洗練された分子表現を得る。
InfoCOREは、バッチ識別子が与えられた潜在表現の条件付き相互情報に基づいて変動的な下界を確立する。
適応的にサンプルを改良し、含意されたバッチ分布を等化します。
薬物スクリーニングデータに対する大規模な実験は、分子特性予測や分子フェノタイプ検索を含む様々なタスクにおいてInfoCOREの優れた性能を示す。
さらに、InfoCOREが汎用的なフレームワークを提供し、突発的特徴との相関を最小化したり、機密属性を削除したりすることで、データフェアネスの一般的な分散シフトと問題を解消する結果を示す。
コードはhttps://github.com/uhlerlab/infocoreで入手できる。
関連論文リスト
- Mixed Effects Deep Learning for the interpretable analysis of single cell RNA sequencing data by quantifying and visualizing batch effects [6.596656267996196]
シングルセルRNAシークエンシング(scRNA-seq)データは、しばしば技術的または生物学的バッチ効果によって構築される。
既存のディープラーニングモデルはこれらの効果を緩和するが、バッチ固有の情報を捨てることが多い。
本稿では,バッチ不変量(固定効果)とバッチ固有量(ランダム効果)を別々にモデル化したMEDL自動エンコーダフレームワークを提案する。
論文 参考訳(メタデータ) (2024-11-11T00:10:48Z) - Unlocking Potential Binders: Multimodal Pretraining DEL-Fusion for Denoising DNA-Encoded Libraries [51.72836644350993]
マルチモーダルプレトレーニング DEL-Fusion Model (MPDF)
我々は,異なる複合表現とそれらのテキスト記述の対比対象を適用した事前学習タスクを開発する。
本稿では, 原子, 分子, 分子レベルでの複合情報をアマルガメートする新しいDEL融合フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-07T17:32:21Z) - Unlearnable Examples Detection via Iterative Filtering [84.59070204221366]
ディープニューラルネットワークは、データ中毒攻撃に弱いことが証明されている。
混合データセットから有毒なサンプルを検出することは極めて有益であり、困難である。
UE識別のための反復フィルタリング手法を提案する。
論文 参考訳(メタデータ) (2024-08-15T13:26:13Z) - Regressor-free Molecule Generation to Support Drug Response Prediction [83.25894107956735]
目標IC50スコアに基づく条件生成により、より効率的なサンプリングスペースを得ることができる。
回帰自由誘導は、拡散モデルのスコア推定と、数値ラベルに基づく回帰制御モデルの勾配を結合する。
論文 参考訳(メタデータ) (2024-05-23T13:22:17Z) - Data-Efficient Molecular Generation with Hierarchical Textual Inversion [48.816943690420224]
分子生成のための階層型テキスト変換法 (HI-Mol) を提案する。
HI-Molは分子分布を理解する上での階層的情報、例えば粗い特徴ときめ細かい特徴の重要性にインスパイアされている。
単一レベルトークン埋め込みを用いた画像領域の従来のテキストインバージョン法と比較して, マルチレベルトークン埋め込みにより, 基礎となる低ショット分子分布を効果的に学習することができる。
論文 参考訳(メタデータ) (2024-05-05T08:35:23Z) - Mitigating Molecular Aggregation in Drug Discovery with Predictive
Insights from Explainable AI [1.0499611180329804]
分子凝集の原因の理解の欠如は、凝集分子を検出するための予測ツールの開発に困難をもたらす。
本稿では, 凝集分子と非凝集分子のデータセットを識別する分子特性と, 分子凝集を予測する機械学習アプローチについて検討する。
提案手法では,解析可能なグラフニューラルネットワークとファクトファクトを使用して,アグリゲーションを確実に予測し,説明し,将来のスクリーニングのための追加の洞察と設計ルールを提供する。
論文 参考訳(メタデータ) (2023-06-03T22:30:45Z) - Drug Synergistic Combinations Predictions via Large-Scale Pre-Training
and Graph Structure Learning [82.93806087715507]
薬物併用療法は、より有効で安全性の低い疾患治療のための確立された戦略である。
ディープラーニングモデルは、シナジスティックな組み合わせを発見する効率的な方法として登場した。
我々のフレームワークは、他のディープラーニングベースの手法と比較して最先端の結果を達成する。
論文 参考訳(メタデータ) (2023-01-14T15:07:43Z) - Modular multi-source prediction of drug side-effects with DruGNN [3.229607826010618]
薬物副作用(DSE)は公衆衛生、医療システムコスト、薬物発見プロセスに高い影響を与える。
それらの発生を予測するためには、異種源からのデータを統合する必要がある。
この研究において、そのような異種データはグラフデータセットに統合され、異なるエンティティ間の関係情報を表現的に表現する。
グラフニューラルネットワーク(GNN)は、データセット上のDSEを非常に有望な結果で予測するために利用される。
論文 参考訳(メタデータ) (2022-02-15T09:41:05Z) - Improving VAE based molecular representations for compound property
prediction [0.0]
機械学習モデルの化学特性予測性能を簡易に向上する手法を提案する。
本稿では,プロパティ予測モデルの性能と,プロパティ予測データセットとより大きなラベル付きデータセットとの距離の関係を示す。
論文 参考訳(メタデータ) (2022-01-13T12:57:11Z) - MOOMIN: Deep Molecular Omics Network for Anti-Cancer Drug Combination
Therapy [2.446672595462589]
本稿では,がん治療における薬物併用の相乗効果を予測できるマルチモーダルグラフニューラルネットワークを提案する。
本モデルでは,薬物とタンパク質の相互作用ネットワークとメタデータに基づいて,薬物のコンテキストを複数スケールで表現する。
このモデルが癌細胞株の組織を広範囲にわたって高い品質で予測できることを実証した。
論文 参考訳(メタデータ) (2021-10-28T13:10:25Z) - MolTrans: Molecular Interaction Transformer for Drug Target Interaction
Prediction [68.5766865583049]
薬物標的相互作用(DTI)予測は、シリコ薬物発見の基本的な課題である。
近年、DTI予測におけるディープラーニングの進歩が期待されている。
これらの制約に対処する分子間相互作用変換器(TransMol)を提案する。
論文 参考訳(メタデータ) (2020-04-23T18:56:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。