論文の概要: Leak Proof CMap; a framework for training and evaluation of cell line agnostic L1000 similarity methods
- arxiv url: http://arxiv.org/abs/2404.18960v1
- Date: Mon, 29 Apr 2024 04:11:39 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-01 18:29:43.343249
- Title: Leak Proof CMap; a framework for training and evaluation of cell line agnostic L1000 similarity methods
- Title(参考訳): 細胞株非依存的L1000類似性の訓練と評価のためのフレームワークLeak Proof CMap
- Authors: Steven Shave, Richard Kasprowicz, Abdullah M. Athar, Denise Vlachou, Neil O. Carragher, Cuong Q. Nguyen,
- Abstract要約: Connectivity Map (CMap) は、化学および遺伝的摂動に対する細胞転写反応の大規模な公開データベースである。
我々は'Leak Proof CMap'を開発し、共通の転写学的および一般的な表現型類似性手法の集合への応用を実証した。
3つの重要なパフォーマンス領域(コンパクト性、明瞭性、ユニーク性)におけるベンチマークは、慎重に作成されたデータ分割を用いて行われる。
これにより、新規な患者由来細胞株の新規な作用様式による治療の探索に類似した、目に見えないサンプルを用いたモデルのテストが可能になる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: The Connectivity Map (CMap) is a large publicly available database of cellular transcriptomic responses to chemical and genetic perturbations built using a standardized acquisition protocol known as the L1000 technique. Databases such as CMap provide an exciting opportunity to enrich drug discovery efforts, providing a 'known' phenotypic landscape to explore and enabling the development of state of the art techniques for enhanced information extraction and better informed decisions. Whilst multiple methods for measuring phenotypic similarity and interrogating profiles have been developed, the field is severely lacking standardized benchmarks using appropriate data splitting for training and unbiased evaluation of machine learning methods. To address this, we have developed 'Leak Proof CMap' and exemplified its application to a set of common transcriptomic and generic phenotypic similarity methods along with an exemplar triplet loss-based method. Benchmarking in three critical performance areas (compactness, distinctness, and uniqueness) is conducted using carefully crafted data splits ensuring no similar cell lines or treatments with shared or closely matching responses or mechanisms of action are present in training, validation, or test sets. This enables testing of models with unseen samples akin to exploring treatments with novel modes of action in novel patient derived cell lines. With a carefully crafted benchmark and data splitting regime in place, the tooling now exists to create performant phenotypic similarity methods for use in personalized medicine (novel cell lines) and to better augment high throughput phenotypic screening technologies with the L1000 transcriptomic technology.
- Abstract(参考訳): Connectivity Map(コネクティビティマップ、CMap)は、L1000技術として知られる標準化された取得プロトコルを用いて構築された化学および遺伝的摂動に対する細胞転写応答の大規模なデータベースである。
CMapのようなデータベースは、薬物発見の努力を豊かにするためのエキサイティングな機会を提供し、"既知の"表現型景観を提供し、情報抽出とより良い情報決定のための最先端技術の開発を可能にする。
表現型類似度と尋問プロファイルを計測する複数の手法が開発されているが、機械学習手法の訓練と偏見のない評価のために適切なデータ分割を用いた標準ベンチマークが不足している。
そこで我々は'Leak Proof CMap'を開発し、典型的な三重項損失法とともに、共通の転写学的および一般的な表現型類似性手法の集合への応用を実証した。
3つの重要なパフォーマンス領域(コンパクト性、明瞭性、ユニーク性)のベンチマークは、トレーニング、検証、テストセットに類似した細胞株や、共有または密接な対応、あるいはアクションのメカニズムが存在しないことを保証したデータ分割を使用して、慎重に行われる。
これにより、新規な患者由来細胞株の新規な作用様式による治療の探索に類似した、目に見えないサンプルを用いたモデルのテストが可能になる。
慎重に作成されたベンチマークとデータ分割の仕組みにより、このツールはパーソナライズされた医療(ノーベル細胞株)で使用するための高性能な表現型類似性メソッドを作成し、L1000転写技術で高いスループットの表現型スクリーニング技術を向上するために存在する。
関連論文リスト
- Seeing Unseen: Discover Novel Biomedical Concepts via
Geometry-Constrained Probabilistic Modeling [53.7117640028211]
同定された問題を解決するために,幾何制約付き確率的モデリング処理を提案する。
構成された埋め込み空間のレイアウトに適切な制約を課すために、重要な幾何学的性質のスイートを組み込む。
スペクトルグラフ理論法は、潜在的な新規クラスの数を推定するために考案された。
論文 参考訳(メタデータ) (2024-03-02T00:56:05Z) - UniCell: Universal Cell Nucleus Classification via Prompt Learning [76.11864242047074]
ユニバーサル細胞核分類フレームワーク(UniCell)を提案する。
異なるデータセットドメインから対応する病理画像のカテゴリを均一に予測するために、新しいプロンプト学習機構を採用している。
特に,本フレームワークでは,原子核検出と分類のためのエンドツーエンドアーキテクチャを採用し,フレキシブルな予測ヘッドを用いて様々なデータセットを適応する。
論文 参考訳(メタデータ) (2024-02-20T11:50:27Z) - Multiscale Topology in Interactomic Network: From Transcriptome to
Antiaddiction Drug Repurposing [0.3683202928838613]
米国における薬物依存の激化は、革新的な治療戦略の緊急の必要性を浮き彫りにしている。
本研究は,オピオイドおよびコカイン依存症治療の薬物再服用候補を探索するための,革新的で厳格な戦略に着手した。
論文 参考訳(メタデータ) (2023-12-03T04:01:38Z) - Current Methods for Drug Property Prediction in the Real World [9.061842820405486]
薬物特性の予測は、高価な臨床試験の前に資産の破壊を可能にするために、薬物発見の鍵となる。
異なる論文が異なるデータセットやメソッドをベンチマークしているため、どの方法やアプローチが最も適しているかは、実践者にとって依然として不明である。
私たちの大規模な経験的研究は、さまざまなデータセットや手法に関する多くの初期の研究を結び付けています。
最良の方法はデータセットに依存しており、古典的なMLメソッドで構築された機能は、ディープラーニングよりも優れていることが分かりました。
論文 参考訳(メタデータ) (2023-07-25T17:50:05Z) - Drug Synergistic Combinations Predictions via Large-Scale Pre-Training
and Graph Structure Learning [82.93806087715507]
薬物併用療法は、より有効で安全性の低い疾患治療のための確立された戦略である。
ディープラーニングモデルは、シナジスティックな組み合わせを発見する効率的な方法として登場した。
我々のフレームワークは、他のディープラーニングベースの手法と比較して最先端の結果を達成する。
論文 参考訳(メタデータ) (2023-01-14T15:07:43Z) - Anchoring to Exemplars for Training Mixture-of-Expert Cell Embeddings [15.964908790433855]
そこで本研究では,トレーニングセットの技術的な変化を捉えた専門家の集合を学習し,テスト時に専門家の予測を集約する埋め込み学習アプローチを提案する。
我々は,薬物発見,細胞治療の真の作用機序の同定における性能の向上など,3つの課題に対するアプローチを5.5-11%の精度で評価した。
論文 参考訳(メタデータ) (2021-12-06T18:05:49Z) - Towards an Automatic Analysis of CHO-K1 Suspension Growth in
Microfluidic Single-cell Cultivation [63.94623495501023]
我々は、人間の力で抽象化されたニューラルネットワークをデータレベルで注入できる新しい機械学習アーキテクチャを提案する。
具体的には、自然データと合成データに基づいて生成モデルを同時に訓練し、細胞数などの対象変数を確実に推定できる共有表現を学習する。
論文 参考訳(メタデータ) (2020-10-20T08:36:51Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - Siloed Federated Learning for Multi-Centric Histopathology Datasets [0.17842332554022694]
本稿では,医学領域における深層学習アーキテクチャのための新しいフェデレーション学習手法を提案する。
局所統計バッチ正規化(BN)層が導入され、協調的に訓練されるが中心に固有のモデルが作られる。
本研究では,Camelyon16およびCamelyon17データセットから抽出した腫瘍組織像の分類法についてベンチマークを行った。
論文 参考訳(メタデータ) (2020-08-17T15:49:30Z) - Semi-supervised Medical Image Classification with Relation-driven
Self-ensembling Model [71.80319052891817]
医用画像分類のための関係駆動型半教師付きフレームワークを提案する。
これは、摂動下で与えられた入力の予測一貫性を促進することでラベルのないデータを利用する。
本手法は,シングルラベルおよびマルチラベル画像分類のシナリオにおいて,最先端の半教師付き学習手法よりも優れる。
論文 参考訳(メタデータ) (2020-05-15T06:57:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。