論文の概要: RxRx3-core: Benchmarking drug-target interactions in High-Content Microscopy
- arxiv url: http://arxiv.org/abs/2503.20158v1
- Date: Wed, 26 Mar 2025 02:23:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-27 13:19:28.621954
- Title: RxRx3-core: Benchmarking drug-target interactions in High-Content Microscopy
- Title(参考訳): RxRx3コア:高濃度顕微鏡における薬物-標的相互作用のベンチマーク
- Authors: Oren Kraus, Federico Comitani, John Urbanik, Kian Kenyon-Dean, Lakshmanan Arumugam, Saber Saberian, Cas Wognum, Safiye Celik, Imran S. Haque,
- Abstract要約: RxRx3コアはRxRx3データセットのキュレートされ圧縮されたサブセットである。
わずか18GBのRxRx3コアは、大規模なHCSデータセットに関連するサイズバリアを大幅に削減する。
RxRx3コアは、736個のCRISPRノックアウトと1,674個の化合物を8濃度に分散した22,601枚の顕微鏡画像を含む。
- 参考スコア(独自算出の注目度): 0.2770170411104164
- License:
- Abstract: High Content Screening (HCS) microscopy datasets have transformed the ability to profile cellular responses to genetic and chemical perturbations, enabling cell-based inference of drug-target interactions (DTI). However, the adoption of representation learning methods for HCS data has been hindered by the lack of accessible datasets and robust benchmarks. To address this gap, we present RxRx3-core, a curated and compressed subset of the RxRx3 dataset, and an associated DTI benchmarking task. At just 18GB, RxRx3-core significantly reduces the size barrier associated with large-scale HCS datasets while preserving critical data necessary for benchmarking representation learning models against a zero-shot DTI prediction task. RxRx3-core includes 222,601 microscopy images spanning 736 CRISPR knockouts and 1,674 compounds at 8 concentrations. RxRx3-core is available on HuggingFace and Polaris, along with pre-trained embeddings and benchmarking code, ensuring accessibility for the research community. By providing a compact dataset and robust benchmarks, we aim to accelerate innovation in representation learning methods for HCS data and support the discovery of novel biological insights.
- Abstract(参考訳): High Content Screening (HCS) の顕微鏡データセットは、遺伝子および化学的摂動に対する細胞応答をプロファイリングする能力を変え、DTI(英語版)の細胞ベースの推論を可能にした。
しかし、HCSデータへの表現学習手法の導入は、アクセス可能なデータセットと堅牢なベンチマークの欠如によって妨げられている。
このギャップに対処するために、RxRx3コア、RxRx3データセットのキュレートおよび圧縮されたサブセット、および関連するDTIベンチマークタスクを紹介する。
わずか18GBのRxRx3コアは、大規模なHCSデータセットに関連するサイズバリアを著しく低減するとともに、ゼロショットDTI予測タスクに対する表現学習モデルのベンチマークに必要な重要なデータを保存する。
RxRx3コアは、736個のCRISPRノックアウトと1,674個の化合物を8濃度に分散した22,601枚の顕微鏡画像を含む。
RxRx3コアはHuggingFaceとPolarisで、事前トレーニングされた埋め込みとベンチマークコードとともに利用可能で、研究コミュニティのアクセシビリティを保証する。
コンパクトなデータセットとロバストなベンチマークを提供することで、HCSデータの表現学習手法の革新を加速し、新しい生物学的洞察の発見を支援することを目指している。
関連論文リスト
- A Feature-Level Ensemble Model for COVID-19 Identification in CXR Images using Choquet Integral and Differential Evolution Optimization [0.7510165488300369]
新型コロナウイルスのパンデミックを緩和するための効果的な戦略は、感染した個人を特定するための検査を統合することである。
RT-PCRは、新型コロナウイルスの診断における金の基準と考えられているが、偽陰性のリスクなどいくつかの制限がある。
本稿では,事前学習したディープ・コーン・ニューラル・ニューラルネットワーク(DCNN)をアンサンブル学習フレームワークに統合した新しいディープラーニング診断システムを提案する。
論文 参考訳(メタデータ) (2025-01-14T16:28:02Z) - SMILE-UHURA Challenge -- Small Vessel Segmentation at Mesoscopic Scale from Ultra-High Resolution 7T Magnetic Resonance Angiograms [60.35639972035727]
公開されている注釈付きデータセットの欠如は、堅牢で機械学習駆動のセグメンテーションアルゴリズムの開発を妨げている。
SMILE-UHURAチャレンジは、7T MRIで取得したTime-of-Flightアンジオグラフィーの注釈付きデータセットを提供することで、公開されている注釈付きデータセットのギャップに対処する。
Diceスコアは、それぞれのデータセットで0.838 $pm$0.066と0.716 $pm$ 0.125まで到達し、平均パフォーマンスは0.804 $pm$ 0.15までになった。
論文 参考訳(メタデータ) (2024-11-14T17:06:00Z) - Diff-CXR: Report-to-CXR generation through a disease-knowledge enhanced diffusion model [4.507437953126754]
本稿では,Diff-CXR と名づけられたDiffusion-to-CXR 学習フレームワークを提案する。
Diff-CXRは,MIMIC-CXRおよびIU-XrayのFIDおよびmAUCスコアにおいて,従来のSOTA医療TTI法を33.4%/8.0%/23.8%/56.4%で上回った。
論文 参考訳(メタデータ) (2024-10-26T12:38:12Z) - Artificial Data Point Generation in Clustered Latent Space for Small
Medical Datasets [4.542616945567623]
本稿では,クラスタ化潜在空間(AGCL)における人工データポイント生成手法を提案する。
AGCLは、合成データ生成により、小さな医療データセットの分類性能を向上させるように設計されている。
顔の表情データを利用してパーキンソン病検診に応用した。
論文 参考訳(メタデータ) (2024-09-26T09:51:08Z) - Dumpling GNN: Hybrid GNN Enables Better ADC Payload Activity Prediction Based on Chemical Structure [53.76752789814785]
DumplingGNNは、化学構造に基づいてADCペイロードのアクティビティを予測するために特別に設計された、ハイブリッドなグラフニューラルネットワークアーキテクチャである。
DNAトポイソメラーゼIインヒビターに着目した包括的ADCペイロードデータセットで評価を行った。
特別なADCペイロードデータセットに対して、例外的な精度(91.48%)、感度95.08%)、特異性(97.54%)を示す。
論文 参考訳(メタデータ) (2024-09-23T17:11:04Z) - MOTIVE: A Drug-Target Interaction Graph For Inductive Link Prediction [0.29998889086656577]
本稿では,11,000遺伝子と3,600化合物のセルペイント機能を有する形態的cOmpoundターゲット相互作用グラフであるMOTIVEについて紹介する。
我々は、現実的なユースケース下で厳密な評価を可能にするために、ランダムでコールドソース(新薬)とコールドターゲット(新遺伝子)データを分割する。
ベンチマークの結果,Cell Painting機能を用いたグラフニューラルネットワークは,グラフ構造のみから学習したニューラルネットワークよりも一貫して優れていた。
論文 参考訳(メタデータ) (2024-06-12T21:18:14Z) - Leveraging Frequency Domain Learning in 3D Vessel Segmentation [50.54833091336862]
本研究では,Fourier領域学習を3次元階層分割モデルにおけるマルチスケール畳み込みカーネルの代用として活用する。
管状血管分割作業において,新しいネットワークは顕著なサイス性能(ASACA500が84.37%,ImageCASが80.32%)を示した。
論文 参考訳(メタデータ) (2024-01-11T19:07:58Z) - Deep Mining External Imperfect Data for Chest X-ray Disease Screening [57.40329813850719]
我々は、外部のCXRデータセットを組み込むことで、不完全なトレーニングデータにつながると論じ、課題を提起する。
本研究は,多ラベル病分類問題を重み付き独立二分課題として分類する。
我々のフレームワークは、ドメインとラベルの相違を同時にモデル化し、対処し、優れた知識マイニング能力を実現する。
論文 参考訳(メタデータ) (2020-06-06T06:48:40Z) - A Systematic Approach to Featurization for Cancer Drug Sensitivity
Predictions with Deep Learning [49.86828302591469]
35,000以上のニューラルネットワークモデルをトレーニングし、一般的な成果化技術を駆使しています。
RNA-seqは128以上のサブセットであっても非常に冗長で情報的であることがわかった。
論文 参考訳(メタデータ) (2020-04-30T20:42:17Z) - AutoHR: A Strong End-to-end Baseline for Remote Heart Rate Measurement
with Neural Searching [76.4844593082362]
既存のエンド・ツー・エンドのネットワークが難易度が低い理由を考察し,アーキテクチャ・サーチ(NAS)を用いたリモートHR計測のための強力なベースラインを確立する。
総合的な実験は、時間内テストとクロスデータセットテストの両方で3つのベンチマークデータセットで実施される。
論文 参考訳(メタデータ) (2020-04-26T05:43:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。