論文の概要: A Cross Modal Knowledge Distillation & Data Augmentation Recipe for Improving Transcriptomics Representations through Morphological Features
- arxiv url: http://arxiv.org/abs/2505.21317v1
- Date: Tue, 27 May 2025 15:15:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-28 17:05:58.745229
- Title: A Cross Modal Knowledge Distillation & Data Augmentation Recipe for Improving Transcriptomics Representations through Morphological Features
- Title(参考訳): 形態的特徴によるトランスクリプトークス表現改善のためのクロスモーダル知識蒸留とデータ拡張
- Authors: Ihab Bendidi, Yassir El Mesbahi, Alisandra K. Denton, Karush Suri, Kian Kenyon-Dean, Auguste Genovesio, Emmanuel Noutahi,
- Abstract要約: 本稿では,顕微鏡画像から知識を抽出し,転写学を強化する枠組みを提案する。
本手法は,弱対データを用いてモダリティを調整・結合し,遺伝子発現表現と形態情報とを融合させる。
これらの戦略は予測力を向上し、転写学の解釈可能性を維持し、複雑な生物学的タスクに対する豊富な単項表現を可能にする。
- 参考スコア(独自算出の注目度): 2.240470404069435
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Understanding cellular responses to stimuli is crucial for biological discovery and drug development. Transcriptomics provides interpretable, gene-level insights, while microscopy imaging offers rich predictive features but is harder to interpret. Weakly paired datasets, where samples share biological states, enable multimodal learning but are scarce, limiting their utility for training and multimodal inference. We propose a framework to enhance transcriptomics by distilling knowledge from microscopy images. Using weakly paired data, our method aligns and binds modalities, enriching gene expression representations with morphological information. To address data scarcity, we introduce (1) Semi-Clipped, an adaptation of CLIP for cross-modal distillation using pretrained foundation models, achieving state-of-the-art results, and (2) PEA (Perturbation Embedding Augmentation), a novel augmentation technique that enhances transcriptomics data while preserving inherent biological information. These strategies improve the predictive power and retain the interpretability of transcriptomics, enabling rich unimodal representations for complex biological tasks.
- Abstract(参考訳): 刺激に対する細胞反応を理解することは、生物学的発見と薬物開発に不可欠である。
トランスクリプトミクスは、解釈可能な遺伝子レベルでの洞察を提供するが、顕微鏡画像は豊かな予測機能を提供するが、解釈しにくい。
サンプルが生物学的状態を共有している弱いペアのデータセットは、マルチモーダルな学習を可能にするが、訓練やマルチモーダルな推論のための有用性を制限している。
本稿では,顕微鏡画像から知識を抽出し,転写学を強化する枠組みを提案する。
本手法は,弱対データを用いてモダリティを整列・結合し,遺伝子発現表現と形態情報とを融合させる。
データ不足に対処するため,(1)プレトレーニングされた基礎モデルを用いたクロスモーダル蒸留のためのCLIPの適応,(2)PEA(Perturbation Embedding Augmentation)の導入,および(2)本質的な生物学的情報を保存しながら転写データを向上させる新しい拡張技術を紹介する。
これらの戦略は予測力を向上し、転写学の解釈可能性を維持し、複雑な生物学的タスクに対する豊富な単項表現を可能にする。
関連論文リスト
- Language-Enhanced Representation Learning for Single-Cell Transcriptomics [27.33236345953242]
単細胞転写学における言語強化表現学習のための新しいフレームワークである scMMGPT を提案する。
scMMGPTは、ロバストな細胞表現抽出を採用し、定量的な遺伝子発現データを保存し、革新的な2段階事前学習戦略を導入する。
論文 参考訳(メタデータ) (2025-03-12T14:26:16Z) - MVKTrans: Multi-View Knowledge Transfer for Robust Multiomics Classification [14.533025681231294]
そこで本研究では,生物内および生物間知識を適応的に伝達する多視点知識伝達学習フレームワークを提案する。
具体的には、未ラベルデータに基づいて訓練されたグラフコントラストモジュールを設計し、基礎となるオミクス内パターンを教師付きタスクに効果的に学習し、転送する。
異なる疾患および/またはサンプルにおけるモダリティの識別能力の変化を考慮して, 適応型および双方向のクロスオミクス蒸留モジュールを導入する。
論文 参考訳(メタデータ) (2024-11-13T15:45:46Z) - Causal Representation Learning from Multimodal Biomedical Observations [57.00712157758845]
バイオメディカルデータセットの理解を容易にするために,マルチモーダルデータに対するフレキシブルな識別条件と原理的手法を開発した。
主要な理論的貢献は、モジュラリティ間の因果関係の構造的空間性である。
実世界のヒト表現型データセットの結果は、確立された生物医学研究と一致している。
論文 参考訳(メタデータ) (2024-11-10T16:40:27Z) - GTP-4o: Modality-prompted Heterogeneous Graph Learning for Omni-modal Biomedical Representation [68.63955715643974]
Omnimodal Learning(GTP-4o)のためのモダリティプロンプト不均質グラフ
我々は、Omnimodal Learning(GTP-4o)のための革新的モダリティプロンプト不均質グラフを提案する。
論文 参考訳(メタデータ) (2024-07-08T01:06:13Z) - Weakly Supervised Set-Consistency Learning Improves Morphological Profiling of Single-Cell Images [0.6491172192043603]
単一セル画像における摂動効果の学習表現を改善するために,設定レベルの整合性学習アルゴリズムset-DINOを提案する。
5000以上の遺伝的摂動を伴う大規模光ポーリングスクリーニングデータセットの実験を行った。
論文 参考訳(メタデータ) (2024-06-08T00:53:30Z) - Tertiary Lymphoid Structures Generation through Graph-based Diffusion [54.37503714313661]
本研究では,最先端のグラフベース拡散モデルを用いて生物学的に意味のある細胞グラフを生成する。
本研究では, グラフ拡散モデルを用いて, 3次リンパ構造(TLS)の分布を正確に学習できることを示す。
論文 参考訳(メタデータ) (2023-10-10T14:37:17Z) - Modeling Dense Multimodal Interactions Between Biological Pathways and Histology for Survival Prediction [3.2274401541163322]
本稿では,パスとヒストロジーパッチトークン間の相互作用をモデル化できるメモリ効率の良いマルチモーダルトランスを提案する。
提案モデルであるSURVPATHは,非モーダルベースラインとマルチモーダルベースラインの両方に対して評価した場合に,最先端の性能を実現する。
論文 参考訳(メタデータ) (2023-04-13T21:02:32Z) - Learning multi-scale functional representations of proteins from
single-cell microscopy data [77.34726150561087]
局所化分類に基づいて訓練された単純な畳み込みネットワークは、多様な機能情報をカプセル化したタンパク質表現を学習できることを示す。
また,生物機能の異なるスケールでタンパク質表現の質を評価するためのロバストな評価戦略を提案する。
論文 参考訳(メタデータ) (2022-05-24T00:00:07Z) - Evolution Is All You Need: Phylogenetic Augmentation for Contrastive
Learning [1.7188280334580197]
生物配列埋め込みの自己監視型表現学習は、下流タスクにおける計算リソースの制約を緩和する。
進化的系統的増補を用いた対比学習が表現学習の目的として利用できることを示す。
論文 参考訳(メタデータ) (2020-12-25T01:35:06Z) - Towards an Automatic Analysis of CHO-K1 Suspension Growth in
Microfluidic Single-cell Cultivation [63.94623495501023]
我々は、人間の力で抽象化されたニューラルネットワークをデータレベルで注入できる新しい機械学習アーキテクチャを提案する。
具体的には、自然データと合成データに基づいて生成モデルを同時に訓練し、細胞数などの対象変数を確実に推定できる共有表現を学習する。
論文 参考訳(メタデータ) (2020-10-20T08:36:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。