論文の概要: You Only Train Once: Differentiable Subset Selection for Omics Data
- arxiv url: http://arxiv.org/abs/2512.17678v1
- Date: Fri, 19 Dec 2025 15:17:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-22 19:25:54.458459
- Title: You Only Train Once: Differentiable Subset Selection for Omics Data
- Title(参考訳): 一度だけトレーニングする:Omicsデータのための差別化可能なサブセット選択
- Authors: Daphné Chopard, Jorge da Silva Gonçalves, Irene Cannistraci, Thomas M. Sutter, Julia E. Vogt,
- Abstract要約: YOTOは、独立した遺伝子サブセットを共同で識別し、単一の異なるアーキテクチャ内で予測を行うエンドツーエンドフレームワークである。
2つの代表的単一セルRNA-seqデータセット上でYOTOを評価し,最先端のベースラインを一貫して上回ることを示す。
- 参考スコア(独自算出の注目度): 16.72884554628602
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Selecting compact and informative gene subsets from single-cell transcriptomic data is essential for biomarker discovery, improving interpretability, and cost-effective profiling. However, most existing feature selection approaches either operate as multi-stage pipelines or rely on post hoc feature attribution, making selection and prediction weakly coupled. In this work, we present YOTO (you only train once), an end-to-end framework that jointly identifies discrete gene subsets and performs prediction within a single differentiable architecture. In our model, the prediction task directly guides which genes are selected, while the learned subsets, in turn, shape the predictive representation. This closed feedback loop enables the model to iteratively refine both what it selects and how it predicts during training. Unlike existing approaches, YOTO enforces sparsity so that only the selected genes contribute to inference, eliminating the need to train additional downstream classifiers. Through a multi-task learning design, the model learns shared representations across related objectives, allowing partially labeled datasets to inform one another, and discovering gene subsets that generalize across tasks without additional training steps. We evaluate YOTO on two representative single-cell RNA-seq datasets, showing that it consistently outperforms state-of-the-art baselines. These results demonstrate that sparse, end-to-end, multi-task gene subset selection improves predictive performance and yields compact and meaningful gene subsets, advancing biomarker discovery and single-cell analysis.
- Abstract(参考訳): 単一細胞転写データからコンパクトかつ情報的遺伝子のサブセットを選択することは、バイオマーカーの発見、解釈可能性の向上、コスト効率の高いプロファイリングに不可欠である。
しかし、既存のほとんどの機能選択アプローチは、マルチステージパイプラインとして動作するか、ポストホック機能属性に依存しており、選択と予測が弱い結合になっている。
本研究では,個別の遺伝子サブセットを共同で識別し,単一の識別可能なアーキテクチャ内で予測を行う,エンド・ツー・エンドのフレームワークであるYOTO(トレーニングは一度のみ)を提案する。
我々のモデルでは、予測タスクは、どの遺伝子が選択されているかを直接ガイドし、学習されたサブセットは、次に予測表現を形作る。
このクローズドなフィードバックループは、モデルが選択したものとトレーニング中の予測方法の両方を反復的に洗練することを可能にする。
既存のアプローチとは異なり、YOTOは、選択された遺伝子のみが推論に寄与するようにスパーシリティを強制し、下流の分類器を訓練する必要がなくなる。
マルチタスクの学習設計を通じて、モデルは関連する目的を越えて共有表現を学び、部分的にラベル付けされたデータセットが互いに情報を伝達し、追加のトレーニングステップなしでタスク間で一般化される遺伝子サブセットを発見する。
2つの代表的単一セルRNA-seqデータセット上でYOTOを評価し,最先端のベースラインを一貫して上回ることを示す。
これらの結果は、スパース、エンド・ツー・エンド、マルチタスク遺伝子サブセットの選択が予測性能を向上し、コンパクトで有意義な遺伝子サブセットが得られ、バイオマーカーの発見と単細胞解析が進むことを示している。
関連論文リスト
- Departures: Distributional Transport for Single-Cell Perturbation Prediction with Neural Schrödinger Bridges [51.83259180910313]
遺伝子機能解析における大きなボトルネックは、単細胞データの未成熟の性質である。
我々は、SB(Schrdinger Bridge)を近似して、単セル摂動データに対処する。
本モデルは,異種単一セル応答を効果的に捉え,最先端の性能を実現する。
論文 参考訳(メタデータ) (2025-11-17T08:27:13Z) - Unlasting: Unpaired Single-Cell Multi-Perturbation Estimation by Dual Conditional Diffusion Implicit Bridges [68.98973318553983]
本稿では,Dual Diffusion Implicit Bridges (DDIB) に基づくフレームワークを提案する。
我々は、生物学的に意味のある方法で摂動シグナルを伝達するために遺伝子制御ネットワーク(GRN)情報を統合する。
また、サイレント遺伝子を予測し、生成したプロファイルの品質を向上させるためのマスキング機構も組み込んだ。
論文 参考訳(メタデータ) (2025-06-26T09:05:38Z) - BOLIMES: Boruta and LIME optiMized fEature Selection for Gene Expression Classification [0.0937465283958018]
BOLIMESは、遺伝子発現の分類を強化するために設計された、新しい特徴選択アルゴリズムである。
包括的特徴選択と解釈可能性による洗練を組み合わせ、高次元遺伝子発現解析のための強力なソリューションを提供する。
論文 参考訳(メタデータ) (2025-02-18T17:33:41Z) - Adapt-$\infty$: Scalable Continual Multimodal Instruction Tuning via Dynamic Data Selection [89.42023974249122]
Adapt-$infty$は、生涯のインストラクションチューニングのための、新しいマルチウェイおよびアダプティブなデータ選択アプローチである。
勾配に基づくサンプルベクトルをグループ化して擬似スキルクラスタを構築する。
セレクタエキスパートのプールから各スキルクラスタの最高のパフォーマンスデータセレクタを選択する。
このデータセレクタは、トレーニングのために各スキルクラスタから最も重要なサンプルのサブセットをサンプリングする。
論文 参考訳(メタデータ) (2024-10-14T15:48:09Z) - Semantically Rich Local Dataset Generation for Explainable AI in Genomics [0.716879432974126]
ゲノム配列に基づいて訓練されたブラックボックス深層学習モデルは、異なる遺伝子制御機構の結果を予測するのに優れている。
本稿では、遺伝的プログラミングを用いて、その意味的多様性に寄与する配列の摂動を進化させることによりデータセットを生成することを提案する。
論文 参考訳(メタデータ) (2024-07-03T10:31:30Z) - Single-Cell Deep Clustering Method Assisted by Exogenous Gene
Information: A Novel Approach to Identifying Cell Types [50.55583697209676]
我々は,細胞間のトポロジ的特徴を効率的に捉えるために,注目度の高いグラフオートエンコーダを開発した。
クラスタリング過程において,両情報の集合を統合し,細胞と遺伝子の特徴を再構成し,識別的表現を生成する。
本研究は、細胞の特徴と分布に関する知見を高め、疾患の早期診断と治療の基礎となる。
論文 参考訳(メタデータ) (2023-11-28T09:14:55Z) - Composite Feature Selection using Deep Ensembles [130.72015919510605]
本研究では,事前定義されたグループ化を伴わない予測的特徴群発見の問題について検討する。
本稿では,特徴選択モデルのアンサンブルを用いて予測グループを探索する,新しいディープラーニングアーキテクチャを提案する。
発見群と基底真理の類似性を測定するための新しい尺度を提案する。
論文 参考訳(メタデータ) (2022-11-01T17:49:40Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。