論文の概要: MODIS: Multi-Omics Data Integration for Small and unpaired datasets
- arxiv url: http://arxiv.org/abs/2503.18856v2
- Date: Mon, 15 Sep 2025 16:29:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-16 15:23:16.021497
- Title: MODIS: Multi-Omics Data Integration for Small and unpaired datasets
- Title(参考訳): MODIS: 小規模かつ未使用のデータセットのためのマルチオミクスデータ統合
- Authors: Daniel Lepe-Soltero, Thierry Artières, Anaïs Baudot, Paul Villoutreix,
- Abstract要約: MODISはマルチオミクスデータの効率的な統合のためのフレームワークである。
クラス不均衡やデータ不足にもかかわらず、クラスラベルを利用してモダリティを調整します。
高い予測精度、限られた監督による堅牢な性能、クラス不均衡に対する安定性を示す。
- 参考スコア(独自算出の注目度): 0.6299766708197881
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: An important objective in computational biology is the efficient integration of multi-omics data. The task of integration comes with challenges: multi-omics data are most often unpaired (requiring diagonal integration), partially labeled with information about biological conditions, and in some situations such as rare diseases, only very small datasets are available. We present MODIS, a semi supervised framework designed to account for these particular challenges. To address the challenge of very small datasets, we propose to exploit information contained in larger multi-omics databases by training our model on a large reference database and a small target dataset simultaneously, effectively turning the problem of transfer learning into a problem of learning with class imbalance. MODIS performs diagonal integration on unpaired samples, leveraging class-labels to align modalities despite class imbalance and data scarcity. The architecture combines multiple variational auto-encoders, a class classifier and an adversarially trained modality classifier. To ensure training stability, we adapted a regularized relativistic GAN loss to this setting. We first validate MODIS on a synthetic dataset to assess the level of supervision needed for accurate alignment and to quantify the impact of class imbalance on predictive performance. We then apply our approach to the large public TCGA database, considering between 10 and 34 classes (cancer types and normal tissue). MODIS demonstrates high prediction accuracy, robust performance with limited supervision, and stability to class imbalance. These results position MODIS as a promising solution for challenging integration scenarios, particularly diagonal integration with a small number of samples, typical of rare diseases studies. The code is available at https://github.com/VILLOUTREIXLab/MODIS.
- Abstract(参考訳): 計算生物学の重要な目的は、マルチオミクスデータの効率的な統合である。
統合の課題には課題がある: マルチオミクスのデータは多くの場合、生物学的な状態に関する情報が部分的にラベル付けされているが、まれな疾患のような状況では、ごく小さなデータセットしか利用できない。
これらの課題を考慮に入れた半教師付きフレームワークであるMODISを提案する。
非常に小さなデータセットの課題に対処するために,大規模な参照データベースと小さなターゲットデータセットを同時にトレーニングすることで,大規模なマルチオミクスデータベースに含まれる情報を活用することを提案する。
MODISは、アンペア化されたサンプルに対して対角統合を行い、クラス不均衡やデータ不足にもかかわらず、クラスラベルを利用してモダリティを調整する。
このアーキテクチャは、複数の変分自動エンコーダ、クラス分類器、対向的に訓練されたモダリティ分類器を組み合わせる。
トレーニング安定性を確保するため,この設定に正規化相対論的GAN損失を適用した。
まず、MODISを合成データセット上で検証し、正確なアライメントに必要な監督レベルを評価し、クラス不均衡が予測性能に与える影響を定量化する。
そこで我々は,10~34のクラス(がん型と正常組織)を考慮し,大規模公共TGAデータベースにアプローチを適用した。
MODISは高い予測精度、限られた監督による堅牢な性能、クラス不均衡に対する安定性を示す。
これらの結果は、MODISを、特に稀な疾患研究の典型である少数のサンプルとの対角統合において、挑戦的な統合シナリオのための有望な解決策として位置づけている。
コードはhttps://github.com/VILLOUTREIXLab/MODISで入手できる。
関連論文リスト
- MO-CTranS: A unified multi-organ segmentation model learning from multiple heterogeneously labelled datasets [11.588991747579493]
多臓器セグメンテーションは多くの臨床業務において重要な役割を担っている。
部分的にラベル付けされたデータセットから堅牢に学習できる単一のモデルをトレーニングすることは依然として難しい。
このような問題を克服できる単一のモデルMO-CTranSを提案する。
論文 参考訳(メタデータ) (2025-03-28T16:00:59Z) - Robust Multi-View Learning via Representation Fusion of Sample-Level Attention and Alignment of Simulated Perturbation [61.64052577026623]
実世界のマルチビューデータセットは、しばしば不均一で不完全である。
本稿では,表現融合とアライメントを同時に行う新しいロバストMVL法(RML)を提案する。
我々のRMLは自己教師型であり、正規化として下流のタスクにも適用できます。
論文 参考訳(メタデータ) (2025-03-06T07:01:08Z) - Smoothing the Shift: Towards Stable Test-Time Adaptation under Complex Multimodal Noises [3.7816957214446103]
Test-Time Adaptation (TTA) は、未ラベルのテストデータを使用して、ソースデータにアクセスせずに分散シフトに取り組むことを目的としている。
既存のTTAメソッドは、突発的な分布シフトがソースモデルからの以前の知識を破壊するため、このようなマルチモーダルシナリオで失敗する。
そこで我々は,2つの新しい手法を提案する。
論文 参考訳(メタデータ) (2025-03-04T13:36:16Z) - MINIMA: Modality Invariant Image Matching [52.505282811925454]
複数のクロスモーダルケースを対象とした統合画像マッチングフレームワークであるMINIMAを提案する。
生成モデルを用いて、安価だがリッチなRGBのみのマッチングデータからモダリティをスケールアップする。
MD-synでは、任意の高度なマッチングパイプラインをランダムに選択したモダリティペアで直接訓練して、クロスモーダル能力を得ることができる。
論文 参考訳(メタデータ) (2024-12-27T02:39:50Z) - Towards Precision Healthcare: Robust Fusion of Time Series and Image Data [8.579651833717763]
本稿では,データの種類毎に2つのエンコーダを用いて,視覚情報と時間情報の両方において複雑なパターンをモデル化する手法を提案する。
また、不均衡なデータセットに対処し、不確実性損失関数を使用し、改善した結果を得る。
本手法は,臨床応用におけるマルチモーダルディープラーニングの改善に有効であることを示す。
論文 参考訳(メタデータ) (2024-05-24T11:18:13Z) - Multimodal Fusion on Low-quality Data: A Comprehensive Survey [110.22752954128738]
本稿では,野生におけるマルチモーダル核融合の共通課題と最近の進歩について考察する。
低品質データ上でのマルチモーダル融合で直面する4つの主な課題を同定する。
この新たな分類によって、研究者はフィールドの状態を理解し、いくつかの潜在的な方向を特定することができる。
論文 参考訳(メタデータ) (2024-04-27T07:22:28Z) - Multi-Modal Federated Learning for Cancer Staging over Non-IID Datasets with Unbalanced Modalities [9.476402318365446]
本研究では,データサンプルの不均一性だけでなく,機関間のデータモダリティの固有不均一性と不均一性を両立する新しいFLアーキテクチャを提案する。
マルチモーダルFLに適した分散勾配ブレンディングと近接対応クライアント重み付け戦略を考案した。
論文 参考訳(メタデータ) (2024-01-07T23:45:01Z) - Tackling Diverse Minorities in Imbalanced Classification [80.78227787608714]
不均衡データセットは、様々な現実世界のアプリケーションで一般的に見られ、分類器の訓練において重要な課題が提示されている。
マイノリティクラスとマイノリティクラスの両方のデータサンプルを混合することにより、反復的に合成サンプルを生成することを提案する。
提案するフレームワークの有効性を,7つの公開ベンチマークデータセットを用いて広範な実験により実証する。
論文 参考訳(メタデータ) (2023-08-28T18:48:34Z) - Multimodal Learning Without Labeled Multimodal Data: Guarantees and Applications [90.6849884683226]
ラベル付き単調データのみを用いた半教師付き環境における相互作用定量化の課題について検討する。
相互作用の正確な情報理論的定義を用いて、我々の重要な貢献は下界と上界の導出である。
本稿では、これらの理論結果を用いてマルチモーダルモデルの性能を推定し、データ収集をガイドし、様々なタスクに対して適切なマルチモーダルモデルを選択する方法について述べる。
論文 参考訳(メタデータ) (2023-06-07T15:44:53Z) - MMSum: A Dataset for Multimodal Summarization and Thumbnail Generation
of Videos [106.06278332186106]
マルチモーダル・アウトプット(MSMO)を用いたマルチモーダル・サマリゼーションが有望な研究方向として浮上している。
既存のパブリックMSMOデータセットには多くの制限がある。
textbfMMSumデータセットを精巧にキュレートした。
論文 参考訳(メタデータ) (2023-06-07T07:43:11Z) - Diffusion Model is an Effective Planner and Data Synthesizer for
Multi-Task Reinforcement Learning [101.66860222415512]
Multi-Task Diffusion Model (textscMTDiff) は、トランスフォーマーのバックボーンを組み込んだ拡散に基づく手法であり、生成計画とデータ合成のための素早い学習を行う。
生成計画において、textscMTDiffはMeta-World上の50のタスクとMaze2D上の8のマップで最先端のアルゴリズムより優れています。
論文 参考訳(メタデータ) (2023-05-29T05:20:38Z) - Cascaded Multi-Modal Mixing Transformers for Alzheimer's Disease
Classification with Incomplete Data [8.536869574065195]
Multi-Modal Mixing Transformer (3MAT)は、マルチモーダルデータを利用するだけでなく、欠落したデータシナリオも扱う病気分類変換器である。
本稿では、欠落したデータシナリオを扱うために、前例のないモダリティ独立性とロバスト性を確保するための新しいモダリティドロップアウト機構を提案する。
論文 参考訳(メタデータ) (2022-10-01T11:31:02Z) - AVIDA: Alternating method for Visualizing and Integrating Data [1.6637373649145604]
AVIDAはデータアライメントと次元削減を同時に行うためのフレームワークである。
AVIDAは特徴のない高次元データセットを正しく整列することを示す。
一般の応用では、アライメントおよび次元減少加群に他の方法を用いることができる。
論文 参考訳(メタデータ) (2022-05-31T22:36:10Z) - Unsupervised Person Re-Identification with Wireless Positioning under
Weak Scene Labeling [131.18390399368997]
本稿では、弱いシーンラベリングの下で、視覚データと無線位置決めトラジェクトリの両方を用いて、教師なしの人物再識別を探索することを提案する。
具体的には、視覚データと無線情報の相補性をモデル化した、新しい教師なしマルチモーダルトレーニングフレームワーク(UMTF)を提案する。
我々のUMTFには、MMDA(Multimodal Data Association Strategy)とMMGN(Multimodal Graph Neural Network)が含まれている。
論文 参考訳(メタデータ) (2021-10-29T08:25:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。