論文の概要: An Inclusive Foundation Model for Generalizable Cytogenetics in Precision Oncology
- arxiv url: http://arxiv.org/abs/2505.15868v1
- Date: Wed, 21 May 2025 12:03:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-23 17:12:47.8272
- Title: An Inclusive Foundation Model for Generalizable Cytogenetics in Precision Oncology
- Title(参考訳): 精度オンコロジーにおける一般化可能な細胞遺伝学の包括的基礎モデル
- Authors: Changchun Yang, Weiqian Dai, Yilan Zhang, Siyuan Chen, Jingdong Hu, Junkai Su, Yuxuan Chen, Ao Xu, Na Li, Xin Gao, Yongguo Yu,
- Abstract要約: CHROMAは、染色体異常の一般化可能な表現を学習することで、課題を克服するために設計された細胞ゲノム学の基礎モデルである。
84,000点以上の検体(400万点の染色体画像)で、自己教師による学習によって事前訓練されている。
CHROMAは、信頼性と自動化された臨床分析のためのスケーラブルで一般化可能なソリューションを提供する。
- 参考スコア(独自算出の注目度): 18.252994255843813
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Chromosome analysis is vital for diagnosing genetic disorders and guiding cancer therapy decisions through the identification of somatic clonal aberrations. However, developing an AI model are hindered by the overwhelming complexity and diversity of chromosomal abnormalities, requiring extensive annotation efforts, while automated methods remain task-specific and lack generalizability due to the scarcity of comprehensive datasets spanning diverse resource conditions. Here, we introduce CHROMA, a foundation model for cytogenomics, designed to overcome these challenges by learning generalizable representations of chromosomal abnormalities. Pre-trained on over 84,000 specimens (~4 million chromosomal images) via self-supervised learning, CHROMA outperforms other methods across all types of abnormalities, even when trained on fewer labelled data and more imbalanced datasets. By facilitating comprehensive mapping of instability and clonal leisons across various aberration types, CHROMA offers a scalable and generalizable solution for reliable and automated clinical analysis, reducing the annotation workload for experts and advancing precision oncology through the early detection of rare genomic abnormalities, enabling broad clinical AI applications and making advanced genomic analysis more accessible.
- Abstract(参考訳): 染色体解析は、遺伝子疾患の診断および体性クローン異常の同定によるがん治療決定の導出に不可欠である。
しかし、AIモデルの開発は、さまざまなリソース条件にまたがる包括的なデータセットが不足しているため、自動化された手法はタスク固有のままであり、一般化性に欠ける一方、染色体異常の圧倒的な複雑さと多様性によって妨げられている。
ここでは,細胞ゲノム学の基礎モデルであるCHROMAを紹介し,染色体異常の一般化表現を学習することでこれらの課題を克服する。
84,000点以上の検体(約400万点の染色体画像)を自己教師付き学習によって事前訓練したCHROMAは、ラベル付きデータの少ないデータとより不均衡なデータセットで訓練された場合でも、あらゆる種類の異常に対して他の方法よりも優れている。
様々な収差型の不安定性やクローンレイソンの包括的なマッピングを容易にすることで、CHROMAは信頼性と自動化された臨床分析のためのスケーラブルで一般化可能なソリューションを提供し、専門家のアノテーションの負荷を減らし、希少なゲノム異常の早期発見を通じて精度の高い腫瘍学を推し進め、幅広い臨床AI応用を可能にし、高度なゲノム解析をよりアクセスできるようにする。
関連論文リスト
- GenIAS: Generator for Instantiating Anomalies in time Series [54.959865643340535]
可変オートエンコーダを用いた時系列異常検出(TSAD)のための生成モデルを開発した。
GenIASはTSADタスクのための多種多様な現実的な合成異常を生成するように設計されている。
実験の結果,GenIASは従来型および深部異常検出モデル17より一貫して優れていた。
論文 参考訳(メタデータ) (2025-02-12T10:10:04Z) - Advancing Precision Oncology Through Modeling of Longitudinal and Multimodal Data [1.6163129903911508]
癌は、遺伝子、エピジェネティック、ミクロ環境、表現型の変化の複雑な相互作用を通じて、時間とともに継続的に進化する。
今日の腫瘍学におけるデータ駆動研究は、主に1つのモダリティのデータを用いた断面解析に焦点を当てている。
マルチスケールデータ収集および計算手法の進歩により、精度オンコロジーのための長手マルチモーダルバイオマーカーの発見が可能になった。
論文 参考訳(メタデータ) (2025-02-11T01:44:51Z) - Survey and Improvement Strategies for Gene Prioritization with Large Language Models [61.24568051916653]
大規模言語モデル (LLM) は, 医学検査において良好に機能しているが, 希少な遺伝疾患の診断における有効性は評価されていない。
表現型と可溶性レベルに基づいて, マルチエージェントとヒトフェノタイプオントロジー(HPO)を分類した。
ベースラインでは、GPT-4は他のLLMよりも優れており、因果遺伝子を正しくランク付けする際の精度は30%近く向上した。
論文 参考訳(メタデータ) (2025-01-30T23:03:03Z) - MMIL: A novel algorithm for disease associated cell type discovery [58.044870442206914]
単一細胞データセットは、しばしば個々の細胞ラベルを欠いているため、病気に関連する細胞を特定することは困難である。
セルレベルの分類器の訓練と校正を可能にする予測手法であるMixture Modeling for Multiple Learning Instance (MMIL)を導入する。
論文 参考訳(メタデータ) (2024-06-12T15:22:56Z) - Unlocking the Power of Multi-institutional Data: Integrating and Harmonizing Genomic Data Across Institutions [3.5489676012585236]
共通遺伝子を超えて情報を保存するための統合的特徴を導出するためにブリッジモデルを導入する。
このモデルは、GenIE BPCデータにおいて、6種類のがん種にわたる患者の生存を予測するのに一貫して優れている。
論文 参考訳(メタデータ) (2024-01-30T23:25:05Z) - Integrate Any Omics: Towards genome-wide data integration for patient
stratification [6.893309898200498]
IntegrAOは、不完全なマルチオミクスデータを統合し、新しいサンプルを分類するための教師なしのフレームワークである。
不均一データや不完全データを扱うIntegratedAOの能力は、精度オンコロジーに不可欠なツールである。
論文 参考訳(メタデータ) (2024-01-15T19:57:07Z) - Single-Cell Deep Clustering Method Assisted by Exogenous Gene
Information: A Novel Approach to Identifying Cell Types [50.55583697209676]
我々は,細胞間のトポロジ的特徴を効率的に捉えるために,注目度の高いグラフオートエンコーダを開発した。
クラスタリング過程において,両情報の集合を統合し,細胞と遺伝子の特徴を再構成し,識別的表現を生成する。
本研究は、細胞の特徴と分布に関する知見を高め、疾患の早期診断と治療の基礎となる。
論文 参考訳(メタデータ) (2023-11-28T09:14:55Z) - Causal machine learning for single-cell genomics [94.28105176231739]
単細胞ゲノミクスへの機械学習技術の応用とその課題について論じる。
まず, 単一細胞生物学における現在の因果的アプローチの基盤となるモデルについて述べる。
次に、単一セルデータへの因果的アプローチの適用におけるオープンな問題を特定する。
論文 参考訳(メタデータ) (2023-10-23T13:35:24Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。