論文の概要: GenAR: Next-Scale Autoregressive Generation for Spatial Gene Expression Prediction
- arxiv url: http://arxiv.org/abs/2510.04315v1
- Date: Sun, 05 Oct 2025 18:28:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-07 16:52:59.579582
- Title: GenAR: Next-Scale Autoregressive Generation for Spatial Gene Expression Prediction
- Title(参考訳): GenAR:空間的遺伝子発現予測のための次世代自己回帰生成
- Authors: Jiarui Ouyang, Yihui Wang, Yihang Gao, Yingxue Xu, Shu Yang, Hao Chen,
- Abstract要約: GenARは、粗いものから細かいものまで予測を洗練するマルチスケールの自動回帰フレームワークである。
我々は、粗い予測から細かい予測を洗練するマルチスケール自動回帰フレームワークGenARを紹介する。
GenARは、最先端のパフォーマンスを原則として達成し、精密医療とコスト効率のよい分子プロファイリングに潜在的に影響を及ぼす可能性がある。
- 参考スコア(独自算出の注目度): 15.143858141542532
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Spatial Transcriptomics (ST) offers spatially resolved gene expression but remains costly. Predicting expression directly from widely available Hematoxylin and Eosin (H&E) stained images presents a cost-effective alternative. However, most computational approaches (i) predict each gene independently, overlooking co-expression structure, and (ii) cast the task as continuous regression despite expression being discrete counts. This mismatch can yield biologically implausible outputs and complicate downstream analyses. We introduce GenAR, a multi-scale autoregressive framework that refines predictions from coarse to fine. GenAR clusters genes into hierarchical groups to expose cross-gene dependencies, models expression as codebook-free discrete token generation to directly predict raw counts, and conditions decoding on fused histological and spatial embeddings. From an information-theoretic perspective, the discrete formulation avoids log-induced biases and the coarse-to-fine factorization aligns with a principled conditional decomposition. Extensive experimental results on four Spatial Transcriptomics datasets across different tissue types demonstrate that GenAR achieves state-of-the-art performance, offering potential implications for precision medicine and cost-effective molecular profiling. Code is publicly available at https://github.com/oyjr/genar.
- Abstract(参考訳): 空間転写学 (Spatial Transcriptomics, ST) は、空間的に解決された遺伝子発現を提供するが、コストがかかる。
広く利用可能なヘマトキシリンとエオシン(H&E)染色画像から直接の発現を予測することは、コスト効率の良い代替手段である。
しかし、ほとんどの計算的アプローチは、
(i)共同発現構造を見越して、それぞれの遺伝子を独立して予測し、
(ii) 表現が離散的な数であるにもかかわらず、タスクを連続的な回帰として配置する。
このミスマッチは生物学的に不可解な出力をもたらし、下流の分析を複雑にする。
我々は、粗い予測から細かい予測を洗練するマルチスケール自動回帰フレームワークGenARを紹介する。
GenARクラスタは階層的なグループに生成され、クロスジェネリックな依存関係を公開し、コードブックのない離散トークン生成として表現され、生数を直接予測し、融合した組織学的および空間的な埋め込みでデコードされる。
情報理論の観点からは、離散的な定式化はログ誘起バイアスを回避し、粗粒度分解は原理化された条件分解と整合する。
異なる組織タイプにまたがる4つの空間トランスクリプトミクスデータセットの大規模な実験結果から、GenARは最先端のパフォーマンスを達成し、精度医学やコスト効率の高い分子プロファイリングに潜在的に影響を及ぼすことを示した。
コードはhttps://github.com/oyjr/genar.comで公開されている。
関連論文リスト
- Modeling Gene Expression Distributional Shifts for Unseen Genetic Perturbations [44.619690829431214]
遺伝的摂動に伴う遺伝子発現の分布応答を予測するニューラルネットワークを訓練する。
本モデルでは, 摂動を条件とした遺伝子レベルのヒストグラムを予測し, 高次統計値の取得において, 基準値よりも優れていた。
論文 参考訳(メタデータ) (2025-07-01T06:04:28Z) - Unlasting: Unpaired Single-Cell Multi-Perturbation Estimation by Dual Conditional Diffusion Implicit Bridges [68.98973318553983]
本稿では,Dual Diffusion Implicit Bridges (DDIB) に基づくフレームワークを提案する。
我々は、生物学的に意味のある方法で摂動シグナルを伝達するために遺伝子制御ネットワーク(GRN)情報を統合する。
また、サイレント遺伝子を予測し、生成したプロファイルの品質を向上させるためのマスキング機構も組み込んだ。
論文 参考訳(メタデータ) (2025-06-26T09:05:38Z) - GRAPE: Heterogeneous Graph Representation Learning for Genetic Perturbation with Coding and Non-Coding Biotype [51.58774936662233]
遺伝子制御ネットワーク(GRN)の構築は、遺伝的摂動の影響を理解し予測するために不可欠である。
本研究では,事前学習した大規模言語モデルとDNAシークエンスモデルを用いて,遺伝子記述やDNAシークエンスデータから特徴を抽出する。
我々は、遺伝子摂動において初めて遺伝子バイオタイプ情報を導入し、細胞プロセスの制御において異なるバイオタイプを持つ遺伝子の異なる役割をシミュレートした。
論文 参考訳(メタデータ) (2025-05-06T03:35:24Z) - Diffusion Generative Modeling for Spatially Resolved Gene Expression Inference from Histology Images [11.64540208294516]
我々は、拡散を伴う遺伝子 $textbfE$xpression の推論で、$textbfS$pa$textbfT$ially を提示する。
$textbfStem$は、同じ遺伝子変異レベルを基底真理データとして共有する高忠実な遺伝子発現予測を生成する。
提案したパイプラインは、ゲノムの観点から、既存の、容易にアクセス可能なH&E染色組織像を解析する可能性を開放する。
論文 参考訳(メタデータ) (2025-01-26T16:52:27Z) - Semantically Rich Local Dataset Generation for Explainable AI in Genomics [0.716879432974126]
ゲノム配列に基づいて訓練されたブラックボックス深層学習モデルは、異なる遺伝子制御機構の結果を予測するのに優れている。
本稿では、遺伝的プログラミングを用いて、その意味的多様性に寄与する配列の摂動を進化させることによりデータセットを生成することを提案する。
論文 参考訳(メタデータ) (2024-07-03T10:31:30Z) - VQDNA: Unleashing the Power of Vector Quantization for Multi-Species Genomic Sequence Modeling [60.91599380893732]
VQDNAは、ゲノムボキャブラリ学習の観点からゲノムのトークン化を改良する汎用フレームワークである。
ベクトル量子化されたコードブックを学習可能な語彙として活用することにより、VQDNAはゲノムをパターン認識の埋め込みに適応的にトークン化することができる。
論文 参考訳(メタデータ) (2024-05-13T20:15:03Z) - StyleGenes: Discrete and Efficient Latent Distributions for GANs [149.0290830305808]
GAN(Generative Adversarial Networks)のための離散潜在分布を提案する。
連続的な先行点から潜在ベクトルを描く代わりに、学習可能な潜在点の有限集合からサンプリングする。
私たちは生物の情報のエンコーディングからインスピレーションを得ます。
論文 参考訳(メタデータ) (2023-04-30T23:28:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。