論文の概要: Federated-inspired Single-cell Batch Integration in Latent Space
- arxiv url: http://arxiv.org/abs/2602.00423v1
- Date: Sat, 31 Jan 2026 00:21:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-03 19:28:33.176098
- Title: Federated-inspired Single-cell Batch Integration in Latent Space
- Title(参考訳): 後期空間におけるフェデレートインスパイアされた単一セルバッチ統合
- Authors: Quang-Huy Nguyen, Zongliang Yue, Hao Chen, Wei-Shinn Ku, Jiaqi Wang,
- Abstract要約: セルレベルの埋め込みを精錬するためのフェデレーション学習原理にインスパイアされた,ポストホックな最適化手法である scBatchProx を紹介する。
scBatchProxは、埋め込み品質全体の約3.8%の相対的なゲインを得る。
本研究は,動的単一セルデータシステムにおける学習表現の実践的洗練に向けたステップとして,本研究を期待する。
- 参考スコア(独自算出の注目度): 16.829447270979163
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Advances in single-cell RNA sequencing enable the rapid generation of massive, high-dimensional datasets, yet the accumulation of data across experiments introduces batch effects that obscure true biological signals. Existing batch correction approaches either insufficiently correct batch effects or require centralized retraining on the complete dataset, limiting their applicability in distributed and continually evolving single-cell data settings. We introduce scBatchProx, a post-hoc optimization method inspired by federated learning principles for refining cell-level embeddings produced by arbitrary upstream methods. Treating each batch as a client, scBatchProx learns batch-conditioned adapters under proximal regularization, correcting batch structure directly in latent space without requiring raw expression data or centralized optimization. The method is lightweight and deployable, optimizing batch-specific adapter parameters only. Extensive experiments show that scBatchProx consistently yields relative gains of approximately 3-8% in overall embedding quality, with batch correction and biological conservation improving in 90% and 85% of data-method pairs, respectively. We envision this work as a step toward the practical refinement of learned representations in dynamic single-cell data systems.
- Abstract(参考訳): シングルセルRNAシークエンシングの進歩は、大規模で高次元のデータセットを迅速に生成することを可能にするが、実験全体にわたるデータの蓄積は、真の生物学的信号が見えないバッチ効果をもたらす。
既存のバッチ修正アプローチでは、バッチ効果を不十分に修正するか、完全なデータセットを集中的に再トレーニングする必要がある。
任意のアップストリーム法により生成されたセルレベルの埋め込みを精錬するためのフェデレーション学習原理に着想を得た,ポストホック最適化手法である scBatchProx を紹介する。
scBatchProxは、各バッチをクライアントとして扱うことで、近位正規化の下でバッチ条件のアダプタを学習し、生の式データや集中的な最適化を必要とせずに、潜時空間でバッチ構造を直接修正する。
メソッドは軽量でデプロイ可能で、バッチ固有のアダプタパラメータのみを最適化する。
scBatchProxは総埋め込み品質が約3~8%向上し、バッチ補正と生物保護がそれぞれ90%と85%改善した。
本研究は,動的単一セルデータシステムにおける学習表現の実践的洗練に向けたステップとして,本研究を期待する。
関連論文リスト
- Finally Outshining the Random Baseline: A Simple and Effective Solution for Active Learning in 3D Biomedical Imaging [8.59770603829962]
ClaSP PE(Class-stratified Scheduled Power Predictive Entropy)を導入する。
ClaSP PEは、標準的な不確実性に基づくアクティブラーニングメソッドの2つの重要な制限に対処する、シンプルで効果的なクエリ戦略である。
AL法が3次元セグメンテーションに適応したランダムベースラインを一貫して上回り得ることを示す。
論文 参考訳(メタデータ) (2026-01-20T07:29:50Z) - Geometric Prior-Guided Federated Prompt Calibration [21.766231067185956]
Federated Prompt Learning (FPL)は、大規模モデルを協調的にトレーニングするためのパラメータ効率の高いソリューションを提供する。
既存の手法は、アグリゲーションや正規化に重点を置いており、局所的なトレーニングバイアスの根本原因に対処できない。
我々は,このバイアスを直接修正する新しいフレームワークであるGeometry-Guided Text Prompt (GGTPC)を提案する。
論文 参考訳(メタデータ) (2025-12-08T06:42:32Z) - Optimizing Distributional Geometry Alignment with Optimal Transport for Generative Dataset Distillation [109.13471554184554]
最適輸送(OT)距離最小化問題としてデータセット蒸留を再構成する。
OTは分布マッチングのための幾何学的に忠実なフレームワークを提供する。
提案手法は, 常に最先端の手法を効率よく上回っている。
論文 参考訳(メタデータ) (2025-11-29T04:04:05Z) - Benchmarking and optimizing organism wide single-cell RNA alignment methods [0.0]
K-Neighbors Intersection (KNI) スコアは,バッチ効果をペナライズし,セル型ラベル予測の精度を計測する単一スコアである。
本稿では,逆算学習を用いて,エンコーダとデコーダのバッチ効果をペナルライズするScVIの新たな変種として,Batch Adversarial Single-cell Variational Inference (BA-scVI)を紹介した。
得られたアライメント空間では, 細胞型グルーピングの粒度が保存され, 情報を失うことなく, 有機体型マップを単一モデルで作成できるという概念が支持される。
論文 参考訳(メタデータ) (2025-03-26T17:11:47Z) - Aligning Instruction Tuning with Pre-training [61.50161961371844]
そこで我々は,AITP(Aligning Instruction Tuning with Pre-training)を提案する。
8つのベンチマークで3つの完全にオープンな大規模言語モデル(LLM)上で,AITPによる一貫したパフォーマンス向上を示す。
論文 参考訳(メタデータ) (2025-01-16T08:27:40Z) - ALoRE: Efficient Visual Adaptation via Aggregating Low Rank Experts [71.91042186338163]
ALoREは、Kroneckerによって構築された超複素パラメータ化空間をAggregate Low Rank Expertsに再利用する新しいPETL法である。
巧妙な設計のおかげで、ALoREは無視できる余分なパラメータを保持し、凍ったバックボーンに強制的にマージできる。
論文 参考訳(メタデータ) (2024-12-11T12:31:30Z) - DELT: A Simple Diversity-driven EarlyLate Training for Dataset Distillation [23.02066055996762]
本稿では,バッチ・ツー・グロバルマッチングにおける画像の多様性を高めるため,多様性駆動型早期学習(DELT)方式を提案する。
我々のアプローチは概念的には単純だが有効であり、事前に定義されたIPCサンプルを小さなサブタスクに分割し、局所的な最適化を用いる。
我々のアプローチは、異なるデータセットとIPC(クラスごとのイメージ)で平均2$sim$5%の先行技術よりも優れています。
論文 参考訳(メタデータ) (2024-11-29T18:59:46Z) - HAFLQ: Heterogeneous Adaptive Federated LoRA Fine-tuned LLM with Quantization [55.972018549438964]
LLM(Federated Fine-tuning of Pre-trained Large Language Models)は、さまざまなデータセットにまたがるタスク固有の適応を可能にすると同時に、プライバシの保護を可能にする。
本研究では, HAFLQ (Heterogeneous Adaptive Federated Low-Rank Adaptation Fine-tuned LLM with Quantization) を提案する。
テキスト分類タスクの実験結果から,HAFLQはメモリ使用量を31%削減し,通信コストを49%削減し,精度を50%向上し,ベースライン法よりも高速な収束を実現している。
論文 参考訳(メタデータ) (2024-11-10T19:59:54Z) - Data Generation in Low Sample Size Setting Using Manifold Sampling and a
Geometry-Aware VAE [0.0]
我々は,潜在空間の幾何構造に基づく2つの非アンフリープリオリ依存生成手順を考案する。
後者の手法は、サンプルサイズの小さな設定でデータ拡張を行うために使用され、様々な標準および実生活データセットで検証される。
論文 参考訳(メタデータ) (2021-03-25T11:07:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。