論文の概要: Efficient Imputation for Patch-based Missing Single-cell Data via Cluster-regularized Optimal Transport
- arxiv url: http://arxiv.org/abs/2601.14653v1
- Date: Wed, 21 Jan 2026 04:58:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-22 21:27:50.236793
- Title: Efficient Imputation for Patch-based Missing Single-cell Data via Cluster-regularized Optimal Transport
- Title(参考訳): クラスタ正規化最適輸送によるパッチベース単一セルデータの効率的な計算法
- Authors: Yuyu Liu, Jiannan Yang, Ziyang Yu, Weishen Pan, Fei Wang, Tengfei Ma,
- Abstract要約: 我々は、パッチベースの欠落データを扱うために設計された最適なトランスポートベースの計算アルゴリズムCROTを提案する。
提案手法は,その基盤となるデータ構造を,重要な欠落の存在下で効果的に捉えるものである。
この研究は、構造化データの欠如を伴う不均一で高次元のデータセットにおいて、計算の堅牢な解を導入する。
- 参考スコア(独自算出の注目度): 11.748577799315191
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Missing data in single-cell sequencing datasets poses significant challenges for extracting meaningful biological insights. However, existing imputation approaches, which often assume uniformity and data completeness, struggle to address cases with large patches of missing data. In this paper, we present CROT, an optimal transport-based imputation algorithm designed to handle patch-based missing data in tabular formats. Our approach effectively captures the underlying data structure in the presence of significant missingness. Notably, it achieves superior imputation accuracy while significantly reducing runtime, demonstrating its scalability and efficiency for large-scale datasets. This work introduces a robust solution for imputation in heterogeneous, high-dimensional datasets with structured data absence, addressing critical challenges in both biological and clinical data analysis. Our code is available at Anomalous Github.
- Abstract(参考訳): 単一セルシークエンシングデータセットにおけるデータの欠落は、有意義な生物学的洞察を抽出する上で重要な課題となる。
しかし、統一性とデータの完全性を前提とする既存の計算手法は、欠落したデータの大きなパッチで問題に対処するのに苦労する。
本稿では,パッチベースの欠落データを表形式で処理するための最適トランスポートベース計算アルゴリズムであるCROTを提案する。
提案手法は,その基盤となるデータ構造を,重要な欠落の存在下で効果的に捉えるものである。
特に、大規模なデータセットのスケーラビリティと効率性を実証しながら、実行時間を著しく削減しながら、優れた計算精度を実現している。
この研究は、構造的データ欠如を伴う不均一で高次元のデータセットにおける計算の堅牢な解を導入し、生物学的および臨床的データ解析において重要な課題に対処する。
私たちのコードはAnomalous Githubで公開されている。
関連論文リスト
- Kernel Representation and Similarity Measure for Incomplete Data [55.62595187178638]
不完全データの類似性を測定することは、Webマイニング、レコメンデーションシステム、ユーザー行動分析において基本的な課題である。
従来のアプローチでは、不完全なデータを破棄するか、事前処理のステップとして計算を実行するかのいずれかであり、情報損失と類似性のバイアスが生じる。
本稿では,カーネルの特徴空間における不完全データ間の類似性を,元の空間における明示的な計算なしで直接計算する,新しい類似度尺度を提案する。
論文 参考訳(メタデータ) (2025-10-15T09:41:23Z) - Precision Adaptive Imputation Network : An Unified Technique for Mixed Datasets [0.0]
本研究では,データ再構成の高速化を目的とした新しいアルゴリズムである精度適応型インダクタンスネットワーク(PAIN)を紹介する。
PAINは統計手法、ランダム森林、オートエンコーダを統合する三段階プロセスを採用し、計算精度と効率のバランスを確保する。
この結果は、特に欠如が完全にランダムではない複雑なシナリオにおいて、データ分散を保存し、分析的整合性を維持するPAINの優れた能力を浮き彫りにしている。
論文 参考訳(メタデータ) (2025-01-18T06:22:27Z) - Missing Data Imputation With Granular Semantics and AI-driven Pipeline for Bankruptcy Prediction [0.34530027457862006]
この研究は、倒産予測のためのパイプラインの設計に焦点を当てている。
欠落した値、高次元データ、高クラス不均衡データベースの存在は、そのタスクにおける大きな課題である。
粒度のセマンティクスを付加した新しいデータ計算法が導入された。
論文 参考訳(メタデータ) (2024-03-15T13:01:09Z) - Optimal Transport for Structure Learning Under Missing Data [31.240965564055138]
そこで本稿では,最適なトランスポートに基づくデータから因果構造を学習するためのスコアベースアルゴリズムを提案する。
我々のフレームワークは,ほとんどのシミュレーションや実データ設定において競合する手法よりも,真の因果構造を効果的に回復することが示されている。
論文 参考訳(メタデータ) (2024-02-23T10:49:04Z) - Minimally Supervised Learning using Topological Projections in
Self-Organizing Maps [55.31182147885694]
自己組織化マップ(SOM)におけるトポロジカルプロジェクションに基づく半教師付き学習手法を提案する。
提案手法は,まずラベル付きデータ上でSOMを訓練し,最小限のラベル付きデータポイントをキーベストマッチングユニット(BMU)に割り当てる。
提案した最小教師付きモデルが従来の回帰手法を大幅に上回ることを示す。
論文 参考訳(メタデータ) (2024-01-12T22:51:48Z) - Boosting Differentiable Causal Discovery via Adaptive Sample Reweighting [62.23057729112182]
異なるスコアに基づく因果探索法は観測データから有向非巡回グラフを学習する。
本稿では,Reweighted Score関数ReScoreの適応重みを動的に学習することにより因果発見性能を向上させるためのモデルに依存しないフレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-06T14:49:59Z) - Chains of Autoreplicative Random Forests for missing value imputation in
high-dimensional datasets [1.5076964620370268]
データサイエンスと機械学習では、欠落値が一般的な問題である。
我々は,多ラベル分類問題として価値計算の欠落を考慮し,自己複製的ランダム林の連鎖を提案する。
提案アルゴリズムは,データセットの情報のみに基づいて,欠落した値を効果的に解釈する。
論文 参考訳(メタデータ) (2023-01-02T10:53:52Z) - MIRACLE: Causally-Aware Imputation via Learning Missing Data Mechanisms [82.90843777097606]
欠落データに対する因果認識型計算アルゴリズム(MIRACLE)を提案する。
MIRACLEは、欠落発生機構を同時にモデル化することにより、ベースラインの計算を反復的に洗練する。
我々は、MIRACLEが一貫してイミューテーションを改善することができることを示すために、合成および様々な公開データセットに関する広範な実験を行う。
論文 参考訳(メタデータ) (2021-11-04T22:38:18Z) - Sparse PCA via $l_{2,p}$-Norm Regularization for Unsupervised Feature
Selection [138.97647716793333]
再構成誤差を$l_2,p$ノルム正規化と組み合わせることで,単純かつ効率的な特徴選択手法を提案する。
提案する非教師付きモデルを解くための効率的な最適化アルゴリズムを提案し,アルゴリズムの収束と計算の複雑さを理論的に解析する。
論文 参考訳(メタデータ) (2020-12-29T04:08:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。