論文の概要: Quantum-Inspired Optimization Process for Data Imputation
- arxiv url: http://arxiv.org/abs/2505.04841v1
- Date: Wed, 07 May 2025 22:37:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-09 21:43:49.692421
- Title: Quantum-Inspired Optimization Process for Data Imputation
- Title(参考訳): データインプットのための量子インスピレーション最適化プロセス
- Authors: Nishikanta Mohanty, Bikash K. Behera, Badsah Mukherjee, Christopher Ferrie,
- Abstract要約: 本研究は, UCI Diabetesデータセットで評価された新しい量子インスパイアされた計算フレームワークを提案する。
この手法は、主成分分析(PCA)と量子アシスト回転を統合し、勾配のない古典学を通して最適化する。
統計的忠実性を維持しながら、欠落した値を再構築する。
- 参考スコア(独自算出の注目度): 1.5186937600119894
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Data imputation is a critical step in data pre-processing, particularly for datasets with missing or unreliable values. This study introduces a novel quantum-inspired imputation framework evaluated on the UCI Diabetes dataset, which contains biologically implausible missing values across several clinical features. The method integrates Principal Component Analysis (PCA) with quantum-assisted rotations, optimized through gradient-free classical optimizers -COBYLA, Simulated Annealing, and Differential Evolution to reconstruct missing values while preserving statistical fidelity. Reconstructed values are constrained within +/-2 standard deviations of original feature distributions, avoiding unrealistic clustering around central tendencies. This approach achieves a substantial and statistically significant improvement, including an average reduction of over 85% in Wasserstein distance and Kolmogorov-Smirnov test p-values between 0.18 and 0.22, compared to p-values > 0.99 in classical methods such as Mean, KNN, and MICE. The method also eliminates zero-value artifacts and enhances the realism and variability of imputed data. By combining quantum-inspired transformations with a scalable classical framework, this methodology provides a robust solution for imputation tasks in domains such as healthcare and AI pipelines, where data quality and integrity are crucial.
- Abstract(参考訳): データ計算は、データ前処理における重要なステップであり、特に、欠落または信頼できない値を持つデータセットに対してである。
本研究は、UCI糖尿病データセットで評価された新しい量子インスピレーション・インプット・インプット・インプット(quantum-inspired imputation)フレームワークを紹介した。
この手法は、主成分分析(PCA)と量子アシスト回転を統合し、勾配のない古典最適化器(COBYLA)、シミュレート・アニーリング(Simulated Annealing)、微分進化(differial Evolution)によって最適化され、統計的忠実性を維持しながら欠落値の再構成を行う。
再構成された値は、元の特徴分布の+/-2標準偏差内で制約され、中心的傾向の非現実的なクラスタリングを避ける。
このアプローチは、平均で85%以上のワッサーシュタイン距離とコルモゴロフ=スミルノフ試験のp値が0.18から0.22の間で減少するなど、統計的に有意な改善を実現している。
また、ゼロ値アーティファクトを排除し、インプットされたデータの現実性と変動性を高める。
量子インスパイアされた変換とスケーラブルな古典的フレームワークを組み合わせることで、この方法論は、データ品質と整合性が不可欠である医療やAIパイプラインといった領域における計算タスクに対して、堅牢なソリューションを提供する。
関連論文リスト
- Enhancing Treatment Effect Estimation via Active Learning: A Counterfactual Covering Perspective [61.284843894545475]
治療効果推定のための複雑なアルゴリズムは、不十分なラベル付きトレーニングセットを扱う際には効果がない。
我々は,最適化目標をtextitFactual と textitCounterfactual Coverage Maximization に変換して,データ取得時の有効半径削減を実現するFCCMを提案する。
FCCMを他のベースラインに対してベンチマークすることは、完全に合成されたデータセットと半合成されたデータセットの両方にその優位性を示す。
論文 参考訳(メタデータ) (2025-05-08T13:42:00Z) - CALF: A Conditionally Adaptive Loss Function to Mitigate Class-Imbalanced Segmentation [0.2902243522110345]
不均衡データセットは、医学診断のためのディープラーニング(DL)モデルのトレーニングにおいて課題となる。
本稿では,DLトレーニングにおける不均衡データセットの条件を満たすために,新しい,統計的に駆動された条件適応型損失関数(CALF)を提案する。
論文 参考訳(メタデータ) (2025-04-06T12:03:33Z) - Enhanced ECG Arrhythmia Detection Accuracy by Optimizing Divergence-Based Data Fusion [5.575308369829893]
ケルネル密度推定(KDE)とクルバック・リーブラー(KL)の発散を利用した特徴量に基づく融合アルゴリズムを提案する。
健常者2000名, 病人2000名から収集した心電図による社内データセットを用いて, PTB-XLデータセットを用いて本手法の検証を行った。
その結果, 本手法は, 統合データセットにおける異常心電図症例の特徴に基づく分類精度を大幅に向上させることを示した。
論文 参考訳(メタデータ) (2025-03-19T12:16:48Z) - Learning Massive-scale Partial Correlation Networks in Clinical Multi-omics Studies with HP-ACCORD [10.459304300065186]
擬似表現に基づくグラフィカル・モデル・フレームワークを提案する。
これは高次元の仮定の下で様々な指標における推定と選択の整合性を維持する。
最大100万変数のシミュレーションデータを用いて,我々のフレームワークの高性能コンピューティング実装を検証した。
論文 参考訳(メタデータ) (2024-12-16T08:38:02Z) - Instance-based Learning with Prototype Reduction for Real-Time
Proportional Myocontrol: A Randomized User Study Demonstrating
Accuracy-preserving Data Reduction for Prosthetic Embedded Systems [0.0]
本研究は, 義肢制御におけるジェスチャー検出のためのkNNスキームに基づく学習手法の設計, 実装, 検証を行う。
8チャンネルSEMGアームバンドを用いて,パラメータ化と比例スキームの変化の影響を解析した。
論文 参考訳(メタデータ) (2023-08-21T20:15:35Z) - Boosting Differentiable Causal Discovery via Adaptive Sample Reweighting [62.23057729112182]
異なるスコアに基づく因果探索法は観測データから有向非巡回グラフを学習する。
本稿では,Reweighted Score関数ReScoreの適応重みを動的に学習することにより因果発見性能を向上させるためのモデルに依存しないフレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-06T14:49:59Z) - ClusterQ: Semantic Feature Distribution Alignment for Data-Free
Quantization [111.12063632743013]
本稿では,ClusterQと呼ばれるデータフリーな量子化手法を提案する。
意味的特徴のクラス間分離性を高めるために,特徴分布統計をクラスタ化し,整列する。
また、クラス内分散を組み込んで、クラスワイドモードの崩壊を解決する。
論文 参考訳(メタデータ) (2022-04-30T06:58:56Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - Unlabelled Data Improves Bayesian Uncertainty Calibration under
Covariate Shift [100.52588638477862]
後続正則化に基づく近似ベイズ推定法を開発した。
前立腺癌の予後モデルを世界規模で導入する上で,本手法の有用性を実証する。
論文 参考訳(メタデータ) (2020-06-26T13:50:19Z) - Instability, Computational Efficiency and Statistical Accuracy [101.32305022521024]
我々は,人口レベルでのアルゴリズムの決定論的収束率と,$n$サンプルに基づく経験的対象に適用した場合の(不安定性)の間の相互作用に基づいて,統計的精度を得るフレームワークを開発する。
本稿では,ガウス混合推定,非線形回帰モデル,情報的非応答モデルなど,いくつかの具体的なモデルに対する一般結果の応用について述べる。
論文 参考訳(メタデータ) (2020-05-22T22:30:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。