論文の概要: Developing robust methods to handle missing data in real-world applications effectively
- arxiv url: http://arxiv.org/abs/2502.19635v2
- Date: Fri, 28 Feb 2025 11:26:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-03 13:41:27.343356
- Title: Developing robust methods to handle missing data in real-world applications effectively
- Title(参考訳): 現実世界のアプリケーションにおけるデータ不足を効果的に処理するためのロバストな手法の開発
- Authors: Youran Zhou, Mohamed Reda Bouadjenek, Sunil Aryal,
- Abstract要約: このPhDプロジェクトは、多種多様な欠落データメカニズムの影響を調査するために設計された総合的な研究課題を提示する。
主な目的は、MCAR、MAR、MNARメカニズムのユニークな特徴を付加しつつ、欠落したデータを効果的に処理できるロバストな方法論を考案することである。
- 参考スコア(独自算出の注目度): 2.124791625488617
- License:
- Abstract: Missing data is a pervasive challenge spanning diverse data types, including tabular, sensor data, time-series, images and so on. Its origins are multifaceted, resulting in various missing mechanisms. Prior research in this field has predominantly revolved around the assumption of the Missing Completely At Random (MCAR) mechanism. However, Missing At Random (MAR) and Missing Not At Random (MNAR) mechanisms, though equally prevalent, have often remained underexplored despite their significant influence. This PhD project presents a comprehensive research agenda designed to investigate the implications of diverse missing data mechanisms. The principal aim is to devise robust methodologies capable of effectively handling missing data while accommodating the unique characteristics of MCAR, MAR, and MNAR mechanisms. By addressing these gaps, this research contributes to an enriched understanding of the challenges posed by missing data across various industries and data modalities. It seeks to provide practical solutions that enable the effective management of missing data, empowering researchers and practitioners to leverage incomplete datasets confidently.
- Abstract(参考訳): データ不足は、表やセンサデータ、時系列、画像など、さまざまなデータタイプにまたがる広範な課題である。
起源は多面的であり、様々なメカニズムが欠落している。
この分野での以前の研究は、MCAR(Missing Completely At Random)機構の仮定を中心に、主に展開されてきた。
しかし、Missing At Random (MAR) とMissing Not At Random (MNAR) のメカニズムは、同様に普及しているが、その大きな影響にもかかわらずしばしば未発見のままである。
このPhDプロジェクトは、多種多様な欠落データメカニズムの影響を調査するために設計された総合的な研究課題を提示する。
主な目的は、MCAR、MAR、MNARメカニズムのユニークな特徴を付加しつつ、欠落したデータを効果的に処理できるロバストな方法論を考案することである。
これらのギャップに対処することにより、さまざまな産業やデータモダリティにまたがる欠落データによる課題の深い理解に寄与する。
欠落したデータの効果的な管理を可能にし、研究者や実践者が不完全なデータセットを確実に活用するための実践的なソリューションの提供を目指している。
関連論文リスト
- Precision Adaptive Imputation Network : An Unified Technique for Mixed Datasets [0.0]
本研究では,データ再構成の高速化を目的とした新しいアルゴリズムである精度適応型インダクタンスネットワーク(PAIN)を紹介する。
PAINは統計手法、ランダム森林、オートエンコーダを統合する三段階プロセスを採用し、計算精度と効率のバランスを確保する。
この結果は、特に欠如が完全にランダムではない複雑なシナリオにおいて、データ分散を保存し、分析的整合性を維持するPAINの優れた能力を浮き彫りにしている。
論文 参考訳(メタデータ) (2025-01-18T06:22:27Z) - Handling Incomplete Heterogeneous Data using a Data-Dependent Kernel [1.945017258192898]
本稿では、データ依存カーネルであるMass similarity Kernel(PMK)を用いて、欠落値を扱う新しい手法を提案する。
より意味のあるペアワイズ類似性をキャプチャすることで、多様なデータ型の表現を統一する。
分類タスクとクラスタリングタスクの両方で、我々のアプローチは既存のテクニックを一貫して上回りました。
論文 参考訳(メタデータ) (2025-01-08T06:18:32Z) - Multimodal Fusion on Low-quality Data: A Comprehensive Survey [110.22752954128738]
本稿では,野生におけるマルチモーダル核融合の共通課題と最近の進歩について考察する。
低品質データ上でのマルチモーダル融合で直面する4つの主な課題を同定する。
この新たな分類によって、研究者はフィールドの状態を理解し、いくつかの潜在的な方向を特定することができる。
論文 参考訳(メタデータ) (2024-04-27T07:22:28Z) - Review for Handling Missing Data with special missing mechanism [2.124791625488617]
データ不足はデータサイエンスにおいて大きな課題となり、意思決定プロセスや結果に影響を与えます。
Missing Completely At Random (MCAR)、Missing At Random (MAR)、Missing Not At Random (MNAR)である。
論文 参考訳(メタデータ) (2024-04-07T10:11:22Z) - Source-Free Collaborative Domain Adaptation via Multi-Perspective
Feature Enrichment for Functional MRI Analysis [55.03872260158717]
安静時MRI機能(rs-fMRI)は、神経疾患の分析を助けるために多地点で研究されている。
ソース領域とターゲット領域の間のfMRIの不均一性を低減するための多くの手法が提案されている。
しかし、マルチサイト研究における懸念やデータストレージの負担のため、ソースデータの取得は困難である。
我々は、fMRI解析のためのソースフリー協調ドメイン適応フレームワークを設計し、事前訓練されたソースモデルとラベルなしターゲットデータのみにアクセスできるようにする。
論文 参考訳(メタデータ) (2023-08-24T01:30:18Z) - Weakly Supervised Anomaly Detection: A Survey [75.26180038443462]
異常検出(AD)は、さまざまなアプリケーションによる機械学習において重要なタスクである。
弱教師付き異常検出法(WSAD)の総合的な調査を行った。
各設定に対して、正式な定義、鍵アルゴリズム、潜在的な将来の方向性を提供する。
論文 参考訳(メタデータ) (2023-02-09T10:27:21Z) - Multiple Instance Learning for Detecting Anomalies over Sequential
Real-World Datasets [2.427831679672374]
MIL(Multiple Instance Learning)は、トレーニングデータセットにおけるラベルの不完全な知識に関する問題に対して有効であることが示されている。
MILに基づく定式化と,異なる設計決定に基づいて,このフレームワークの様々なアルゴリズムのインスタンス化を提案する。
このフレームワークは、さまざまな現実世界のアプリケーションドメインから生じる多様なデータセットをうまく一般化する。
論文 参考訳(メタデータ) (2022-10-04T16:02:09Z) - Causality-Based Multivariate Time Series Anomaly Detection [63.799474860969156]
我々は、因果的観点から異常検出問題を定式化し、多変量データを生成するための通常の因果的メカニズムに従わない事例として、異常を考察する。
次に、まずデータから因果構造を学習し、次に、あるインスタンスが局所因果機構に対して異常であるかどうかを推定する因果検出手法を提案する。
我々は、実世界のAIOpsアプリケーションに関するケーススタディと同様に、シミュレートされたデータセットとパブリックなデータセットの両方を用いて、私たちのアプローチを評価します。
論文 参考訳(メタデータ) (2022-06-30T06:00:13Z) - MissDAG: Causal Discovery in the Presence of Missing Data with
Continuous Additive Noise Models [78.72682320019737]
不完全な観測データから因果発見を行うため,MissDAGと呼ばれる一般的な手法を開発した。
MissDAGは、期待-最大化の枠組みの下で観測の可視部分の期待される可能性を最大化する。
各種因果探索アルゴリズムを組み込んだMissDAGの柔軟性について,広範囲なシミュレーションと実データ実験により検証した。
論文 参考訳(メタデータ) (2022-05-27T09:59:46Z) - MIRACLE: Causally-Aware Imputation via Learning Missing Data Mechanisms [82.90843777097606]
欠落データに対する因果認識型計算アルゴリズム(MIRACLE)を提案する。
MIRACLEは、欠落発生機構を同時にモデル化することにより、ベースラインの計算を反復的に洗練する。
我々は、MIRACLEが一貫してイミューテーションを改善することができることを示すために、合成および様々な公開データセットに関する広範な実験を行う。
論文 参考訳(メタデータ) (2021-11-04T22:38:18Z) - Causal Discovery from Incomplete Data: A Deep Learning Approach [21.289342482087267]
因果構造探索と因果構造探索を反復的に行うために, 因果学習を提案する。
ICLは、異なるデータメカニズムで最先端の手法より優れていることを示す。
論文 参考訳(メタデータ) (2020-01-15T14:28:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。