論文の概要: Statistical-Neural Interaction Networks for Interpretable Mixed-Type Data Imputation
- arxiv url: http://arxiv.org/abs/2601.12380v1
- Date: Sun, 18 Jan 2026 12:18:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-21 22:47:22.606259
- Title: Statistical-Neural Interaction Networks for Interpretable Mixed-Type Data Imputation
- Title(参考訳): 解釈可能な混合型データインプットのための統計的・ニューラル相互作用ネットワーク
- Authors: Ou Deng, Shoji Nishimura, Atsushi Ogihara, Qun Jin,
- Abstract要約: 本稿では,相関に基づく統計的先行情報とニューラル特徴量とを結合した混合型計算手法を提案する。
ICUモニタリング,人口調査,社会経済統計,工学的応用を対象とする6つのデータセットからSNIを評価する。
- 参考スコア(独自算出の注目度): 3.362526994670267
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Real-world tabular databases routinely combine continuous measurements and categorical records, yet missing entries are pervasive and can distort downstream analysis. We propose Statistical-Neural Interaction (SNI), an interpretable mixed-type imputation framework that couples correlation-derived statistical priors with neural feature attention through a Controllable-Prior Feature Attention (CPFA) module. CPFA learns head-wise prior-strength coefficients $\{λ_h\}$ that softly regularize attention toward the prior while allowing data-driven deviations when nonlinear patterns appear to be present in the data. Beyond imputation, SNI aggregates attention maps into a directed feature-dependency matrix that summarizes which variables the imputer relied on, without requiring post-hoc explainers. We evaluate SNI against six baselines (Mean/Mode, MICE, KNN, MissForest, GAIN, MIWAE) on six datasets spanning ICU monitoring, population surveys, socio-economic statistics, and engineering applications. Under MCAR/strict-MAR at 30\% missingness, SNI is generally competitive on continuous metrics but is often outperformed by accuracy-first baselines (MissForest, MIWAE) on categorical variables; in return, it provides intrinsic dependency diagnostics and explicit statistical-neural trade-off parameters. We additionally report MNAR stress tests (with a mask-aware variant) and discuss computational cost, limitations -- particularly for severely imbalanced categorical targets -- and deployment scenarios where interpretability may justify the trade-off.
- Abstract(参考訳): 実世界の表型データベースは、常に連続測定と分類レコードを組み合わせているが、欠落したエントリは広範に広がり、下流の分析を歪ませることができる。
本稿では,相関に基づく統計的先行とニューラル特徴の注意を結合した解釈可能な混合型計算フレームワークである統計的-ニューラル相互作用(SNI)について,制御可能-プライア・フィーチャー・アテンション(CPFA)モジュールを用いて提案する。
CPFAは、データ中に非線形パターンが存在するように見える場合に、データ駆動の偏差を許容しながら、前者に対する注意をソフトに規則化する、頭回りの事前強度係数$\{λ_h\}$を学習する。
インプット以外にも、SNIはアテンションマップを、ポストホックな説明を必要とせずに、インプットが依存する変数をまとめた有向的特徴依存行列に集約する。
ICUモニタリング,人口調査,社会経済統計,工学的応用を対象とし,SNIを6つのベースライン(Mean/Mode,MICE,KNN,MissForest,GAIN,MIWAE)に対して評価した。
SNIは、MCAR/strict-MARの30倍の欠落率で、一般的には連続的なメトリクスで競合するが、カテゴリ変数の精度優先のベースライン(MissForest、MIWAE)によりパフォーマンスが向上する。
さらに、MNARストレステスト(マスク対応の亜種)を報告し、計算コスト、特に極めて不均衡なカテゴリ目標に対する制限、解釈可能性がトレードオフを正当化するデプロイメントシナリオについて議論します。
関連論文リスト
- Revisiting Multivariate Time Series Forecasting with Missing Values [65.30332997607141]
現実の時系列では欠落値が一般的である。
現在のアプローチでは、計算モジュールを使用して、不足した値を補う、計算済みの予測フレームワークが開発されている。
このフレームワークは、致命的な問題を見落としている: 欠落した値に対して基礎的な真理は存在せず、予測精度を劣化させる可能性のあるエラーの影響を受けやすいようにしている。
本稿では,Information Bottleneck原則に基づく新しいフレームワークであるConsistency-Regularized Information Bottleneck(CRIB)を紹介する。
論文 参考訳(メタデータ) (2025-09-27T20:57:48Z) - Causally Fair Node Classification on Non-IID Graph Data [9.363036392218435]
本稿では,フェアネスを考慮したMLアルゴリズムにおける課題について述べる。
非IID、グラフベースの設定の見落としている領域に取り組みます。
因果推論のためのメッセージパッシング変分オートエンコーダを開発した。
論文 参考訳(メタデータ) (2025-05-03T02:05:51Z) - Correctness Coverage Evaluation for Medical Multiple-Choice Question Answering Based on the Enhanced Conformal Prediction Framework [2.9599960287815144]
大規模言語モデル(LLM)は、医療質問応答(QA)のシナリオでますます採用されている。
LLMは幻覚や非現実的な情報を生成でき、高い医療業務における信頼性を損なう。
本稿では,医療用マルチ選択質問応答タスクのための拡張型コンフォーマル予測フレームワークを提案する。
論文 参考訳(メタデータ) (2025-03-07T15:22:10Z) - Robust Simulation-Based Inference under Missing Data via Neural Processes [6.32765579505162]
我々は,SBIにおける欠落データの問題を定式化し,本手法がSBI後部推定にバイアスをもたらすことを示す。
また,神経後部推定フレームワークにおいて,計算モデルと推論ネットワークを共同で学習することにより,この問題に対処する新しい補正手法を提案する。
論文 参考訳(メタデータ) (2025-03-03T08:22:01Z) - Meta-Statistical Learning: Supervised Learning of Statistical Inference [59.463430294611626]
この研究は、大きな言語モデル(LLM)の成功を駆動するツールと原則が、分散レベルのタスクに取り組むために再利用可能であることを実証している。
本稿では,統計的推論タスクを教師付き学習問題として再構成するマルチインスタンス学習に触発されたメタ統計学習を提案する。
論文 参考訳(メタデータ) (2025-02-17T18:04:39Z) - Measuring and Improving Attentiveness to Partial Inputs with Counterfactuals [91.59906995214209]
我々は,新しい評価手法であるCAT(Facterfactual Attentiveness Test)を提案する。
CATは、入力の一部を別の例から別の例に置き換えることで、予測を変更する注意深いモデルを期待することで、反事実を使用する。
実験データの精度が向上する一方, GPT3 は実演回数の増加により注意力の低下がみられた。
論文 参考訳(メタデータ) (2023-11-16T06:27:35Z) - Conditional Feature Importance for Mixed Data [1.6114012813668934]
ノックオフサンプリングを用いた条件付き予測インパクト(CPI)フレームワークを開発した。
提案するワークフローは,I型エラーを制御し,高い出力を達成し,他の条件FI測定結果と一致していることを示す。
本研究は,混合データに対して,統計的に適切な,専門的な手法を開発することの必要性を強調した。
論文 参考訳(メタデータ) (2022-10-06T16:52:38Z) - Interpretable Additive Recurrent Neural Networks For Multivariate
Clinical Time Series [4.125698836261585]
本稿では,モデル内の変数間の関係を加法的に強制することで,モデルの複雑性と精度のバランスをとるInterpretable-RNN(I-RNN)を提案する。
I-RNNは、時間内に不均一にサンプリングされ、非同期に取得され、データが欠落している臨床時系列の特徴を特に捉えている。
本研究は,院内死亡率予測のためのPhysoronet 2012 ChallengeデータセットのI-RNNモデルと,集中治療室における血行動態の介入を予測するリアルな臨床診断支援タスクについて評価する。
論文 参考訳(メタデータ) (2021-09-15T22:30:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。