論文の概要: Order-Agnostic Autoregressive Modelling with Missing Data
- arxiv url: http://arxiv.org/abs/2605.06355v1
- Date: Thu, 07 May 2026 14:34:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-08 22:27:11.909276
- Title: Order-Agnostic Autoregressive Modelling with Missing Data
- Title(参考訳): 欠測データを用いた順序非依存自己回帰モデル
- Authors: Ignacio Peis, Pablo M. Olmos, Jes Frellsen,
- Abstract要約: 本研究では,無秩序な自己回帰モデルが,無作為なランダムな機構の下で暗黙的に不規則化を行うことを示す。
一般的な欠落メカニズムの下で、不完全なデータセットを直接トレーニングするための、最初の原則付きフレームワークを紹介します。
私たちのMissingness-Aware Order-Agnostic Autoregressive Modelは、実世界のベンチマークの中で、確立された計算基準よりも一貫して優れています。
- 参考スコア(独自算出の注目度): 12.971361761803891
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Order-Agnostic autoregressive models have demonstrated strong performance in deep generative modeling, yet their use in settings with incomplete data remains largely unexplored. In this work, we reinterpret them through the lens of missing data. First, we show that their standard training procedure on fully observed data implicitly performs imputation under a missing completely at random mechanism, resulting in robust out-of-sample imputation performance in settings with high missingness. Second, we introduce the first principled framework for training them directly on incomplete datasets under general missingness mechanisms. Third, we leverage their amortized conditional density estimation to perform active information acquisition, i.e., sequentially selecting the most informative missing variables for downstream prediction or inference. Across a suite of real-world benchmarks, our Missingness-Aware Order-Agnostic Autoregressive Model (MO-ARM) consistently outperforms established imputation baselines.
- Abstract(参考訳): 順序非依存の自己回帰モデルは、深層生成モデルにおいて強い性能を示してきたが、不完全データを用いた設定では、ほとんど探索されていない。
この研究では、欠落したデータのレンズを通してそれらを再解釈する。
まず, 完全に観測されたデータに対する標準的なトレーニング手順は, ランダムな機構の欠如の下で暗黙的にインキュベーションを行い, その結果, 高精度なインキュベーション性能が得られることを示す。
第2に、一般的な欠落メカニズムの下で、不完全なデータセットを直接トレーニングするための、最初の原則付きフレームワークを紹介します。
第三に、それらのアモータイズされた条件密度推定を利用して、アクティブな情報取得、すなわち、下流の予測や推測のために最も情報に欠ける変数を逐次選択する。
私たちのMissingness-Aware Order-Agnostic Autoregressive Model(MO-ARM)は、現実世界のベンチマークスイートの中で、確立された計算ベースラインを一貫して上回ります。
関連論文リスト
- From Data to Behavior: Predicting Unintended Model Behaviors Before Training [78.37660873165284]
トレーニング前に意図しないモデルの振る舞いを予測する新しいタスクであるData2Behaviorを紹介する。
また,その平均表現を通して候補データを要約する軽量な手法として,MDF(Manipulating Data Features)を提案する。
Qwen3-14B、Qwen2.5-32B-Instruct、Gemma-3-12b-itの実験では、MDFは意図しない振る舞いを予測でき、事前訓練済みの脆弱性に関する洞察を与える。
論文 参考訳(メタデータ) (2026-02-04T16:37:17Z) - Revisiting Multivariate Time Series Forecasting with Missing Values [65.30332997607141]
現実の時系列では欠落値が一般的である。
現在のアプローチでは、計算モジュールを使用して、不足した値を補う、計算済みの予測フレームワークが開発されている。
このフレームワークは、致命的な問題を見落としている: 欠落した値に対して基礎的な真理は存在せず、予測精度を劣化させる可能性のあるエラーの影響を受けやすいようにしている。
本稿では,Information Bottleneck原則に基づく新しいフレームワークであるConsistency-Regularized Information Bottleneck(CRIB)を紹介する。
論文 参考訳(メタデータ) (2025-09-27T20:57:48Z) - Principled Input-Output-Conditioned Post-Hoc Uncertainty Estimation for Regression Networks [1.4671424999873808]
不確実性は安全性に敏感なアプリケーションでは重要であるが、予測性能に悪影響を及ぼすため、市販のニューラルネットワークから排除されることが多い。
本稿では,従来の入力と凍結モデルの両方に補助モデルを適用することにより,回帰タスクにおけるポストホック不確実性推定のための理論的基盤となるフレームワークを提案する。
論文 参考訳(メタデータ) (2025-06-01T09:13:27Z) - What Do Learning Dynamics Reveal About Generalization in LLM Reasoning? [83.83230167222852]
モデルの一般化動作は,事前記憶列車の精度と呼ばれるトレーニング指標によって効果的に特徴づけられることがわかった。
モデルの学習行動と一般化を結びつけることで、トレーニング戦略に目標とする改善を導くことができる。
論文 参考訳(メタデータ) (2024-11-12T09:52:40Z) - Imputation-Free Learning from Incomplete Observations [73.15386629370111]
本稿では,不備な値を含む入力からの推論をインプットなしでトレーニングするIGSGD法の重要性について紹介する。
バックプロパゲーションによるモデルのトレーニングに使用する勾配の調整には強化学習(RL)を用いる。
我々の計算自由予測は、最先端の計算手法を用いて従来の2段階の計算自由予測よりも優れている。
論文 参考訳(メタデータ) (2021-07-05T12:44:39Z) - Training Deep Normalizing Flow Models in Highly Incomplete Data
Scenarios with Prior Regularization [13.985534521589257]
ハイパウシティシナリオにおけるデータ分布の学習を容易にする新しいフレームワークを提案する。
提案手法は,不完全データから学習過程を協調最適化タスクとして行うことに由来する。
論文 参考訳(メタデータ) (2021-04-03T20:57:57Z) - MAIN: Multihead-Attention Imputation Networks [4.427447378048202]
本稿では,任意のモデルに適用可能なマルチヘッドアテンションに基づく新しいメカニズムを提案する。
提案手法は、下流タスクの性能を向上させるために、入力データの欠落パターンを誘導的にモデル化する。
論文 参考訳(メタデータ) (2021-02-10T13:50:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。