論文の概要: Rethinking Incompleteness: Formalizing Protocol Divergence and Train-Once Learning for Robust IMVC
- arxiv url: http://arxiv.org/abs/2606.04857v1
- Date: Wed, 03 Jun 2026 13:24:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-05 07:07:40.501157
- Title: Rethinking Incompleteness: Formalizing Protocol Divergence and Train-Once Learning for Robust IMVC
- Title(参考訳): 不完全性を再考する:ロバストIMVCのための形式化プロトコルの多様性とトレインオースラーニング
- Authors: Haolu Liu, Xiyue Wang, Xuanting Xie, Liangjian Wen, Zhao Kang,
- Abstract要約: IMVC評価は、異なるデータ構成のための別々のモデルを再訓練する。
欠落率だけではデータの不完全性を特徴づけるには不十分である。
我々はこの現象を不完全分散として定式化し、欠測データプロトコル間の構造的格差を捉える手段を提供する。
- 参考スコア(独自算出の注目度): 13.498020856656494
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Standard IMVC evaluation retrains separate models for different missing-data configurations. We show that this paradigm obscures a fundamental vulnerability: missing rate alone is insufficient to characterize data incompleteness. Specifically, we show that protocols with identical nominal missing rates can differ by up to $50\times$ in their proportion of fully observed samples, inducing drastically different learning regimes. We formalize this phenomenon as incompleteness divergence, providing measures that capture structural disparities across missing-data protocols. We further prove that for a broad class of reconstruction-based objectives, learning becomes structurally ill-posed when the proportion of complete samples falls below a critical threshold, leading to near-random performance. To bypass this theoretical bound, we propose CRAFT (Complete-data Robust Attention-masked Fusion Transformer). CRAFT shifts the burden of robustness from the loss function to the architecture via two key properties: (i) per-sample independence, which removes reliance on complete-sample co-occurrence, and (ii) mask-aware variable-length fusion, which aggregates only observed views through attention masking. This design allows a single model, trained once on complete data, to generalize to diverse missing patterns at inference time without retraining. Extensive experiments on seven benchmarks show that CRAFT matches or outperforms per-configuration baselines while reducing training overhead by $8.8\times$, demonstrating that robustness to missing data can be achieved as an inherent architectural property. Code (CRAFT) and our imvc-audit toolkit are available at https://anonymous.4open.science/r/CRAFT-BF80/ and https://anonymous.4open.science/r/imvc-audit-8263/.
- Abstract(参考訳): 標準IMVC評価は、異なるデータ構成のための別々のモデルを再訓練する。
欠落率だけではデータの不完全性を特徴づけるには不十分である。
具体的には、同一の特異な欠落率を持つプロトコルが、完全に観察されたサンプルの割合で最大50\times$まで異なることが示され、非常に異なる学習体制が引き起こされる。
我々はこの現象を不完全分散として定式化し、欠測データプロトコル間の構造的格差を捉える手段を提供する。
さらに, 広範囲の再建目標に対して, 完全サンプルの割合が限界値以下になると, 学習が構造的に悪影響を及ぼし, ほぼランダムな性能がもたらされることを示す。
この理論的境界を回避すべく、CRAFT(Complete-data Robust Attention-masked Fusion Transformer)を提案する。
CRAFTは、ロス関数からアーキテクチャへのロバストネスの重荷を2つの重要な特性によってシフトする。
一 サンプルごとの独立で、完全サンプルの共起への依存を排除し、
(II)注目マスキングを通してのみ観察されたビューを集約するマスク対応可変長核融合。
この設計により、完全なデータに基づいてトレーニングされた1つのモデルで、推論時に多種多様な欠落パターンを再トレーニングすることなく一般化することができる。
7つのベンチマークにおいて、CRAFTはトレーニングオーバーヘッドを8.8\times$に減らし、構成毎のベースラインに適合または性能を向上し、欠落データに対する堅牢性は固有のアーキテクチャ特性として達成可能であることを示した。
コード(CRAFT)とImvc-auditツールキットはhttps://anonymous.4open.science/r/CRAFT-BF80/およびhttps://anonymous.4open.science/r/imvc-audit-8263/で利用可能である。
関連論文リスト
- NetVAD: Foundation-Model Representation Learning for Identifier-Free Unsupervised Intrusion Detection [1.529342790344802]
textitNetVADは、凍結したファンデーションモデルからタスク固有の潜在空間に表現を投影する。
ToN-IoTでは、マイクロF1スコアの98%、マクロF1スコアの96%を運用上の偽陽性率で達成している。
論文 参考訳(メタデータ) (2026-05-31T21:14:25Z) - DDCL: Deep Dual Competitive Learning: A Differentiable End-to-End Framework for Unsupervised Prototype-Based Representation Learning [0.0]
ディープクラスタリングにおける永続的な構造的弱点は、特徴学習とクラスタ割り当ての切り離しである。
本稿では,教師なし表現学習のためのエンドツーエンドフレームワークであるDeep Dual Competitive Learningを紹介する。
論文 参考訳(メタデータ) (2026-04-02T08:02:27Z) - Revisiting Multivariate Time Series Forecasting with Missing Values [65.30332997607141]
現実の時系列では欠落値が一般的である。
現在のアプローチでは、計算モジュールを使用して、不足した値を補う、計算済みの予測フレームワークが開発されている。
このフレームワークは、致命的な問題を見落としている: 欠落した値に対して基礎的な真理は存在せず、予測精度を劣化させる可能性のあるエラーの影響を受けやすいようにしている。
本稿では,Information Bottleneck原則に基づく新しいフレームワークであるConsistency-Regularized Information Bottleneck(CRIB)を紹介する。
論文 参考訳(メタデータ) (2025-09-27T20:57:48Z) - Crucial-Diff: A Unified Diffusion Model for Crucial Image and Annotation Synthesis in Data-scarce Scenarios [65.97836905826145]
医療、産業、自動運転といったさまざまなシナリオにおけるデータの不足は、モデルの過度な適合とデータセットの不均衡につながる。
重要なサンプルを合成するドメインに依存しないフレームワークであるCrucial-Diffを提案する。
我々のフレームワークは多様な高品質なトレーニングデータを生成し、ピクセルレベルのAPは83.63%、F1-MAXは78.12%である。
論文 参考訳(メタデータ) (2025-07-14T04:41:38Z) - SINDER: Repairing the Singular Defects of DINOv2 [61.98878352956125]
大規模なデータセットでトレーニングされたビジョントランスフォーマーモデルは、抽出したパッチトークンにアーティファクトを表示することが多い。
本稿では,小さなデータセットのみを用いて構造欠陥を補正するスムーズなスムーズな正規化を提案する。
論文 参考訳(メタデータ) (2024-07-23T20:34:23Z) - Enhancing Multiple Reliability Measures via Nuisance-extended
Information Bottleneck [77.37409441129995]
トレーニングデータに制限がある現実的なシナリオでは、データ内の多くの予測信号は、データ取得のバイアスからより多く得る。
我々は,相互情報制約の下で,より広い範囲の摂動をカバーできる敵の脅威モデルを考える。
そこで本研究では,その目的を実現するためのオートエンコーダベーストレーニングと,提案したハイブリッド識別世代学習を促進するための実用的なエンコーダ設計を提案する。
論文 参考訳(メタデータ) (2023-03-24T16:03:21Z) - Understanding Dynamics of Nonlinear Representation Learning and Its
Application [12.697842097171119]
暗黙的非線形表現学習のダイナミクスについて検討する。
我々は,データ構造アライメント条件がグローバル収束に十分であることを示す。
我々はデータ構造アライメント条件を満たす新しいトレーニングフレームワークを作成した。
論文 参考訳(メタデータ) (2021-06-28T16:31:30Z) - Contrastive Model Inversion for Data-Free Knowledge Distillation [60.08025054715192]
そこで、データ多様性を最適化可能な目的として明示的にモデル化するContrastive Model Inversionを提案します。
我々の主な観察では、同じ量のデータの制約の下では、高いデータの多様性は、通常より強いインスタンス識別を示す。
CIFAR-10, CIFAR-100, Tiny-ImageNetを用いた実験により, 生成したデータを知識蒸留に使用する場合, CMIは極めて優れた性能を示すことが示された。
論文 参考訳(メタデータ) (2021-05-18T15:13:00Z) - Model Rectification via Unknown Unknowns Extraction from Deployment
Samples [8.0497115494227]
本稿では, 訓練後のモデル修正を, 教師付き方式で実施することを目的とした, 汎用的なアルゴリズムフレームワークを提案する。
RTSCVは未知の未知(u.u.s)を抽出する
RTSCVは最先端のアプローチよりも一貫して優れていることを示す。
論文 参考訳(メタデータ) (2021-02-08T11:46:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。