論文の概要: No Data? No Problem: Robust Vision-Tabular Learning with Missing Values
- arxiv url: http://arxiv.org/abs/2512.19602v1
- Date: Mon, 22 Dec 2025 17:35:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-23 18:54:32.858474
- Title: No Data? No Problem: Robust Vision-Tabular Learning with Missing Values
- Title(参考訳): データなし? 問題なし: 失敗する価値を持つロバストなビジョンタブララー学習
- Authors: Marta Hasny, Laura Daza, Keno Bressem, Maxime Di Folco, Julia Schnabel,
- Abstract要約: 我々は,データ可用性のレベルを0%から100%に設定したフレームワークであるRoVTL(Robust Vision-Tabular Learning)を提案する。
本研究は,英国バイオバンクの心臓MRI検査におけるRoVTLについて検討し,従来の方法と比較して有意な頑健性を示した。
- 参考スコア(独自算出の注目度): 0.4077787659104315
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Large-scale medical biobanks provide imaging data complemented by extensive tabular information, such as demographics or clinical measurements. However, this abundance of tabular attributes does not reflect real-world datasets, where only a subset of attributes may be available. This discrepancy calls for methods that can leverage all the tabular data during training while remaining robust to missing values at inference. To address this challenge, we propose RoVTL (Robust Vision-Tabular Learning), a framework designed to handle any level of tabular data availability, from 0% to 100%. RoVTL comprises two key stages: contrastive pretraining, where we introduce tabular attribute missingness as data augmentation to promote robustness, and downstream task tuning using a gated cross-attention module for multimodal fusion. During fine-tuning, we employ a novel Tabular More vs. Fewer loss that ranks performance based on the amount of available tabular data. Combined with disentangled gradient learning, this enables consistent performance across all tabular data completeness scenarios. We evaluate RoVTL on cardiac MRI scans from the UK Biobank, demonstrating superior robustness to missing tabular data compared to prior methods. Furthermore, RoVTL successfully generalizes to an external cardiac MRI dataset for multimodal disease classification, and extends to the natural images domain, achieving robust performance on a car advertisements dataset. The code is available at https://github.com/marteczkah/RoVTL.
- Abstract(参考訳): 大規模医療バイオバンクは、人口統計学や臨床測定などの広範な表層情報によって補完される画像データを提供する。
しかし、この表属性の豊富さは、属性のサブセットしか利用できない現実世界のデータセットを反映しない。
この不一致は、推論時に欠落した値に対してロバストを維持しながら、トレーニング中にすべての表データを活用することができるメソッドを要求する。
この課題に対処するため,我々は,表データの可用性を0%から100%に設定したフレームワークであるRoVTL(Robust Vision-Tabular Learning)を提案する。
RoVTLは2つの重要な段階から構成される: 対照的な事前訓練では、ロバスト性を促進するためにデータ拡張として表属性の欠如を導入し、マルチモーダル融合のためのゲートクロスアテンションモジュールを用いた下流タスクチューニングを行う。
微調整中に、利用可能な表データの量に基づいて、パフォーマンスをランク付けする新しいタブラル・モア対フェーワー・ロス(Tabular More vs. Fewer loss)を採用する。
ゆがみのある勾配学習と組み合わせることで、すべての表データ完全性シナリオで一貫したパフォーマンスを実現することができる。
本研究は,英国バイオバンクの心臓MRI検査におけるRoVTLについて検討し,従来の方法と比較して有意な頑健性を示した。
さらに、RoVTLは、マルチモーダル病分類のための外部心臓MRIデータセットへの一般化に成功し、自然画像領域にまで拡張し、自動車広告データセット上で堅牢なパフォーマンスを実現する。
コードはhttps://github.com/marteczkah/RoVTLで公開されている。
関連論文リスト
- A Closer Look at TabPFN v2: Understanding Its Strengths and Extending Its Capabilities [51.08999772842298]
Tabular Prior-data Fitted Network v2 (TabPFN v2)は、さまざまな下流データセット間で、前例のないコンテキスト内学習性能を達成する。
本研究では,TabPFN v2が属性トークンをランダムに入力しても属性関係を推測可能であることを示す。
我々はTabPFN v2の制限がテスト時間分割・コンテキスト戦略によって対処できることを実証した。
論文 参考訳(メタデータ) (2025-02-24T17:38:42Z) - TIP: Tabular-Image Pre-training for Multimodal Classification with Incomplete Data [6.414759311130015]
不完全なデータに頑健なマルチモーダル表現を学習するための新しいフレームワークであるTIPを提案する。
具体的には、TIPは、データ不足に対処するためのマスク付き再構築タスクを含む、自己教師付き学習(SSL)戦略を調査する。
TIPは、完全なデータシナリオと不完全なデータシナリオの両方において、最先端の教師付き/SSLイメージ/マルチモーダルアルゴリズムより優れている。
論文 参考訳(メタデータ) (2024-07-10T12:16:15Z) - Rethinking Pre-Training in Tabular Data: A Neighborhood Embedding Perspective [71.45945607871715]
メタ表現(TabPTM)を用いたタブラルデータ事前学習を提案する。
中心となる考え方は、データインスタンスを共有機能空間に埋め込むことで、各インスタンスは、近隣の固定数とそのラベルまでの距離で表現される。
101データセットの大規模な実験は、微調整の有無にかかわらず、分類タスクと回帰タスクの両方においてTabPTMの有効性を確認した。
論文 参考訳(メタデータ) (2023-10-31T18:03:54Z) - MediTab: Scaling Medical Tabular Data Predictors via Data Consolidation, Enrichment, and Refinement [44.693325083735424]
患者の健康リスク予測などの医療応用において,タブラルデータ予測が採用されている。
以前の予測子は、手動でキュレートされた小さなデータセットでトレーニングされることが多い。
論文 参考訳(メタデータ) (2023-05-20T03:37:09Z) - Best of Both Worlds: Multimodal Contrastive Learning with Tabular and
Imaging Data [7.49320945341034]
単調エンコーダを学習するための自己指導型コントラスト学習フレームワークを提案する。
我々のソリューションは、2つの主要なコントラスト学習戦略であるSimCLRとSCARFを組み合わせています。
DVMカー広告データセットを用いて,自然画像へのアプローチの一般化可能性を示す。
論文 参考訳(メタデータ) (2023-03-24T15:44:42Z) - Is margin all you need? An extensive empirical study of active learning
on tabular data [66.18464006872345]
我々は,OpenML-CC18ベンチマークを用いて,69の実世界のデータセット上での各種能動学習アルゴリズムの性能を解析した。
意外なことに、古典的なマージンサンプリング技術は、現在の最先端技術を含む、他のすべてのものよりも優れている。
論文 参考訳(メタデータ) (2022-10-07T21:18:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。