論文の概要: KumoRFM-2: Scaling Foundation Models for Relational Learning
- arxiv url: http://arxiv.org/abs/2604.12596v1
- Date: Tue, 14 Apr 2026 11:24:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-15 19:11:32.409957
- Title: KumoRFM-2: Scaling Foundation Models for Relational Learning
- Title(参考訳): KumoRFM-2:関係学習のための基礎モデルのスケーリング
- Authors: Valter Hudovernik, Federico López, Vid Kocijan, Akihiro Nitta, Jan Eric Lenssen, Jure Leskovec, Matthias Fey,
- Abstract要約: KumoRFM-2は、リレーショナルデータのための事前訓練された基礎モデルの次のイテレーションである。
コンテキスト内学習と微調整をサポートし、幅広い予測タスクに適用できる。
- 参考スコア(独自算出の注目度): 48.88283881350858
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce KumoRFM-2, the next iteration of a pre-trained foundation model for relational data. KumoRFM-2 supports in-context learning as well as fine-tuning and is applicable to a wide range of predictive tasks. In contrast to tabular foundation models, KumoRFM-2 natively operates on relational data, processing one or more connected tables simultaneously without manual table flattening or target variable generation, all while preserving temporal consistency. KumoRFM-2 leverages a large corpus of synthetic and real-world data to pre-train across four axes: the row and column dimensions at the individual table level, and the foreign key and cross-sample dimensions at the database level. In contrast to its predecessor, KumoRFM-2 injects task information as early as possible, enabling sharper selection of task-relevant columns and improved robustness to noisy data. Through extensive experiments on 41 challenging benchmarks and analysis around expressivity and sensitivity, we demonstrate that KumoRFM-2 outperforms supervised and foundational approaches by up to 8%, while maintaining strong performance under extreme settings of cold start and noisy data. To our knowledge, this is the first time a few-shot foundation model has been shown to surpass supervised approaches on common benchmark tasks, with performance further improving upon fine-tuning. Finally, while KumoRFM-1 was limited to small-scale in-memory datasets, KumoRFM-2 scales to billion-scale relational datasets.
- Abstract(参考訳): 関係データのための事前学習基礎モデルの次のイテレーションであるKumoRFM-2を紹介する。
KumoRFM-2はテキスト内学習と微調整をサポートし、幅広い予測タスクに適用できる。
表形式の基礎モデルとは対照的に、KumoRFM-2はリレーショナルデータ上でネイティブに動作し、1つ以上の連結テーブルを同時に処理する。
KumoRFM-2は、個々のテーブルレベルでの行と列の次元、データベースレベルでの外部キーとクロスサンプルの次元の4つの軸をまたいで事前訓練するために、合成および実世界の大量のコーパスを利用する。
KumoRFM-2は、以前のものと対照的に、タスク情報をできるだけ早く注入し、タスク関連カラムのよりシャープな選択を可能にし、ノイズの多いデータに対する堅牢性を改善している。
KumoRFM-2は、41の挑戦的ベンチマークと、表現性と感度に関する分析に関する広範な実験を通じて、極端に寒冷なスタートとノイズの多いデータの下で強い性能を維持しながら、教師付きおよび基礎的なアプローチを最大8%向上させることを示した。
我々の知る限り、ファウンデーションモデルが一般的なベンチマークタスクの監督されたアプローチを超えることが示されているのはこれが初めてであり、微調整によりパフォーマンスがさらに向上する。
最後に、KumoRFM-1は小規模のインメモリデータセットに限られていたが、KumoRFM-2は数十億のリレーショナルデータセットにスケールする。
関連論文リスト
- RelBench v2: A Large-Scale Benchmark and Repository for Relational Data [33.795728412518834]
RDLのためのRelBenchベンチマークのメジャー拡張であるRelBench v2を紹介する。
RDLモデルは、オートコンプリート予測とレコメンデーションタスクで、シングルテーブルベースラインを一貫して上回る。
論文 参考訳(メタデータ) (2026-02-13T04:23:48Z) - SITUATE -- Synthetic Object Counting Dataset for VLM training [0.0]
本稿では,視覚言語モデルの訓練と評価を目的とした新しいデータセットであるSITUATEを提案する。
このデータセットは、VLMCountBenchのような単純な2Dデータセットと、TallyQAのようなあいまいな実生活データセットとのギャップを埋める。
論文 参考訳(メタデータ) (2026-01-26T16:17:53Z) - Mitra: Mixed Synthetic Priors for Enhancing Tabular Foundation Models [85.64873567417396]
実世界のデータに対して,その多様性,特異性,および性能のために選択された合成前駆体の硬化した混合物をトレーニングしたTFMであるMitraを紹介する。
Mitraは、TabPFNv2やTabICLのような最先端のTFMを、分類と回帰のベンチマークで一貫して上回っている。
論文 参考訳(メタデータ) (2025-10-24T07:15:06Z) - Estimating Time Series Foundation Model Transferability via In-Context Learning [74.65355820906355]
時系列基礎モデル(TSFM)は、大規模な事前訓練を通じて強力なゼロショット予測を提供する。
微調整は、公開データに制限のあるドメインのパフォーマンス向上に依然として不可欠である。
モデル選択をコンテキスト内学習問題として再キャストする転送可能性推定フレームワークであるTimeTicを紹介する。
論文 参考訳(メタデータ) (2025-09-28T07:07:13Z) - LimiX: Unleashing Structured-Data Modeling Capability for Generalist Intelligence [61.46575527504109]
LimiX-16MとLimiX-2Mは、構造化されたデータを変数と欠落に対する共同分布として扱う。
サンプルサイズ,特徴次元,クラス数,カテゴリ間特徴比,欠落度,サンプル-特徴比の広い11種類の大規模構造化データベンチマークを対象としたLimiXモデルの評価を行った。
論文 参考訳(メタデータ) (2025-09-03T17:39:08Z) - A Closer Look at TabPFN v2: Understanding Its Strengths and Extending Its Capabilities [51.08999772842298]
Tabular Prior-data Fitted Network v2 (TabPFN v2)は、さまざまな下流データセット間で、前例のないコンテキスト内学習性能を達成する。
本研究では,TabPFN v2が属性トークンをランダムに入力しても属性関係を推測可能であることを示す。
我々はTabPFN v2の制限がテスト時間分割・コンテキスト戦略によって対処できることを実証した。
論文 参考訳(メタデータ) (2025-02-24T17:38:42Z) - Drift-Resilient TabPFN: In-Context Learning Temporal Distribution Shifts on Tabular Data [39.40116554523575]
In-Context Learning with a Prior-Data Fitted Network に基づく新しいアプローチである Drift-Resilient TabPFN を提案する。
先行した合成データセットのベイズ推定を近似することを学ぶ。
精度は0.688から0.744に向上し、OC AUCは0.786から0.832に向上し、キャリブレーションも強化された。
論文 参考訳(メタデータ) (2024-11-15T23:49:23Z) - Robustness Analysis on Foundational Segmentation Models [28.01242494123917]
本研究では,セグメンテーションタスクのためのVisual Foundation Models (VFM) のロバストネス解析を行う。
2つの異なるデータセットを使用して、7つの最先端セグメンテーションアーキテクチャをベンチマークする。
VFMは、強靭性において不定形モデルをすべて上回るものではないにもかかわらず、圧縮誘起汚損に対する脆弱性を示し、マルチモーダルモデルはゼロショットシナリオにおける競争力を示し、VFMは特定の対象カテゴリに対して強靭性を示す。
論文 参考訳(メタデータ) (2023-06-15T16:59:42Z) - MediTab: Scaling Medical Tabular Data Predictors via Data Consolidation, Enrichment, and Refinement [44.693325083735424]
患者の健康リスク予測などの医療応用において,タブラルデータ予測が採用されている。
以前の予測子は、手動でキュレートされた小さなデータセットでトレーニングされることが多い。
論文 参考訳(メタデータ) (2023-05-20T03:37:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。