Fugu-MT 論文翻訳(概要): Tabular Few-Shot Generalization Across Heterogeneous Feature Spaces

論文の概要: Tabular Few-Shot Generalization Across Heterogeneous Feature Spaces

arxiv url: http://arxiv.org/abs/2311.10051v1
Date: Thu, 16 Nov 2023 17:45:59 GMT
ステータス: 翻訳完了
システム内更新日: 2023-11-17 13:29:36.162475
Title: Tabular Few-Shot Generalization Across Heterogeneous Feature Spaces
Title（参考訳）: 不均一特徴空間におけるタブラルフショット一般化
Authors: Max Zhu, Katarzyna Kobalczyk, Andrija Petrovic, Mladen Nikolic, Mihaela van der Schaar, Boris Delibasic, Petro Lio
Abstract要約: 異種特徴空間を持つデータセット間での知識共有を含む数ショット学習のための新しいアプローチを提案する。 FLATはデータセットとその個々の列の低次元埋め込みを学習し、それまで見つからなかったデータセットへの知識伝達と一般化を容易にする。デコーダネットワークは、グラフ注意ネットワークとして実装された予測対象ネットワークをパラメータ化して、表形式のデータセットの不均一性に対応する。
参考スコア（独自算出の注目度）: 43.67453625260335
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Despite the prevalence of tabular datasets, few-shot learning remains under-explored within this domain. Existing few-shot methods are not directly applicable to tabular datasets due to varying column relationships, meanings, and permutational invariance. To address these challenges, we propose FLAT-a novel approach to tabular few-shot learning, encompassing knowledge sharing between datasets with heterogeneous feature spaces. Utilizing an encoder inspired by Dataset2Vec, FLAT learns low-dimensional embeddings of datasets and their individual columns, which facilitate knowledge transfer and generalization to previously unseen datasets. A decoder network parametrizes the predictive target network, implemented as a Graph Attention Network, to accommodate the heterogeneous nature of tabular datasets. Experiments on a diverse collection of 118 UCI datasets demonstrate FLAT's successful generalization to new tabular datasets and a considerable improvement over the baselines.
Abstract（参考訳）: 表型データセットの普及にもかかわらず、このドメイン内では、わずかなショット学習が未検討のままである。既存の少数ショット法は、列関係、意味、置換不変性によって表のデータセットに直接適用できない。これらの課題に対処するために,不均一な特徴空間を持つデータセット間の知識共有を包含するFLATを提案する。 Dataset2Vecにインスパイアされたエンコーダを利用することで、FLATはデータセットと個々の列の低次元の埋め込みを学習する。デコーダネットワークは、グラフ注目ネットワークとして実装された予測対象ネットワークをパラメータ化し、表型データセットの異種性に対応する。 118のuciデータセットの多様なコレクションに関する実験は、新しい表型データセットへのflatの一般化の成功と、ベースラインに対する大幅な改善を示している。

関連論文リスト

Universal Embeddings of Tabular Data [0.0]
リレーショナルデータベースにおけるタブラリデータは、産業データのかなりの部分を占めている。本稿では,予め定義された目標を満たさずにダウンストリームタスクを実行するための,タスク非依存な表データの埋め込みを普遍的に生成するための新しいフレームワークを提案する。
論文参考訳（メタデータ） (2025-07-08T11:45:29Z)
ZEUS: Zero-shot Embeddings for Unsupervised Separation of Tabular Data [7.121259735505479]
ZEUSは、追加のトレーニングや微調整なしに新しいデータセットをクラスタリングできる自己完結型モデルである。複雑なデータセットを意味のあるコンポーネントに分解して動作し、効果的にクラスタ化することができる。
論文参考訳（メタデータ） (2025-05-15T20:52:26Z)
Representation Learning for Tabular Data: A Comprehensive Survey [23.606506938919605]
行と列として構造化されたタブラルデータは、機械学習の分類と回帰アプリケーションにおいて最も一般的なデータタイプの一つである。ディープニューラルネットワーク(DNN)は、最近、表現学習の能力を通じて有望な結果を実証した。既存の手法を一般化能力に応じて3つの主要なカテゴリに分類する。
論文参考訳（メタデータ） (2025-04-17T17:58:23Z)
A Closer Look at TabPFN v2: Strength, Limitation, and Extension [51.08999772842298]
Tabular Prior-data Fitted Network v2 (TabPFN v2)は、複数のデータセットにまたがる前例のないコンテキスト内学習の精度を達成する。本稿では,300以上のデータセット上でTabPFN v2を評価し,中小規模タスクにおける例外的な一般化機能を確認する。
論文参考訳（メタデータ） (2025-02-24T17:38:42Z)
Geodesic Flow Kernels for Semi-Supervised Learning on Mixed-Variable Tabular Dataset [31.23513370504603]
GFTabは、Mixed-Variable Tabularデータセットフレームワークの半教師付き学習である。 GFTabには3つの重要な革新がある: 1) 連続変数と分類変数の異なる性質に合わせた変数固有の汚職法、2) 腐敗した入力間の幾何学的変化を捉える測地学的フローカーネルに基づく類似度尺度、3) 利用可能なラベル付きデータから階層的関係を利用する木に基づく埋め込み。我々の実験結果によると、GFTabは、多くのデータセット、特にラベル付きデータに制限された設定において、既存のML/DLモデルよりも優れています。
論文参考訳（メタデータ） (2024-12-17T12:47:53Z)
LaTable: Towards Large Tabular Models [63.995130144110156]
タブラル生成基盤モデルは、異なるデータセットの不均一な特徴空間のために構築が困難である。 LaTableは、これらの課題に対処し、異なるデータセットでトレーニング可能な、新しい拡散モデルである。 LaTableは、分散生成のベースラインよりも優れており、微調整されたLaTableは、より少ないサンプルで分散データセットをより良く生成できる。
論文参考訳（メタデータ） (2024-06-25T16:03:50Z)
Cross-Table Pretraining towards a Universal Function Space for Heterogeneous Tabular Data [35.61663559675556]
クロスデータセット事前トレーニングは、様々な分野で顕著な成功を収めている。本研究では,多目的な下流表予測タスクのためのクロステーブル事前学習型トランスであるXTFormerを提案する。我々の手法は、XTFormerを事前訓練して、全ての潜在的な機能ターゲットマッピングを含む「メタ関数」空間を確立することである。
論文参考訳（メタデータ） (2024-06-01T03:24:31Z)
UniTraj: A Unified Framework for Scalable Vehicle Trajectory Prediction [93.77809355002591]
さまざまなデータセット、モデル、評価基準を統一する包括的なフレームワークであるUniTrajを紹介する。我々は広範な実験を行い、他のデータセットに転送するとモデルの性能が大幅に低下することがわかった。これらの知見を説明するために,データセットの特徴に関する洞察を提供する。
論文参考訳（メタデータ） (2024-03-22T10:36:50Z)
Training-Free Generalization on Heterogeneous Tabular Data via Meta-Representation [67.30538142519067]
メタ表現(TabPTM)を用いたタブラルデータ事前学習を提案する。深層ニューラルネットワークは、これらのメタ表現とデータセット固有の分類信頼度を関連付けるように訓練される。実験により、TabPTMは、数ショットのシナリオであっても、新しいデータセットで有望なパフォーマンスを達成することを確認した。
論文参考訳（メタデータ） (2023-10-31T18:03:54Z)
TablEye: Seeing small Tables through the Lens of Images [1.4398570436349933]
ドメイン変換を採用することにより、表データの事前知識形成の限界を克服することを目的とした、TablEyeと呼ばれる革新的なフレームワークを提案する。このアプローチは、厳密にテストされた数発の学習アルゴリズムと埋め込み関数を利用して、事前の知識を取得し、適用する。 TalEyeはTabLLMを最大0.11AUCとSTUNTの4ショットタスクで上回り、1ショット設定で平均3.17%の精度で性能を発揮した。
論文参考訳（メタデータ） (2023-07-04T02:45:59Z)
Learning Representations without Compositional Assumptions [79.12273403390311]
本稿では,特徴集合をグラフノードとして表現し,それらの関係を学習可能なエッジとして表現することで,特徴集合の依存関係を学習するデータ駆動型アプローチを提案する。また,複数のビューから情報を動的に集約するために,より小さな潜在グラフを学習する新しい階層グラフオートエンコーダLEGATOを導入する。
論文参考訳（メタデータ） (2023-05-31T10:36:10Z)
infoVerse: A Universal Framework for Dataset Characterization with Multidimensional Meta-information [68.76707843019886]
infoVerseは、データセットの特徴付けのための普遍的なフレームワークである。 infoVerseは、様々なモデル駆動メタ情報を統合することで、データセットの多次元特性をキャプチャする。実世界の3つのアプリケーション(データプルーニング、アクティブラーニング、データアノテーション)において、infoVerse空間で選択されたサンプルは、強いベースラインを一貫して上回る。
論文参考訳（メタデータ） (2023-05-30T18:12:48Z)
SubTab: Subsetting Features of Tabular Data for Self-Supervised Representation Learning [5.5616364225463055]
私たちはTabular Data(SubTab)のサブセット機能である新しいフレームワークを紹介します。本稿では,タブラルデータ(SubTab)のサブセット機能である新しいフレームワークを提案する。我々は、自動エンコーダ設定で、その機能の一部分からデータを再構成することで、その基盤となる表現をよりよく捉えることができると論じている。
論文参考訳（メタデータ） (2021-10-08T20:11:09Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。