論文の概要: Active In-Context Learning for Tabular Foundation Models
- arxiv url: http://arxiv.org/abs/2603.27385v1
- Date: Sat, 28 Mar 2026 19:37:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-31 23:18:44.932196
- Title: Active In-Context Learning for Tabular Foundation Models
- Title(参考訳): 語彙基礎モデルのためのアクティブ・インコンテキスト学習
- Authors: Wilailuck Treerath, Fabrizio Pittorino,
- Abstract要約: Tabular Active In-Context Learning (Tab-AICL) を形式化し、4つの取得ルールでインスタンス化する。
20の分類ベンチマークで、Tab-AICLは、トレーニングされた勾配ブースティングベースラインよりもコールドスタートサンプル効率を改善する。
- 参考スコア(独自算出の注目度): 0.675253870287079
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Active learning (AL) reduces labeling cost by querying informative samples, but in tabular settings its cold-start gains are often limited because uncertainty estimates are unreliable when models are trained on very few labels. Tabular foundation models such as TabPFN provide calibrated probabilistic predictions via in-context learning (ICL), i.e., without task-specific weight updates, enabling an AL regime in which the labeled context - rather than parameters - is iteratively optimized. We formalize Tabular Active In-Context Learning (Tab-AICL) and instantiate it with four acquisition rules: uncertainty (TabPFN-Margin), diversity (TabPFN-Coreset), an uncertainty-diversity hybrid (TabPFN-Hybrid), and a scalable two-stage method (TabPFN-Proxy-Hybrid) that shortlists candidates using a lightweight linear proxy before TabPFN-based selection. Across 20 classification benchmarks, Tab-AICL improves cold-start sample efficiency over retrained gradient-boosting baselines (CatBoost-Margin and XGBoost-Margin), measured by normalized AULC up to 100 labeled samples.
- Abstract(参考訳): アクティブラーニング(AL)は、情報的なサンプルをクエリすることでラベリングコストを削減するが、表形式の設定では、モデルが非常に少ないラベルでトレーニングされた場合、不確実性推定が信頼できないため、コールドスタートのゲインは制限されることが多い。
TabPFNのようなタブラル基礎モデルは、インコンテキスト学習(ICL)、すなわちタスク固有の重み付けを伴わずにキャリブレーションされた確率予測を提供し、パラメータではなくラベル付きコンテキストが反復的に最適化されるAL構造を可能にする。
本研究では,Tabular Active In-Context Learning (Tab-AICL) を定式化し,不確実性 (TabPFN-Margin),多様性 (TabPFN-Coreset),不確実性ダイバーシティハイブリッド (TabPFN-Hybrid),拡張性のある2段階法 (TabPFN-Proxy-Hybrid) の4つの取得ルールでインスタンス化する。
20の分類ベンチマークで、Tab-AICLは、正規化されたALUCで最大100個のラベル付きサンプルによって測定された、トレーニングされた勾配ブースティングベースライン(CatBoost-MarginとXGBoost-Margin)よりも冷間開始サンプル効率を改善する。
関連論文リスト
- Gradient Free Deep Reinforcement Learning With TabPFN [23.140580395364207]
本稿では,Q関数近似器としてメタトレーニングされた変換器TabPFNを再利用した勾配自由深度RLフレームワークTabPFN RLを提案する。
我々はTabPFNを用いて推論のみを使用してQ値を予測する。
その結果,TabPFN などの既設ネットワークを高速かつ計算効率のよい RL の基盤として確立し,大規模な事前学習型トランスフォーマーによる勾配自由 RL の新たな方向性を開拓した。
論文 参考訳(メタデータ) (2025-09-14T13:09:58Z) - Chunked TabPFN: Exact Training-Free In-Context Learning for Long-Context Tabular Data [2.2682391370097794]
本稿では,TabPFNフレームワーク内での注目度を計算するためのタイルブロック戦略を提案する。
この設計は標準のGPUセットアップと互換性がある。
標準TabArenaベンチマークにおいて,提案手法の有効性を示す。
論文 参考訳(メタデータ) (2025-08-30T02:57:01Z) - TabICL: A Tabular Foundation Model for In-Context Learning on Large Data [15.08819125687632]
最大60Kサンプルの合成データセットを事前学習した表層ベースモデルであるTabICLを導入する。
TALENTベンチマークから200を越える分類データセットのうち、TabICLはTabPFNv2と同等であり、体系的に高速(最大10倍)である。
10K以上のサンプルを持つ53のデータセットで、TabICLはTabPFNv2とCatBoostを上回り、大規模データに対するICLの可能性を示している。
論文 参考訳(メタデータ) (2025-02-08T13:25:04Z) - Tokenize features, enhancing tables: the FT-TABPFN model for tabular classification [13.481699494376809]
FT-TabPFNはTabPFNの拡張版で、分類機能をよりよく扱うための新しい機能トークン化レイヤを含んでいる。
私たちの完全なソースコードは、コミュニティの利用と開発に利用可能です。
論文 参考訳(メタデータ) (2024-06-11T02:13:46Z) - TuneTables: Context Optimization for Scalable Prior-Data Fitted Networks [90.00817095558094]
事前データ対応ネットワーク(PFN)は、事前学習とコンテキスト内学習を利用して、1つのフォワードパスで新しいタスクの強力なパフォーマンスを実現する。
我々は、大規模なデータセットをより小さな学習コンテキストに圧縮するPFNのパラメータ効率の良い微調整戦略であるTuneTablesを紹介した。
我々は、TuneTablesを解釈可能性ツールとして使用することができ、公平性目標を最適化することでバイアスを軽減することができることを示した。
論文 参考訳(メタデータ) (2024-02-17T00:02:23Z) - ProTeCt: Prompt Tuning for Taxonomic Open Set Classification [59.59442518849203]
分類学的オープンセット(TOS)設定では、ほとんどショット適応法はうまくいきません。
本稿では,モデル予測の階層的一貫性を校正する即時チューニング手法を提案する。
次に,階層整合性のための新しいPrompt Tuning(ProTeCt)手法を提案し,ラベル集合の粒度を分類する。
論文 参考訳(メタデータ) (2023-06-04T02:55:25Z) - Is margin all you need? An extensive empirical study of active learning
on tabular data [66.18464006872345]
我々は,OpenML-CC18ベンチマークを用いて,69の実世界のデータセット上での各種能動学習アルゴリズムの性能を解析した。
意外なことに、古典的なマージンサンプリング技術は、現在の最先端技術を含む、他のすべてのものよりも優れている。
論文 参考訳(メタデータ) (2022-10-07T21:18:24Z) - TabPFN: A Transformer That Solves Small Tabular Classification Problems
in a Second [48.87527918630822]
トレーニングされたトランスフォーマーであるTabPFNは、小さなデータセットの教師付き分類を1秒以内で行うことができる。
TabPFNはコンテキスト内学習(ICL)を行い、ラベル付きサンプルのシーケンスを使用して予測を行う。
提案手法は, 強化木よりも明らかに優れており, 230$times$ Speedupの複雑なAutoMLシステムと同等性能を示す。
論文 参考訳(メタデータ) (2022-07-05T07:17:43Z) - Meta-Generating Deep Attentive Metric for Few-shot Classification [53.07108067253006]
本稿では,新しい数ショット学習タスクのための特定のメトリックを生成するための,新しい深度メタジェネレーション手法を提案する。
本研究では,各タスクの識別基準を生成するのに十分なフレキシブルな3層深い注意ネットワークを用いて,メトリクスを構造化する。
特に挑戦的なケースでは、最先端の競合他社よりも驚くほどパフォーマンスが向上しています。
論文 参考訳(メタデータ) (2020-12-03T02:07:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。