Fugu-MT 論文翻訳(概要): TabM: Advancing Tabular Deep Learning with Parameter-Efficient Ensembling

論文の概要: TabM: Advancing Tabular Deep Learning with Parameter-Efficient Ensembling

arxiv url: http://arxiv.org/abs/2410.24210v1
Date: Thu, 31 Oct 2024 17:58:41 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:42.982349
Title: TabM: Advancing Tabular Deep Learning with Parameter-Efficient Ensembling
Title（参考訳）: TabM:パラメータ効率向上による語彙深層学習の促進
Authors: Yury Gorishniy, Akim Kotelnikov, Artem Babenko,
Abstract要約: TabM -- BatchEnemblesのバリエーション(既存のテクニック)に基づいたシンプルなモデルです。特に,TabMは表型DLモデルの中で最高の性能を示す。
参考スコア（独自算出の注目度）: 28.37672139176765
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Deep learning architectures for supervised learning on tabular data range from simple multilayer perceptrons (MLP) to sophisticated Transformers and retrieval-augmented methods. This study highlights a major, yet so far overlooked opportunity for substantially improving tabular MLPs: namely, parameter-efficient ensembling -- a paradigm for implementing an ensemble of models as one model producing multiple predictions. We start by developing TabM -- a simple model based on MLP and our variations of BatchEnsemble (an existing technique). Then, we perform a large-scale evaluation of tabular DL architectures on public benchmarks in terms of both task performance and efficiency, which renders the landscape of tabular DL in a new light. Generally, we show that MLPs, including TabM, form a line of stronger and more practical models compared to attention- and retrieval-based architectures. In particular, we find that TabM demonstrates the best performance among tabular DL models. Lastly, we conduct an empirical analysis on the ensemble-like nature of TabM. For example, we observe that the multiple predictions of TabM are weak individually, but powerful collectively. Overall, our work brings an impactful technique to tabular DL, analyses its behaviour, and advances the performance-efficiency trade-off with TabM -- a simple and powerful baseline for researchers and practitioners.
Abstract（参考訳）: 表形式のデータに対する教師あり学習のためのディープラーニングアーキテクチャは、単純な多層パーセプトロン(MLP)から高度なトランスフォーマーや検索拡張メソッドまで様々である。本研究は,MLPをベースとしたシンプルなモデルであるTabM(TabM)と,BatchEnsemble(既存のテクニック)のバリエーションをベースとした,テーブル型MLPを大幅に改善する大きな,見落とされがちな機会を浮き彫りにしたものだ。そこで我々は,タスク性能と効率の両面から,表状DLアーキテクチャの大規模評価を行い,表状DLのランドスケープを新たな光で表現する。一般に、TabMを含むMLPは、注目や検索に基づくアーキテクチャと比較して、より強力で実用的なモデルであることを示す。特に,TabMは表型DLモデルの中で最高の性能を示す。最後に,TabMのアンサンブル的な性質を実証的に分析する。例えば、TabMの複数の予測は個々に弱いが、全体としては強力である。全体として、私たちの研究は、表形式のDLにインパクトのあるテクニックをもたらし、その振る舞いを分析し、研究者や実践者のためのシンプルで強力なベースラインであるTabMとのパフォーマンス効率のトレードオフを前進させます。

関連論文リスト

Table as a Modality for Large Language Models [28.392792653645998]
提案したStructQAベンチマークで探索実験を行った。本稿では,テーブルをテキストトークンと統合した独立したモダリティとして扱うためのイデオロギーを持つTAMOを提案する。
論文参考訳（メタデータ） (2025-11-30T15:59:56Z)
iLTM: Integrated Large Tabular Model [41.81329403540607]
iLTMは、木由来の埋め込み、次元に依存しない表現、メタトレーニングされたハイパーネットワーク、多層パーセプトロン、単一のアーキテクチャ内での検索を統一する統合された大型タブラルモデルである。
論文参考訳（メタデータ） (2025-11-20T00:20:16Z)
Mitra: Mixed Synthetic Priors for Enhancing Tabular Foundation Models [85.64873567417396]
実世界のデータに対して,その多様性,特異性,および性能のために選択された合成前駆体の硬化した混合物をトレーニングしたTFMであるMitraを紹介する。 Mitraは、TabPFNv2やTabICLのような最先端のTFMを、分類と回帰のベンチマークで一貫して上回っている。
論文参考訳（メタデータ） (2025-10-24T07:15:06Z)
TableDART: Dynamic Adaptive Multi-Modal Routing for Table Understanding [52.59372043981724]
TableDARTはトレーニング効率のよいフレームワークで、事前トレーニングされた単一モダリティモデルを再利用することでマルチモーダルビューを統合する。さらに,テキストモデルと画像モデルからの出力を解析し,モーダル間知識統合のための新しいエージェントを提案する。
論文参考訳（メタデータ） (2025-09-18T07:00:13Z)
Summarize-Exemplify-Reflect: Data-driven Insight Distillation Empowers LLMs for Few-shot Tabular Classification [31.422359959517763]
InsightTabを紹介します。これは、分割・分散、簡単優先、反射学習の原則によって導かれる洞察蒸留フレームワークです。提案手法は, LLMとデータモデリング技術との深い協調を通して, ルール要約, 戦略実証, インサイトリフレクションを統合する。その結果,最先端手法よりも一貫した改善が得られた。
論文参考訳（メタデータ） (2025-08-29T12:16:24Z)
Table-r1: Self-supervised and Reinforcement Learning for Program-based Table Reasoning in Small Language Models [52.94091440130039]
表推論(TR)は、半構造化データに対する構造化推論を必要とする。小型言語モデル(SLM)は、大きなLM(LLM、例えばGPT-4o)と比較して限られた能力を持つ。実行可能プログラムを生成することで、テキストベースTR(T-TR)の鍵となる制限を回避するプログラムベースTR(P-TR)を提案する。 4つのTRベンチマークの実験により、Table-r1は全てのSLMベースの手法より優れていることが示された。
論文参考訳（メタデータ） (2025-06-06T14:52:19Z)
Multimodal Tabular Reasoning with Privileged Structured Information [67.40011423365712]
ブリッジインfOrmation (sc Turbo) を用いたタブウラー推論(TabUlar Reasoning)について紹介する。 sc TurboはDeepSeek-R1をベースにした構造対応の推論トレースジェネレータの恩恵を受ける。 sc Turboは、複数のデータセットで最先端のパフォーマンス(+7.2%対以前のSOTA)を達成する。
論文参考訳（メタデータ） (2025-06-04T15:46:30Z)
TableLoRA: Low-rank Adaptation on Table Structure Understanding for Large Language Models [57.005158277893194]
TableLoRA は、PEFT における LLM のテーブル構造理解を改善するために設計されたモジュールである。テーブルを特別なトークンエンコーダでシリアライズするための特別なトークンを組み込み、2D LoRAを使ってセル位置の低ランク情報をエンコードする。
論文参考訳（メタデータ） (2025-03-06T12:50:14Z)
TabGLM: Tabular Graph Language Model for Learning Transferable Representations Through Multi-Modal Consistency Minimization [2.1067477213933503]
TabGLM (Tabular Graph Language Model) はテーブルの構造情報と意味情報の両方をモデル化する新しいマルチモーダルアーキテクチャである。テーブルの各行を完全に連結されたグラフとシリアライズされたテキストに変換し、それぞれグラフニューラルネットワーク(GNN)とテキストエンコーダを使って符号化する。 25のベンチマークデータセットに対する評価は、大幅なパフォーマンス向上を示している。
論文参考訳（メタデータ） (2025-02-26T05:32:45Z)
HIPPO: Enhancing the Table Understanding Capability of Large Language Models through Hybrid-Modal Preference Optimization [48.240146108630704]
本稿では,HybrId-modal Preference oPtimizatiOn(HIPPO)モデルについて述べる。 HIPPOの有効性を示す表質問応答と表事実検証に関する実験結果を得た。
論文参考訳（メタデータ） (2025-02-24T16:50:55Z)
Towards Better Understanding Table Instruction Tuning: Decoupling the Effects from Data versus Models [62.47618742274461]
既存の公開トレーニングデータセットに基づいて、Mistral、OLMo、Phiファミリーからベースモデルを微調整します。我々のレプリケーションは、既存のテーブルLLMと同等以上のパフォーマンスを実現しています。トレーニングデータとベースモデルのコントリビューションを分離し、個々の影響に関する洞察を提供する。
論文参考訳（メタデータ） (2025-01-24T18:50:26Z)
Rethinking Table Instruction Tuning [29.139828718538418]
既存のテーブルLLMの能力を評価し、ドメイン外のテーブル理解と汎用能力の両方において顕著な低下を明らかにした。 LLaMA 3.1 8BインストラクタをベースとしたTAMAを導入し,テーブルタスクにおけるGPT-3.5やGPT-4に匹敵する性能を実現する。
論文参考訳（メタデータ） (2025-01-24T18:06:07Z)
LLAVADI: What Matters For Multimodal Large Language Models Distillation [77.73964744238519]
本研究では,新しい効率的なモデル構造を提案するのではなく,スクラッチから小規模MLLMを訓練する。本研究は, 知識蒸留プロセスにおける学習戦略, モデル選択, 蒸留アルゴリズムに関するものである。異なるベンチマークと適切な戦略を評価することで、2.7Bの小型モデルでも7Bまたは13Bのパラメータを持つ大型モデルと同等に動作することができる。
論文参考訳（メタデータ） (2024-07-28T06:10:47Z)
TableLLM: Enabling Tabular Data Manipulation by LLMs in Real Office Usage Scenarios [51.66718740300016]
TableLLMは80億のパラメータを持つ堅牢な大規模言語モデル(LLM)である。 TableLLMはデータ操作タスクを巧みに扱うために構築されている。我々は、ユーザインタラクションのためのモデルチェックポイント、ソースコード、ベンチマーク、Webアプリケーションをリリースした。
論文参考訳（メタデータ） (2024-03-28T11:21:12Z)
Deep Learning with Tabular Data: A Self-supervised Approach [0.0]
本研究では,自己指導型学習手法を用いた。目的は、分類的特徴と数値的特徴の最も効果的なTabTransformerモデル表現を見つけることである。この研究は、TabTransformerモデルの様々なバリエーションを作成することによって、新しいアプローチを提示している。
論文参考訳（メタデータ） (2024-01-26T23:12:41Z)
MambaTab: A Plug-and-Play Model for Learning Tabular Data [13.110156202816112]
本研究は,表データに対する構造化状態空間モデル(SSM)であるMambaTabに基づく革新的なアプローチを導入する。 MambaTabは、さまざまなベンチマークデータセットで実証的に検証されるように、パラメータを著しく少なくしながら、優れたパフォーマンスを提供する。
論文参考訳（メタデータ） (2024-01-16T22:44:12Z)
TAP4LLM: Table Provider on Sampling, Augmenting, and Packing Semi-structured Data for Large Language Model Reasoning [55.33939289989238]
テーブルベースタスクにおいて,大規模言語モデル(LLM)を効果的に活用するための汎用プリプロセッサスイートとして,TAP4LLMを提案する。 1)大きなテーブルをクエリセマンティクスに基づいて管理可能なサブテーブルに分解するテーブルサンプリング、(2)外部ソースやモデルから追加の知識でテーブルを拡張するテーブル拡張、(3)テーブルパッキングとシリアライゼーションによりテーブルをLLMの理解に適したさまざまなフォーマットに変換する。
論文参考訳（メタデータ） (2023-12-14T15:37:04Z)
Training-Free Generalization on Heterogeneous Tabular Data via Meta-Representation [67.30538142519067]
メタ表現(TabPTM)を用いたタブラルデータ事前学習を提案する。深層ニューラルネットワークは、これらのメタ表現とデータセット固有の分類信頼度を関連付けるように訓練される。実験により、TabPTMは、数ショットのシナリオであっても、新しいデータセットで有望なパフォーマンスを達成することを確認した。
論文参考訳（メタデータ） (2023-10-31T18:03:54Z)
UniTabE: A Universal Pretraining Protocol for Tabular Foundation Model in Data Science [16.384705926693073]
本研究は,データサイエンスにおける表上での予測を容易にするために,事前学習方法論の能力を拡張することを目的とする。テーブルを一様に処理するために設計されたUniTabEは、特定のテーブル構造によって課される制約を無視する。プレトレーニングフェーズを実装するため,Kaggleプラットフォームから正確に収集した約13Bサンプルからなる拡張データセットをキュレートした。
論文参考訳（メタデータ） (2023-07-18T13:28:31Z)
MinT: Boosting Generalization in Mathematical Reasoning via Multi-View Fine-Tuning [53.90744622542961]
数学領域における推論は、小言語モデル(LM)にとって重要な課題である。多様なアノテーションスタイルで既存の数学的問題データセットを利用する新しい手法を提案する。実験結果から,LLaMA-7Bモデルが先行手法より優れていることが示された。
論文参考訳（メタデータ） (2023-07-16T05:41:53Z)
Language models are weak learners [71.33837923104808]
本研究では,プロンプトベースの大規模言語モデルは弱い学習者として効果的に動作可能であることを示す。これらのモデルをブースティングアプローチに組み込むことで、モデル内の知識を活用して、従来のツリーベースのブースティングよりも優れています。結果は、プロンプトベースのLLMが、少数の学習者だけでなく、より大きな機械学習パイプラインのコンポーネントとして機能する可能性を示している。
論文参考訳（メタデータ） (2023-06-25T02:39:19Z)
PTab: Using the Pre-trained Language Model for Modeling Tabular Data [5.791972449406902]
近年の研究では、ニューラルネットワークモデルがタブラルデータの文脈表現の学習に有効であることが示されている。本稿では,事前学習言語モデルを用いて,タブラルデータをモデル化する新しいフレームワークPTabを提案する。提案手法は,最先端のベースラインに比べて,教師付き設定における平均AUCスコアが向上した。
論文参考訳（メタデータ） (2022-09-15T08:58:42Z)
The GatedTabTransformer. An enhanced deep learning architecture for tabular modeling [0.0]
そこで本研究では,従来のTabTransformerのバイナリ分類タスクの改良について述べる。ゲートにインスパイアされた線形射影はブロック内に実装され、複数のアクティベーション関数がテストされる。
論文参考訳（メタデータ） (2022-01-01T14:52:04Z)
Prototypical Contrastive Learning of Unsupervised Representations [171.3046900127166]
原型コントラスト学習(Prototypeal Contrastive Learning, PCL)は、教師なし表現学習法である。 PCLは暗黙的にデータのセマンティック構造を学習された埋め込み空間にエンコードする。 PCLは、複数のベンチマークで最先端のインスタンスワイド・コントラスト学習法より優れている。
論文参考訳（メタデータ） (2020-05-11T09:53:36Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。