論文の概要: Foundation Models for Tabular Data within Systemic Contexts Need Grounding
- arxiv url: http://arxiv.org/abs/2505.19825v1
- Date: Mon, 26 May 2025 11:02:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-27 16:58:43.374312
- Title: Foundation Models for Tabular Data within Systemic Contexts Need Grounding
- Title(参考訳): 体系的文脈における語彙データの基盤モデル
- Authors: Tassilo Klein, Johannes Hoffart,
- Abstract要約: 本稿では,表が宣言的および手続き的操作知識の両方に本質的に結びついていることを認識し,SLT(Semantically Linked Tables)の概念を紹介した。
本稿では,FMSLT(Foundation Models for Semantically Linked Tables)を提案する。
- 参考スコア(独自算出の注目度): 9.820997523824676
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Current research on tabular foundation models often overlooks the complexities of large-scale, real-world data by treating tables as isolated entities and assuming information completeness, thereby neglecting the vital operational context. To address this, we introduce the concept of Semantically Linked Tables (SLT), recognizing that tables are inherently connected to both declarative and procedural operational knowledge. We propose Foundation Models for Semantically Linked Tables (FMSLT), which integrate these components to ground tabular data within its true operational context. This comprehensive representation unlocks the full potential of machine learning for complex, interconnected tabular data across diverse domains. Realizing FMSLTs requires access to operational knowledge that is often unavailable in public datasets, highlighting the need for close collaboration between domain experts and researchers. Our work exposes the limitations of current tabular foundation models and proposes a new direction centered on FMSLTs, aiming to advance robust, context-aware models for structured data.
- Abstract(参考訳): 表形式の基礎モデルに関する現在の研究は、テーブルを独立したエンティティとして扱い、情報の完全性を仮定することで、大規模な実世界のデータの複雑さを見落とし、重要な運用状況を無視していることが多い。
そこで我々は,表が宣言的および手続き的操作知識の両方に本質的に結びついていることを認識し,SLT(Semantically Linked Tables)の概念を紹介した。
本稿では,これらのコンポーネントを統合したFMSLT(Foundation Models for Semantically Linked Tables)を提案する。
この包括的な表現は、さまざまなドメインにまたがる複雑な相互接続された表データに対して、機械学習の潜在能力を最大限に活用する。
FMSLTを実現するには、パブリックデータセットでは利用できない運用知識へのアクセスが必要であり、ドメインの専門家と研究者の緊密なコラボレーションの必要性を強調している。
本研究は, 現状の表層基盤モデルの限界を明らかにするとともに, FMSLTを中心にした新たな方向性を提案する。
関連論文リスト
- Representation Learning for Tabular Data: A Comprehensive Survey [23.606506938919605]
行と列として構造化されたタブラルデータは、機械学習の分類と回帰アプリケーションにおいて最も一般的なデータタイプの一つである。
ディープニューラルネットワーク(DNN)は、最近、表現学習の能力を通じて有望な結果を実証した。
既存の手法を一般化能力に応じて3つの主要なカテゴリに分類する。
論文 参考訳(メタデータ) (2025-04-17T17:58:23Z) - LLM-TabFlow: Synthetic Tabular Data Generation with Inter-column Logical Relationship Preservation [49.898152180805454]
本研究は,合成表型データ生成におけるカラム間関係の保存について,初めて明示的に検討したものである。
LLM-TabFlowは複雑なカラム間関係と圧縮データをキャプチャする新しい手法であり、Score-based Diffusion を用いて遅延空間における圧縮データの分布をモデル化する。
LLM-TabFlowは、カラム間の関係を完全に保ちながら、データの忠実性、ユーティリティ、プライバシの最良のバランスを保ちながら、すべてのベースラインを上回ります。
論文 参考訳(メタデータ) (2025-03-04T00:47:52Z) - SALT: Sales Autocompletion Linked Business Tables Dataset [7.036380633387952]
エンタープライズリソースプランニング(ERP)システムから得られたキュレートされたデータセットを導入し、広範囲にリンクされたテーブルを特徴とする。
私たちのゴールは、現実世界のビジネスコンテキストにおけるモデルの有効性と適用性を高めることです。
論文 参考訳(メタデータ) (2025-01-06T22:20:02Z) - Knowledge-Aware Reasoning over Multimodal Semi-structured Tables [85.24395216111462]
本研究では、現在のAIモデルがマルチモーダルな構造化データに基づいて知識を考慮した推論を行うことができるかどうかを検討する。
この目的のために設計された新しいデータセットであるMMTabQAを紹介する。
我々の実験は、複数のテキストと画像の入力を効果的に統合し解釈する上で、現在のAIモデルに対する重大な課題を浮き彫りにしている。
論文 参考訳(メタデータ) (2024-08-25T15:17:43Z) - Synthesizing Realistic Data for Table Recognition [4.500373384879752]
本稿では,テーブル認識に特化して設計されたアノテーションデータを合成する手法を提案する。
中国の金融発表から表の構造と内容を活用することで、我々は最初の広範囲な表アノテーションデータセットを開発した。
我々は、中国の金融発表領域における実世界の複合表の初歩的ベンチマークを確立し、このベンチマークを用いて、我々の合成データに基づいてトレーニングされたモデルの性能を評価する。
論文 参考訳(メタデータ) (2024-04-17T06:36:17Z) - TAP4LLM: Table Provider on Sampling, Augmenting, and Packing Semi-structured Data for Large Language Model Reasoning [55.33939289989238]
テーブルベースタスクにおいて,大規模言語モデル(LLM)を効果的に活用するための汎用プリプロセッサスイートとして,TAP4LLMを提案する。
1)大きなテーブルをクエリセマンティクスに基づいて管理可能なサブテーブルに分解するテーブルサンプリング、(2)外部ソースやモデルから追加の知識でテーブルを拡張するテーブル拡張、(3)テーブルパッキングとシリアライゼーションによりテーブルをLLMの理解に適したさまざまなフォーマットに変換する。
論文 参考訳(メタデータ) (2023-12-14T15:37:04Z) - Serving Deep Learning Model in Relational Databases [70.53282490832189]
リレーショナルデータ上での深層学習(DL)モデルの実現は、様々な商業分野や科学分野において重要な要件となっている。
最先端のDL中心アーキテクチャは、DL計算を専用のDLフレームワークにオフロードします。
UDF中心アーキテクチャの可能性は、リレーショナルデータベース管理システム(RDBMS)内の1つ以上のテンソル計算をユーザ定義関数(UDF)にカプセル化する。
論文 参考訳(メタデータ) (2023-10-07T06:01:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。