論文の概要: TabStruct: Measuring Structural Fidelity of Tabular Data
- arxiv url: http://arxiv.org/abs/2509.11950v1
- Date: Mon, 15 Sep 2025 14:08:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-16 17:26:23.326989
- Title: TabStruct: Measuring Structural Fidelity of Tabular Data
- Title(参考訳): TabStruct: 語彙データの構造的忠実度の測定
- Authors: Xiangjian Jiang, Nikola Simidjievski, Mateja Jamnik,
- Abstract要約: 我々は,地中構造が存在しない場合でも,構造的忠実度を評価するための新しい評価指標である$textbfglobal utility$を導入する。
また、すべてのデータセット、評価パイプライン、生の結果を含むTabStructベンチマークスイートも提示します。
- 参考スコア(独自算出の注目度): 28.606994119562163
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Evaluating tabular generators remains a challenging problem, as the unique causal structural prior of heterogeneous tabular data does not lend itself to intuitive human inspection. Recent work has introduced structural fidelity as a tabular-specific evaluation dimension to assess whether synthetic data complies with the causal structures of real data. However, existing benchmarks often neglect the interplay between structural fidelity and conventional evaluation dimensions, thus failing to provide a holistic understanding of model performance. Moreover, they are typically limited to toy datasets, as quantifying existing structural fidelity metrics requires access to ground-truth causal structures, which are rarely available for real-world datasets. In this paper, we propose a novel evaluation framework that jointly considers structural fidelity and conventional evaluation dimensions. We introduce a new evaluation metric, $\textbf{global utility}$, which enables the assessment of structural fidelity even in the absence of ground-truth causal structures. In addition, we present $\textbf{TabStruct}$, a comprehensive evaluation benchmark offering large-scale quantitative analysis on 13 tabular generators from nine distinct categories, across 29 datasets. Our results demonstrate that global utility provides a task-independent, domain-agnostic lens for tabular generator performance. We release the TabStruct benchmark suite, including all datasets, evaluation pipelines, and raw results. Code is available at https://github.com/SilenceX12138/TabStruct.
- Abstract(参考訳): 不均一な表型データに先立つユニークな因果構造は、直感的な人間の検査に役立たないため、表型生成物の評価は依然として難しい問題である。
最近の研究は、合成データが実データの因果構造に適合するかどうかを評価するために、表層特異的評価次元として構造的忠実性を導入している。
しかし、既存のベンチマークでは構造的忠実度と従来の評価次元との相互作用を無視することが多く、モデル性能の全体的な理解は得られない。
さらに、それらは通常、おもちゃのデータセットに限られる。既存の構造的忠実度を定量化するためには、現実世界のデータセットではめったに利用できない、地道的な因果構造にアクセスする必要がある。
本稿では,構造的忠実度と従来の評価次元を両立させる新しい評価枠組みを提案する。
我々は, 地中構造が存在しない場合でも, 構造的忠実度を評価できる新しい評価指標, $\textbf{global utility}$を導入する。
さらに、9つの異なるカテゴリから13個のタブ状ジェネレータを29個のデータセットで大規模に定量的に分析する総合評価ベンチマークである$\textbf{TabStruct}$を提示した。
この結果から,グローバルユーティリティはタスクに依存しない,ドメインに依存しない,タブ状ジェネレータの性能を実現する。
すべてのデータセット、評価パイプライン、生の結果を含むTabStructベンチマークスイートをリリースしました。
コードはhttps://github.com/SilenceX12138/TabStruct.comから入手できる。
関連論文リスト
- Structural Equation-VAE: Disentangled Latent Representations for Tabular Data [4.101599614979332]
可変オートエンコーダの設計に直接測定構造を組み込む新しいアーキテクチャであるSE-VAE(Structural Equation-Variational Autoencoder)を導入する。
構造方程式モデリングにインスパイアされたSE-VAEは、潜在部分空間を既知の指標群と整列させ、構造特異的な共役変異を分離するために大域的ニュアンスラデントを導入する。
SE-VAEは、係数回復、解釈可能性、およびニュアンス変動に対する堅牢性において、オルタナティブよりも一貫して優れている。
論文 参考訳(メタデータ) (2025-08-08T14:21:20Z) - AlphaFold Database Debiasing for Robust Inverse Folding [58.792020809180336]
Debiasing Structure AutoEncoder (DeSAE)を導入し、故意に破損したバックボーンジオメトリからネイティブライクなコンフォーメーションを再構築することを学ぶ。
推測において、DeSAEをAFDB構造に適用すると、逆折り畳み性能を著しく向上する偏りのある構造が生成される。
論文 参考訳(メタデータ) (2025-06-10T02:25:31Z) - How Well Does Your Tabular Generator Learn the Structure of Tabular Data? [10.974400005358193]
本稿では,構造忠実度をコア評価次元として位置づける新しい評価ベンチマークであるTabStructを紹介する。
構造的忠実度はタスクに依存しないドメインに依存しない評価次元を提供することを示す。
論文 参考訳(メタデータ) (2025-03-12T14:54:58Z) - StructTest: Benchmarking LLMs' Reasoning through Compositional Structured Outputs [78.84060166851805]
StructTestは、大規模な言語モデル(LLM)を合成命令に従って構造化出力を生成する能力に基づいて評価する、新しいベンチマークである。
評価はルールベースの評価器を用いて決定的に行われ、新しいタスクやデータセットに容易に拡張できる。
StructTestは、Deepseek-V3/R1やGPT-4oといったトップパフォーマンスモデルでも、依然として難しいままです。
論文 参考訳(メタデータ) (2024-12-23T22:08:40Z) - Structural Entropy Guided Probabilistic Coding [52.01765333755793]
構造エントロピー誘導型確率的符号化モデルSEPCを提案する。
我々は、構造エントロピー正規化損失を提案することにより、潜在変数間の関係を最適化に組み込む。
分類タスクと回帰タスクの両方を含む12の自然言語理解タスクに対する実験結果は、SEPCの優れた性能を示す。
論文 参考訳(メタデータ) (2024-12-12T00:37:53Z) - Structured Evaluation of Synthetic Tabular Data [6.418460620178983]
タブラルデータは一般的には不完全であり、ボリュームは小さく、プライバシー上の懸念からアクセス制限されている。
本稿では,観測データと同じ分布から合成データを抽出すべきと仮定した,単一の数学的目的を持つ評価フレームワークを提案する。
深層学習を利用した構造情報型シンセサイザーとシンセサイザーの評価を行った。
論文 参考訳(メタデータ) (2024-03-15T15:58:37Z) - Deconstructing Self-Supervised Monocular Reconstruction: The Design
Decisions that Matter [63.5550818034739]
本稿では,自己教師付き単分子深度推定への最先端の貢献を評価するための枠組みを提案する。
事前トレーニング、バックボーン、アーキテクチャ設計の選択、損失関数が含まれる。
我々は16の最先端コントリビューションを再実装し、検証し、再評価し、新しいデータセットを導入します。
論文 参考訳(メタデータ) (2022-08-02T14:38:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。