論文の概要: Evaluating Inter-Column Logical Relationships in Synthetic Tabular Data Generation
- arxiv url: http://arxiv.org/abs/2502.04055v1
- Date: Thu, 06 Feb 2025 13:13:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-07 14:31:55.111798
- Title: Evaluating Inter-Column Logical Relationships in Synthetic Tabular Data Generation
- Title(参考訳): 合成語彙データ生成におけるカラム間論理的関係の評価
- Authors: Yunbo Long, Liming Xu, Alexandra Brintrup,
- Abstract要約: 本稿では,論理的関係の保存性を評価するための3つの評価指標を提案する。
実世界の産業データセット上での古典的手法と最先端の手法の両方の性能を評価することにより,これらの指標を検証する。
- 参考スコア(独自算出の注目度): 49.898152180805454
- License:
- Abstract: Current evaluations of synthetic tabular data mainly focus on how well joint distributions are modeled, often overlooking the assessment of their effectiveness in preserving realistic event sequences and coherent entity relationships across columns.This paper proposes three evaluation metrics designed to assess the preservation of logical relationships among columns in synthetic tabular data. We validate these metrics by assessing the performance of both classical and state-of-the-art generation methods on a real-world industrial dataset.Experimental results reveal that existing methods often fail to rigorously maintain logical consistency (e.g., hierarchical relationships in geography or organization) and dependencies (e.g., temporal sequences or mathematical relationships), which are crucial for preserving the fine-grained realism of real-world tabular data. Building on these insights, this study also discusses possible pathways to better capture logical relationships while modeling the distribution of synthetic tabular data.
- Abstract(参考訳): 本報告では, 合成表形式データにおける列間の論理的関係の保存性を評価するための3つの評価指標を提案する。
実験結果から,従来の手法では論理的整合性(地理や組織における階層的関係)と依存性(時間的シーケンス,数学的関係など)を厳格に維持できないことが判明した。
これらの知見に基づいて、合成表データの分布をモデル化しながら、論理的関係をよりよく捉えるための経路についても論じる。
関連論文リスト
- Benchmarking the Fidelity and Utility of Synthetic Relational Data [1.024113475677323]
我々は、関係データ合成、共通ベンチマークデータセット、および合成データの忠実性と有用性を測定するためのアプローチに関する関連研究についてレビューする。
ベストプラクティスと、新しい堅牢な検出アプローチをベンチマークツールに組み合わせて、6つのメソッドを比較します。
実用面では、モデル予測性能と特徴量の両方において、実データと合成データの適度な相関が観察されるのが一般的である。
論文 参考訳(メタデータ) (2024-10-04T13:23:45Z) - Preserving logical and functional dependencies in synthetic tabular data [0.0]
本稿では,属性間の論理的依存関係の概念を紹介する。
また、表データの属性間の論理的依存関係を定量化する尺度も提供します。
現在利用可能な合成データ生成アルゴリズムは、合成データセットを生成する際に、機能的依存関係を完全に保存していないことを実証する。
論文 参考訳(メタデータ) (2024-09-26T09:51:07Z) - Reliability in Semantic Segmentation: Can We Use Synthetic Data? [69.28268603137546]
セマンティックセグメンテーションモデルの現実的信頼性を総合的に評価するために、合成データを具体的に生成する方法を初めて示す。
この合成データは、事前訓練されたセグメンタの堅牢性を評価するために使用される。
セグメンタのキャリブレーションとOOD検出能力を向上するために,我々のアプローチをどのように活用できるかを実証する。
論文 参考訳(メタデータ) (2023-12-14T18:56:07Z) - Learning Complete Topology-Aware Correlations Between Relations for Inductive Link Prediction [121.65152276851619]
関係性間の意味的相関は本質的にエッジレベルとエンティティ非依存であることを示す。
本研究では,関係関係のトポロジ・アウェア・コレレーションをモデル化するための新しいサブグラフベース手法,TACOを提案する。
RCNのポテンシャルをさらに活用するために, 完全コモンニアインダストリアルサブグラフを提案する。
論文 参考訳(メタデータ) (2023-09-20T08:11:58Z) - Generating Realistic Synthetic Relational Data through Graph Variational
Autoencoders [47.89542334125886]
変動型オートエンコーダフレームワークとグラフニューラルネットワークを組み合わせることで,リアルな合成関係データベースを生成する。
結果は、実際のデータベースの構造が結果の合成データセットに正確に保存されていることを示している。
論文 参考訳(メタデータ) (2022-11-30T10:40:44Z) - On Neural Architecture Inductive Biases for Relational Tasks [76.18938462270503]
合成ネットワーク一般化(CoRelNet)と呼ばれる類似度分布スコアに基づく簡単なアーキテクチャを導入する。
単純なアーキテクチャの選択は、分布外一般化において既存のモデルより優れていることが分かる。
論文 参考訳(メタデータ) (2022-06-09T16:24:01Z) - Realistic Counterfactual Explanations by Learned Relations [0.0]
本稿では,データ属性間の関係を保存した現実的対実的説明に対する新しいアプローチを提案する。
モデルはドメイン知識のない変分自動エンコーダによって関係を直接学習し、それに従って潜伏空間を乱すことを学習する。
論文 参考訳(メタデータ) (2022-02-15T12:33:51Z) - Link Prediction on N-ary Relational Data Based on Relatedness Evaluation [61.61555159755858]
我々は,n-aryリレーショナルデータ上でリンク予測を行うNaLPという手法を提案する。
各 n 個の関係事実を、その役割と役割と値のペアの集合として表現する。
実験結果は,提案手法の有効性と有用性を検証した。
論文 参考訳(メタデータ) (2021-04-21T09:06:54Z) - Mining Feature Relationships in Data [0.0]
特徴関係マイニング(FRM)は、データの連続的または分類的特徴間の象徴的関係を自動的に発見する遺伝的プログラミング手法である。
提案手法は,特徴間の関係を明確に発見することを目的とした,最初の象徴的アプローチである。
実世界の様々なデータセットに対する実証テストにより、提案手法は高品質で単純な特徴関係を見つけることができることを示した。
論文 参考訳(メタデータ) (2021-02-02T07:06:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。