論文の概要: Generating Logically Consistent Synthetic Supply Chain Data with LLM-Driven Knowledge Graph Reasoning
- arxiv url: http://arxiv.org/abs/2605.26823v1
- Date: Tue, 26 May 2026 10:41:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-27 17:51:41.886921
- Title: Generating Logically Consistent Synthetic Supply Chain Data with LLM-Driven Knowledge Graph Reasoning
- Title(参考訳): LLM-Driven Knowledge Graph Reasoning を用いた論理的一貫性を有する合成チェーンデータの生成
- Authors: Yunbo Long, Ge Zheng, Liming Xu, Alexandra Brintrup,
- Abstract要約: 本稿では,論理的に一貫した合成サプライチェーンデータ生成のための知識グラフ誘導フレームワークであるtextbftextitTabKGを紹介する。
- 参考スコア(独自算出の注目度): 51.78065387034195
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Synthetic data offers a promising solution to two persistent barriers in supply chain analytics: data scarcity and data privacy. However, for synthetic data to support operational simulation and decision-making, it must do more than reproduce the statistical distributions of real records, and also preserve the \emph{operational logic} that governs supply chain processes, including the temporal orderings, mathematical dependencies, hierarchical taxonomies, and conditional rules that make a record operationally plausible. We consider this logic as the ``physics'' of supply chain data. Existing tabular generative models are primarily optimized for distributional fidelity and downstream predictive utility, and therefore often generate records that appear statistically realistic but violate fundamental operational constraints. This paper introduces \textbf{\textit{TabKG}}, a knowledge-graph-guided framework for logically consistent synthetic supply chain tabular data generation. TabKG constructs a \textbf{\textit{Column Relationship Knowledge Graph (CR-KG)}} to represent data operational dependencies. It uses a multi-LLM ensemble with majority voting to propose candidate relationships from column metadata, validates these relationships against real data to remove hallucinated or unsupported edges, and then uses the validated CR-KG to guide generation. Specifically, TabKG compresses the original table into independent columns, generates these columns using a latent diffusion model, and deterministically reconstructs dependent columns according to the validated relationships, enforcing logical consistency by construction with respect to the discovered operational rules.
- Abstract(参考訳): 合成データは、サプライチェーン分析における2つの永続的障壁(データ不足とデータプライバシ)に対して、有望なソリューションを提供する。
しかし、運用シミュレーションと意思決定を支援するために、実際のレコードの統計分布を再現する以上のことをしなければならず、また、時間的順序付け、数学的依存関係、階層的分類、そして運用上妥当な記録を作る条件規則を含むサプライチェーンプロセスを管理する 'emph{operational logic' を保持する必要がある。
我々はこの論理をサプライチェーンデータの「物理」とみなす。
既存の表生成モデルは、主に分布の忠実さと下流予測ユーティリティに最適化されており、統計学的に現実的に見えるが基本的な操作上の制約に反するレコードを生成することが多い。
本稿では、論理的に一貫した合成サプライチェーン表データ生成のための知識グラフ誘導フレームワークである「textbf{\textit{TabKG}}」を紹介する。
TabKGは、データ操作の依存関係を表すために、 \textbf{\textit{Column Relationship Knowledge Graph (CR-KG)}} を構築する。
多数決によるマルチLLMアンサンブルを使用して、列メタデータから候補関係を提案し、これらの関係を実データに対して検証し、幻覚的または無作為的エッジを除去し、検証されたCR-KGを使用して生成をガイドする。
具体的には、TabKGは元のテーブルを独立した列に圧縮し、遅延拡散モデルを用いてこれらの列を生成し、検証された関係に従って依存列を決定論的に再構成し、発見された操作規則に関して論理的整合性を持たせる。
関連論文リスト
- TabSCM: A practical Framework for Generating Realistic Tabular Data [22.41489215805826]
因果依存性を保存する混合型ジェネレータであるTabSCMを提案する。
7つの公開データセットでは、TabSCMは最先端のGAN、拡散、LLMベースラインを統計的忠実度で一致または超えている。
生成は明示的な方程式に分解されるので、拡散のみのモデルよりも583$times$高速に実行される。
論文 参考訳(メタデータ) (2026-04-24T08:10:01Z) - RelDiff: Relational Data Generative Modeling with Graph-Based Diffusion Models [83.6013616017646]
RelDiffは、外部キーグラフ構造を明示的にモデル化することによって完全な関係データベースを合成する新しい拡散生成モデルである。
RelDiffは、現実的で一貫性のある合成リレーショナルデータベースの作成において、従来手法よりも一貫して優れている。
論文 参考訳(メタデータ) (2025-05-31T21:01:02Z) - LLM-TabLogic: Preserving Inter-Column Logical Relationships in Synthetic Tabular Data via Prompt-Guided Latent Diffusion [49.898152180805454]
合成データセットはドメイン固有の論理的一貫性を維持する必要がある。
既存の生成モデルは、しばしばこれらのカラム間の関係を見落としている。
本研究では,ドメイン知識を必要とせずに列間関係を効果的に維持する手法を提案する。
論文 参考訳(メタデータ) (2025-03-04T00:47:52Z) - Evaluating Inter-Column Logical Relationships in Synthetic Tabular Data Generation [49.898152180805454]
本稿では,論理的関係の保存性を評価するための3つの評価指標を提案する。
実世界の産業データセット上での古典的手法と最先端の手法の両方の性能を評価することにより,これらの指標を検証する。
論文 参考訳(メタデータ) (2025-02-06T13:13:26Z) - Disentanglement via Latent Quantization [60.37109712033694]
本研究では,組織化された潜在空間からの符号化と復号化に向けた帰納的バイアスを構築する。
本稿では,基本データレコーダ (vanilla autoencoder) と潜時再構成 (InfoGAN) 生成モデルの両方に追加することで,このアプローチの広範な適用性を実証する。
論文 参考訳(メタデータ) (2023-05-28T06:30:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。