論文の概要: Schema-Agnostic Process Trace Construction: From Raw Tables to Execution Behavior
- arxiv url: http://arxiv.org/abs/2606.14775v1
- Date: Wed, 10 Jun 2026 02:09:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-23 13:48:30.798669
- Title: Schema-Agnostic Process Trace Construction: From Raw Tables to Execution Behavior
- Title(参考訳): スキーマ非依存プロセストレース構築:生テーブルから実行行動へ
- Authors: Joel Lim Zhi Quan, Tan Kar Way, Lau Hoong Chuin,
- Abstract要約: 本稿では,生データから直接実行トレースを再構築するパイプラインを提案する。
パイプラインはキーやタイムスタンプのように機能する列を特定し、テーブルからテーブルへの接続を検出する。
パイプラインは,高忠実度事象のトレースと正確なトレース順序を再構築し,次の事象を85%の精度で正確に予測し,地中信頼関係の約82%を回復することを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Traditional information systems (IS) engineering assumes stable schemas, explicit keys, and curated event logs. In modern OLTP environments, schemas drift, keys are sparse, and execution traces are dispersed across loosely connected tables, making manual process trace construction costly and error prone. We propose a schema-agnostic pipe-line that automatically reconstructs process execution traces directly from raw relational data. The pipeline (i) identifies columns that function like keys or timestamps, (ii) discovers table-to-table connections using statistical signals rather than predefined schemas, (iii) assembles and orders events for each case while accommodating multiple date fields, and (iv) learns likely ordering and flow relations across systems using a Temporal Convolutional Network which models long-range dependencies and patterns. Evaluations on TPC-H/E benchmarks, synthetic corpora, and a real industry dataset show that our pipeline reconstructs high-fidelity event traces and accurate trace orderings, correctly predicting the next event with 85% accuracy and recovering about 82% of ground-truth precedence relations. By eliminating dependence on predefined schemas, ER diagrams and domain templates, our work offers a generalizable and scalable pathway for automated reconstruction of execution behaviour in dynamic and continuously evolving IS environments.
- Abstract(参考訳): 従来の情報システム(IS)エンジニアリングは、安定したスキーマ、明示的なキー、キュレートされたイベントログを前提としている。
現代のOLTP環境では、スキーマがドリフトし、キーがスパースになり、実行トレースがゆるく接続されたテーブルに分散し、手作業によるプロセストレースの構築がコストがかかりエラーが発生しやすい。
本稿では,プロセス実行トレースを生のリレーショナルデータから直接自動的に再構築する,スキーマに依存しないパイプラインを提案する。
パイプライン
i)キーやタイムスタンプのように機能する列を識別する。
(II)事前定義されたスキーマではなく統計信号を用いてテーブル間接続を発見する。
三 複数日付フィールドを併設しつつ、各事件のイベントを組み立てて注文すること。
(iv) 長距離依存関係とパターンをモデル化した時間畳み込みネットワークを用いて、システム間の順序付けとフロー関係を学習する。
TPC-H/Eベンチマーク, 合成コーパス, 実業界データセットによる評価から, パイプラインは高忠実度事象のトレースと正確なトレース順序を再構築し, 85%の精度で次の事象を正確に予測し, 地中信頼関係の約82%を回復することを示した。
事前定義されたスキーマやER図、ドメインテンプレートへの依存をなくすことで、動的かつ継続的な進化するIS環境における実行動作の自動再構築のための一般化可能かつスケーラブルな経路を提供する。
関連論文リスト
- Executable Schema Contracts: From Automatic Ingestion to Multi-Source Retrieval [19.3757623473603]
実世界のデータは、暗黙のセマンティクスを持つテーブル、ドキュメント、半構造化ファイルにまたがる。
生のマルチソースデータから実行可能なスキーマを自動的に検出するシステムを提案する。
論文 参考訳(メタデータ) (2026-06-03T20:28:36Z) - Generating Logically Consistent Synthetic Supply Chain Data with LLM-Driven Knowledge Graph Reasoning [51.78065387034195]
本稿では,論理的に一貫した合成サプライチェーンデータ生成のための知識グラフ誘導フレームワークであるtextbftextitTabKGを紹介する。
論文 参考訳(メタデータ) (2026-05-26T10:41:37Z) - ProfiliTable: Profiling-Driven Tabular Data Processing via Agentic Workflows [17.525508735432147]
ProfiliTableは動的プロファイリングを中心とした自律型マルチエージェントフレームワークである。
インタラクティブな探索、知識強化された合成、フィードバック駆動の洗練を通じて、統合された実行コンテキストを構築し、反復的に洗練する。
論文 参考訳(メタデータ) (2026-05-12T16:42:38Z) - Agentic DAG-Orchestrated Planner Framework for Multi-Modal, Multi-Hop Question Answering in Hybrid Data Lakes [5.276278723196607]
Agentic DAG-Orchestrated Transformer (A.DOT) Plannerはマルチモーダル・マルチホップ質問応答のためのフレームワークである。
A.DOTは、ユーザNLクエリを構造化および非構造化の両方にまたがる有向非巡回グラフ(DAG)実行計画にコンパイルする。
System Decomposes query into parallelizable sub-queries, includess schema-aware reasoning, and applied both structure and semantic validation。
論文 参考訳(メタデータ) (2026-03-15T05:34:16Z) - Autonomous Data Processing using Meta-Agents [2.3732259124656907]
我々はメタエージェント(ADP-MA)を用いたtextbf Autonomous Data Processingを提案し,データ処理パイプラインを動的に構築し,実行し,反復的に洗練するフレームワークを提案する。
ADP-MAは、コンテキスト対応の最適化、適応的なワークロード分割、拡張性のためのプログレッシブサンプリングを強調している。
ADP-MAはパイプライン構築、実行監視、代表データ処理タスク間の適応的な改善を示すインタラクティブなデモを通じてデモを行う。
論文 参考訳(メタデータ) (2026-01-30T20:58:17Z) - Relational Transformer: Toward Zero-Shot Foundation Models for Relational Data [38.656987194921854]
Transformer (RT) アーキテクチャは、様々なリレーショナルデータベース上で事前トレーニングすることができる。
RTは強いゼロショットを破り、バイナリ分類タスクにおいて、完全に教師されたAUROCの93%を平均化する。
論文 参考訳(メタデータ) (2025-10-07T18:51:51Z) - A Pre-training Framework for Relational Data with Information-theoretic Principles [57.93973948947743]
本稿では,リレーショナルグラフ上の集合に基づくアグリゲーションを通じて,監視信号を構成する新しい事前学習フレームワークであるTask Vector Estimation (TVE)を紹介する。
TVEは従来のトレーニング前のベースラインを一貫して上回っている。
本研究は,関係データベース上での予測モデルの設計原則として,タスクの不均一性と時間構造を符号化する事前学習目的を提唱する。
論文 参考訳(メタデータ) (2025-07-14T00:17:21Z) - Leveraging Machine Learning and Enhanced Parallelism Detection for BPMN Model Generation from Text [75.77648333476776]
本稿では、テキストからBPMNモデルを抽出する自動パイプラインについて紹介する。
この研究の重要な貢献は、新たに注釈付けされたデータセットの導入である。
モデルトレーニング用の32のパラレルゲートウェイを含む15の注釈付き文書でデータセットを増強する。
論文 参考訳(メタデータ) (2025-07-11T07:25:55Z) - RelDiff: Relational Data Generative Modeling with Graph-Based Diffusion Models [83.6013616017646]
RelDiffは、外部キーグラフ構造を明示的にモデル化することによって完全な関係データベースを合成する新しい拡散生成モデルである。
RelDiffは、現実的で一貫性のある合成リレーショナルデータベースの作成において、従来手法よりも一貫して優れている。
論文 参考訳(メタデータ) (2025-05-31T21:01:02Z) - Open-Domain Hierarchical Event Schema Induction by Incremental Prompting
and Verification [81.17473088621209]
イベントスキーマを,大規模言語モデル(LLM)から導出可能なコモンセンス知識の一形態として扱う。
複雑なイベントグラフの構築を3段階に分割するインクリメンタルなプロンプトおよび検証手法を設計する。
線形化グラフを生成するのにLLMを直接使用するのに比べ、時間関係が7.2%F1、階層関係が31.0%F1の大規模かつ複雑なスキーマを生成することができる。
論文 参考訳(メタデータ) (2023-07-05T01:00:44Z) - Proton: Probing Schema Linking Information from Pre-trained Language
Models for Text-to-SQL Parsing [66.55478402233399]
本稿では,ポアンカー距離測定に基づく探索手法を用いて,関係構造を抽出する枠組みを提案する。
スキーマリンクの一般的なルールベース手法と比較して,探索関係は意味的対応をしっかりと捉えることができることがわかった。
我々のフレームワークは3つのベンチマークで最先端のパフォーマンスを新たに設定する。
論文 参考訳(メタデータ) (2022-06-28T14:05:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。