論文の概要: Automated BPMN Model Generation from Textual Process Descriptions: A Multi-Stage LLM-Driven Approach
- arxiv url: http://arxiv.org/abs/2604.12105v1
- Date: Mon, 13 Apr 2026 22:26:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-15 19:11:32.145247
- Title: Automated BPMN Model Generation from Textual Process Descriptions: A Multi-Stage LLM-Driven Approach
- Title(参考訳): テキストプロセス記述からのBPMNモデルの自動生成:マルチステージLCM駆動アプローチ
- Authors: Ion Matei, Maksym Zhenirovskyy, Praveen Kumar Menaka Sekar, Hon Yung Wong,
- Abstract要約: 地上構造構築とモデル再構築の両方を自動化する,スケーラブルで多段階のLCM駆動パイプラインを提案する。
750の公開BPMNダイアグラムに関する実証的な研究で、パイプラインは387の検証済みの地下構造モデルを生成し、0.75以上の平均的な再構築類似性を達成した。
- 参考スコア(独自算出の注目度): 1.2109551561313707
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Automatically reconstructing BPMN models from unstructured natural-language descriptions remains challenging due to heterogeneous modeling conventions, multilingual sources, and the lack of reliable ground truth. We present a scalable, multi-stage LLM-driven pipeline that automates both ground-truth construction and model reconstruction. Multilingual BPMN XML files are translated into English, validated using execution-oriented compliance checks in SpiffWorkflow, and iteratively repaired through targeted LLM-guided corrections to produce a consistent ground-truth corpus. From these validated models, process descriptions are generated and used to reconstruct executable BPMN~2.0 XML diagrams without manual curation. We introduce a multi-dimensional similarity framework combining structural metrics, type-distribution alignment, and embedding-based semantic measures. In an empirical study of 750 public BPMN diagrams, the pipeline generated 387 validated ground-truth models and achieved average reconstruction similarity above 0.75, including approximately 50 near-perfect reconstructions differing only in minor naming variations. The results demonstrate that LLMs can generate structurally compliant and semantically meaningful BPMN diagrams at scale.
- Abstract(参考訳): 非構造化の自然言語記述からBPMNモデルを自動的に再構築することは、異種モデリングの慣習、多言語ソース、信頼性のある基礎的真実の欠如により、依然として困難である。
地上構造構築とモデル再構築の両方を自動化する,スケーラブルで多段階のLCM駆動パイプラインを提案する。
マルチリンガルなBPMN XMLファイルは英語に翻訳され、SpiffWorkflowで実行指向のコンプライアンスチェックを使用して検証され、ターゲットのLLM誘導修正を通じて反復的に修復され、一貫した基盤構造コーパスを生成する。
これらの検証されたモデルから、プロセス記述が生成され、手動のキュレーションなしで実行可能なBPMN~2.0 XMLダイアグラムを再構築するために使用されます。
本稿では,構造指標,型分布アライメント,埋め込み型セマンティック尺度を組み合わせた多次元類似性フレームワークを提案する。
750の公開BPMNダイアグラムに関する実証的研究で、パイプラインは387個の検証済みの地下構造モデルを生成し、0.75以上の平均的な再構築類似性を達成した。
結果は、LLMが構造的に準拠し、意味的に意味のあるBPMNダイアグラムを大規模に生成できることを示しています。
関連論文リスト
- DiffuRank: Effective Document Reranking with Diffusion Language Models [71.16830004674513]
拡散言語モデル(dLLM)に基づいて構築されたフレームワークであるDiffuRankを提案する。
dLLMは、左から右への順序に制約されないより柔軟なデコーディングと生成プロセスをサポートする。
モデルサイズが類似した自己回帰LDMに匹敵する性能を示す。
論文 参考訳(メタデータ) (2026-02-13T02:18:14Z) - Instruction-Tuning Open-Weight Language Models for BPMN Model Generation [0.0]
命令チューニングによって適応されたオープンウェイトな大規模言語モデルが高品質なBPMNプロセスモデルを生成することができるかどうかを検討する。
InstruBPMは、ペア化されたテキストダイアグラムデータを作成し、オープンソースの大規模言語モデルをチューニングする再現可能なアプローチである。
調整済みモデルと未調整のオープンウェイトベースラインと、一貫したプロンプトレジームの下で強力なプロプライエタリモデルを比較した。
論文 参考訳(メタデータ) (2025-12-12T22:07:51Z) - STED and Consistency Scoring: A Framework for Evaluating LLM Structured Output Reliability [11.095198847819573]
大規模言語モデル(LLM)は、構造化データ生成のためにますます多くデプロイされている。
LLM生成した構造化出力の整合性の評価と改善のための総合的なフレームワークを提案する。
論文 参考訳(メタデータ) (2025-11-27T02:49:52Z) - Ontology-Driven Model-to-Model Transformation of Workflow Specifications [0.8921166277011348]
Smart FormsやSmart Flowといったプロプライエタリな言語は、プロセスの知識をクローズドなフォーマットにロックするため、相互運用性と再利用を妨げる。
私たちは、ビジネスプロセスモデルと表記にドメイン固有の定義をサポートするオントロジー駆動のモデル・ツー・モデルパイプラインを導入します。
私たちは、Serior Técnico(IST)のSmart Forms & Smart Flowのためのパイプラインをインスタンス化し、標準準拠のBPMNダイアグラムを生成するコンバータを実装しました。
論文 参考訳(メタデータ) (2025-11-17T18:16:19Z) - LM4Opt-RA: A Multi-Candidate LLM Framework with Structured Ranking for Automating Network Resource Allocation [0.7933039558471408]
我々は,複雑な解析的および数学的推論タスクに,文脈的理解が不要であることに対処する。
既存のベンチマークデータセットは、動的な環境、変数、不均一な制約でそのような問題の複雑さに対処できない。
NL4RAは、LP、ILP、MILPとして定式化された50のリソース割り当て最適化問題からなるキュレートデータセットである。
次に,パラメータ数が異なるオープンソースのLLMの性能評価を行った。
論文 参考訳(メタデータ) (2025-11-13T23:19:43Z) - Beyond Isolated Dots: Benchmarking Structured Table Construction as Deep Knowledge Extraction [80.88654868264645]
Arranged and Organized extract Benchmarkは、断片化された文書を理解するための大規模言語モデルの能力を評価するために設計された。
AOEには3つの異なるドメインにまたがる11のタスクが含まれており、さまざまな入力クエリに適したコンテキスト固有のスキーマを生成するモデルが必要である。
結果は、最も先進的なモデルでさえ、かなり苦労したことを示している。
論文 参考訳(メタデータ) (2025-07-22T06:37:51Z) - SAFT: Structure-Aware Fine-Tuning of LLMs for AMR-to-Text Generation [50.277959544420455]
SAFTは、事前訓練された言語モデルにグラフトポロジーを注入する構造対応の微調整手法である。
変換されたAMRの磁気ラプラシアンから方向感応的な位置エンコーディングを計算する。
SAFTはAMR 3.0に新しい最先端を設定、ベースラインを3.5BLEU改善した。
論文 参考訳(メタデータ) (2025-07-15T18:12:57Z) - Leveraging Machine Learning and Enhanced Parallelism Detection for BPMN Model Generation from Text [75.77648333476776]
本稿では、テキストからBPMNモデルを抽出する自動パイプラインについて紹介する。
この研究の重要な貢献は、新たに注釈付けされたデータセットの導入である。
モデルトレーニング用の32のパラレルゲートウェイを含む15の注釈付き文書でデータセットを増強する。
論文 参考訳(メタデータ) (2025-07-11T07:25:55Z) - Large Language Models are Good Relational Learners [55.40941576497973]
本稿では,グラフニューラルネットワーク(GNN)に基づくエンコーダを用いて,大規模言語モデル(LLM)のための構造化リレーショナルプロンプトを生成する新しいアーキテクチャであるRel-LLMを紹介する。
従来のテキストベースのシリアライズ手法とは異なり,本手法はデータベース固有の関係構造を保ちながら,LLMが複雑なエンティティ関係を処理・推論することを可能にする。
論文 参考訳(メタデータ) (2025-06-06T04:07:55Z) - SLOT: Structuring the Output of Large Language Models [5.683327173793259]
SLOT(Structured LLM Output Transformer)は,非構造化LCM出力を正確な構造化形式に変換するモデルに依存しない手法である。
この結果から,制約付き復号化による微調整Mistral-7Bモデルでは,ほぼ完全なスキーマ精度が得られた。
特に、Llama-3.2-1Bのようなコンパクトなモデルでさえ、はるかに大きなプロプライエタリなモデルの出力能力にマッチまたは超えることができる。
論文 参考訳(メタデータ) (2025-05-06T23:29:43Z) - Autoregressive Structured Prediction with Language Models [73.11519625765301]
本稿では, PLM を用いた自己回帰的手法を用いて, モデル構造を行動列として記述する。
我々のアプローチは、私たちが見てきた全ての構造化予測タスクにおいて、新しい最先端を実現する。
論文 参考訳(メタデータ) (2022-10-26T13:27:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。