論文の概要: PET: A new Dataset for Process Extraction from Natural Language Text
- arxiv url: http://arxiv.org/abs/2203.04860v1
- Date: Wed, 9 Mar 2022 16:33:59 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-10 20:11:30.295296
- Title: PET: A new Dataset for Process Extraction from Natural Language Text
- Title(参考訳): PET:自然言語テキストからのプロセス抽出のための新しいデータセット
- Authors: Patrizio Bellan, Han van der Aa, Mauro Dragoni, Chiara Ghidini and
Simone Paolo Ponzetto
- Abstract要約: 我々は、アクティビティ、ゲートウェイ、アクター、フロー情報に注釈を付けた、ビジネスプロセス記述の最初のコーパスを開発する。
我々は、アノテーションスキーマとガイドラインの詳細な概要や、テキストからビジネスプロセスを抽出することの難しさと難しさをベンチマークするための様々なベースラインを含む、新しいリソースを提示する。
- 参考スコア(独自算出の注目度): 15.16406344719132
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Although there is a long tradition of work in NLP on extracting entities and
relations from text, to date there exists little work on the acquisition of
business processes from unstructured data such as textual corpora of process
descriptions. With this work we aim at filling this gap and establishing the
first steps towards bridging data-driven information extraction methodologies
from Natural Language Processing and the model-based formalization that is
aimed from Business Process Management. For this, we develop the first corpus
of business process descriptions annotated with activities, gateways, actors
and flow information. We present our new resource, including a detailed
overview of the annotation schema and guidelines, as well as a variety of
baselines to benchmark the difficulty and challenges of business process
extraction from text.
- Abstract(参考訳): nlpにはテキストからエンティティや関係を抽出するという長い伝統があるが、これまではプロセス記述のテキストコーパスのような構造化されていないデータからビジネスプロセスを取得する作業はほとんど存在しない。
この作業では、このギャップを埋め、自然言語処理からデータ駆動情報抽出方法論をブリッジする最初のステップと、ビジネスプロセス管理から目的を定式化することを目的としています。
そこで我々は,アクティビティ,ゲートウェイ,アクター,フロー情報に注釈を付けたビジネスプロセス記述の最初のコーパスを開発する。
我々は、アノテーションスキーマとガイドラインの詳細な概要、およびテキストからのビジネスプロセス抽出の難しさと課題をベンチマークするための様々なベースラインを含む、新しいリソースを提示します。
関連論文リスト
- Natural Language Processing for Requirements Traceability [47.93107382627423]
トレーサビリティは、特に安全クリティカルなシステムにおいて、要件とソフトウェアエンジニアリングにおいて重要な役割を果たす。
自然言語処理(NLP)とその関連技術は、過去10年間に大きく進歩してきた。
論文 参考訳(メタデータ) (2024-05-17T15:17:00Z) - From Dialogue to Diagram: Task and Relationship Extraction from Natural
Language for Accelerated Business Process Prototyping [0.0]
本稿では、依存性解析と名前付きエンティティ認識(NER)の利用を、我々のアプローチの中心とする現代的ソリューションを紹介します。
我々は,行動関係の同定にSVO(Subject-Verb-Object)構造を用い,コンテキスト理解のためのWordNetなどの意味分析ツールを統合する。
このシステムはデータ変換と視覚化を十分に処理し、冗長に抽出された情報をBPMN(Business Process Model and Notation)ダイアグラムに変換する。
論文 参考訳(メタデータ) (2023-12-16T12:35:28Z) - Beyond Rule-based Named Entity Recognition and Relation Extraction for
Process Model Generation from Natural Language Text [0.0]
既存のパイプラインを拡張して、完全にデータ駆動にします。
改善されたパイプラインの競争力を示す。これは、機能エンジニアリングとルール定義に関連するかなりのオーバーヘッドを取り除くだけでなく、改善されたパイプラインの競争力も排除します。
本稿では,言語参照に関する情報を取り入れたPETデータセットの拡張と,それを解決する方法を提案する。
論文 参考訳(メタデータ) (2023-05-06T07:06:47Z) - Improving Keyphrase Extraction with Data Augmentation and Information
Filtering [67.43025048639333]
キーフレーズ抽出はNLPにおける文書理解に不可欠なタスクの1つである。
本稿では,Behanceプラットフォーム上でストリームされたビデオからキーフレーズを抽出するための新しいコーパスと手法を提案する。
論文 参考訳(メタデータ) (2022-09-11T22:38:02Z) - TAGPRIME: A Unified Framework for Relational Structure Extraction [71.88926365652034]
TAGPRIMEは、与えられた条件に関する情報を入力テキストに追加するシーケンスタグ付けモデルである。
事前学習された言語モデルにおける自己認識機構により、プライミングワードは、出力された文脈化された表現に、与えられた条件に関するより多くの情報を含む。
5つの異なる言語にまたがる10のデータセットをカバーする3つのタスクに関する大規模な実験と分析は、TAGPRIMEの汎用性と有効性を示している。
論文 参考訳(メタデータ) (2022-05-25T08:57:46Z) - Zero-Shot Information Extraction as a Unified Text-to-Triple Translation [56.01830747416606]
我々は、テキストから3つの翻訳フレームワークに一連の情報抽出タスクを投入した。
タスク固有の入力テキストと出力トリプルの変換としてタスクを形式化する。
本稿では,オープン情報抽出におけるゼロショット性能について検討する。
論文 参考訳(メタデータ) (2021-09-23T06:54:19Z) - Extracting Semantic Process Information from the Natural Language in
Event Logs [0.1827510863075184]
本稿では、イベントデータの意味的役割ラベリングという手法を提案する。
この方法では,イベント毎に最大8つの意味的役割に関する情報を抽出する。
論文 参考訳(メタデータ) (2021-03-06T08:39:04Z) - Knowledge-Aware Procedural Text Understanding with Multi-Stage Training [110.93934567725826]
本稿では,このような文書の理解とプロセス中のエンティティの状態や場所の追跡を目的とした手続き的テキスト理解の課題に焦点をあてる。
常識的推論の難しさとデータ不足という2つの課題はまだ未解決のままである。
我々は、複数の外部知識を効果的に活用する、KnOwledge-Aware ProceduraL text understAnding (KOALA)モデルを提案する。
論文 参考訳(メタデータ) (2020-09-28T10:28:40Z) - Automatic Business Process Structure Discovery using Ordered Neurons
LSTM: A Preliminary Study [6.6599132213053185]
本稿では,ニューラルネットワークの構築により,ビジネスプロセス文書に存在する潜在意味階層構造を検索する。
我々は,実践的なロボットプロセス自動化(RPA)プロジェクトから提案したプロセス記述文書(PDD)のデータセットに対するアプローチを検証した。
論文 参考訳(メタデータ) (2020-01-05T14:19:11Z) - Exploring the Limits of Transfer Learning with a Unified Text-to-Text
Transformer [64.22926988297685]
下流タスクで微調整される前に、まずデータリッチタスクでモデルが事前訓練されるトランスファーラーニングは、自然言語処理(NLP)において強力な手法として登場した。
本稿では,すべてのテキストベースの言語問題をテキスト・トゥ・テキスト・フォーマットに変換する統一フレームワークにより,NLPのためのトランスファー学習手法を導入する状況について検討する。
論文 参考訳(メタデータ) (2019-10-23T17:37:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。