論文の概要: Beyond Rule-based Named Entity Recognition and Relation Extraction for
Process Model Generation from Natural Language Text
- arxiv url: http://arxiv.org/abs/2305.03960v1
- Date: Sat, 6 May 2023 07:06:47 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-09 18:26:15.970825
- Title: Beyond Rule-based Named Entity Recognition and Relation Extraction for
Process Model Generation from Natural Language Text
- Title(参考訳): 自然言語テキストからのプロセスモデル生成のためのルールベース名前付きエンティティ認識と関係抽出
- Authors: Julian Neuberger, Lars Ackermann, Stefan Jablonski
- Abstract要約: 高品質な注釈付きテキストプロセス記述コーパス(PET)が公開されている。
PETは、2つの言及が同一または異なるプロセスエンティティを指すかどうかに関する情報を欠いている。
本稿では,新たな実体分解能成分を付加したプロセス抽出のための新しいベースライン手法を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Automated generation of business process models from natural language text is
an emerging methodology for avoiding the manual creation of formal business
process models. For this purpose, process entities like actors, activities,
objects etc., and relations among them are extracted from textual process
descriptions. A high-quality annotated corpus of textual process descriptions
(PET) has been published accompanied with a basic process extraction approach.
In its current state, however, PET lacks information about whether two mentions
refer to the same or different process entities, which corresponds to the
crucial decision of whether to create one or two modeling elements in the
target model. Consequently, it is ambiguous whether, for instance, two mentions
of data processing mean processing of different, or the same data. In this
paper, we extend the PET dataset by clustering mentions of process entities and
by proposing a new baseline technique for process extraction equipped with an
additional entity resolution component. In a second step, we replace the
rule-based relation extraction component with a machine learning-based
alternative, enabling rapid adaption to different datasets and domains. In
addition, we evaluate a deep learning-approach built for solving entity and
relation extraction as well as entity resolution in a holistic manner. Finally,
our extensive evaluation of the original PET baseline against our own
implementation shows that a pure machine learning-based process extraction
technique is competitive, while avoiding the massive overhead arising from
feature engineering and rule definition needed to adapt to other datasets,
different entity and relation types, or new domains.
- Abstract(参考訳): 自然言語テキストからビジネスプロセスモデルの自動生成は、正式なビジネスプロセスモデルの手動作成を避けるための新しい方法論である。
この目的のために、アクター、アクティビティ、オブジェクトなどのプロセスエンティティとそれらの関係は、テキストプロセス記述から抽出される。
テキストプロセス記述(PET)の高品質な注釈付きコーパスが,基本的プロセス抽出手法とともに公開された。
しかし、現段階では、PETは2つの言及が同一または異なるプロセスエンティティを指すかどうかに関する情報を欠いているため、ターゲットモデルに1つまたは2つのモデリング要素を作成するかどうかという決定に該当する。
その結果、例えば2つのデータ処理の言及が、異なるデータの処理を意味するのか、同じデータなのかがはっきりしない。
本稿では,プロセスエンティティの参照をクラスタリングすることでPETデータセットを拡張し,新たなエンティティ解決コンポーネントを備えたプロセス抽出のための新しいベースライン技術を提案する。
第2のステップでは、ルールベースの関係抽出コンポーネントを機械学習ベースの代替品に置き換え、異なるデータセットやドメインへの迅速な適応を可能にします。
さらに,エンティティと関係抽出,およびエンティティ解決を包括的に解くために構築された深層学習アプローチを評価する。
最後に、我々の独自の実装に対するPETベースラインの広範な評価から、純粋な機械学習ベースのプロセス抽出技術が競合する一方で、他のデータセット、異なるエンティティとリレーショナルタイプ、あるいは新しいドメインへの適応に必要な機能エンジニアリングとルール定義から生じる膨大なオーバーヘッドを回避していることがわかる。
関連論文リスト
- Generative Context Distillation [48.91617280112579]
Generative Context Distillation (GCD) は、ジョイントトレーニングアプローチを採用した軽量なプロンプト内在化手法である。
エージェントベースのアプリケーションシナリオにおいて,このアプローチが複雑なプロンプトを効果的に内部化することを示す。
論文 参考訳(メタデータ) (2024-11-24T17:32:20Z) - A New Pipeline For Generating Instruction Dataset via RAG and Self Fine-Tuning [0.0]
本研究では,特定のドメインを微調整するための高品質な命令データセットを構築するパイプラインを提案する。
ドメイン固有の文書を取り込み、パイプラインは関連性のある適切な命令を生成する。
ケーススタディでは、専門知識と患者情報の繊細な取り扱いを必要とする領域である精神医学の領域にこのアプローチを適用した。
論文 参考訳(メタデータ) (2024-08-12T03:52:11Z) - Leveraging Data Augmentation for Process Information Extraction [0.0]
自然言語テキストデータに対するデータ拡張の適用について検討する。
データ拡張は、自然言語テキストからビジネスプロセスモデルを生成するタスクのための機械学習メソッドを実現する上で重要なコンポーネントである。
論文 参考訳(メタデータ) (2024-04-11T06:32:03Z) - From Dialogue to Diagram: Task and Relationship Extraction from Natural
Language for Accelerated Business Process Prototyping [0.0]
本稿では、依存性解析と名前付きエンティティ認識(NER)の利用を、我々のアプローチの中心とする現代的ソリューションを紹介します。
我々は,行動関係の同定にSVO(Subject-Verb-Object)構造を用い,コンテキスト理解のためのWordNetなどの意味分析ツールを統合する。
このシステムはデータ変換と視覚化を十分に処理し、冗長に抽出された情報をBPMN(Business Process Model and Notation)ダイアグラムに変換する。
論文 参考訳(メタデータ) (2023-12-16T12:35:28Z) - Adapting Large Language Models for Content Moderation: Pitfalls in Data
Engineering and Supervised Fine-tuning [79.53130089003986]
大規模言語モデル(LLM)は、様々なドメインでタスクを処理するための実現可能なソリューションとなっている。
本稿では、コンテンツモデレーションのためにプライベートにデプロイ可能なLLMモデルを微調整する方法を紹介する。
論文 参考訳(メタデータ) (2023-10-05T09:09:44Z) - Information Association for Language Model Updating by Mitigating
LM-Logical Discrepancy [68.31760483418901]
大規模言語モデル(LLM)は、時代遅れの事前学習データのために現在の情報を提供するのに苦労する。
知識編集や連続的な微調整など,従来のLCMの更新方法は,新たな情報の一般化に重大な欠点がある。
これらの欠点の中核となる課題は,言語モデリングの確率と論理的確率の差を特徴とするLM論理的相違である。
論文 参考訳(メタデータ) (2023-05-29T19:48:37Z) - STAR: Boosting Low-Resource Information Extraction by Structure-to-Text
Data Generation with Large Language Models [56.27786433792638]
STARは大規模言語モデル(LLM)を利用してデータインスタンスを合成するデータ生成手法である。
我々は、初期データインスタンスを取得するための詳細なステップバイステップ命令を設計する。
実験の結果,STARが生成したデータは,低リソースイベント抽出および関係抽出タスクの性能を著しく向上させることがわかった。
論文 参考訳(メタデータ) (2023-05-24T12:15:19Z) - A Case for Business Process-Specific Foundation Models [6.25118865553438]
ビジネスプロセスデータ表現には,新たな基盤モデルの開発を保証できるユニークな特徴がある,と我々は主張する。
これらのモデルは、データ不足、マルチモーダル表現、ドメイン固有の用語、プライバシに関する懸念を含む、ビジネスプロセスにAIを適用するというユニークな課題に取り組む必要がある。
論文 参考訳(メタデータ) (2022-10-26T14:17:47Z) - PET: A new Dataset for Process Extraction from Natural Language Text [15.16406344719132]
我々は、アクティビティ、ゲートウェイ、アクター、フロー情報に注釈を付けた、ビジネスプロセス記述の最初のコーパスを開発する。
我々は、アノテーションスキーマとガイドラインの詳細な概要や、テキストからビジネスプロセスを抽出することの難しさと難しさをベンチマークするための様々なベースラインを含む、新しいリソースを提示する。
論文 参考訳(メタデータ) (2022-03-09T16:33:59Z) - SOLIS -- The MLOps journey from data acquisition to actionable insights [62.997667081978825]
本稿では,基本的なクロスプラットフォームテンソルフレームワークとスクリプト言語エンジンを使用しながら,すべての要件をサポートする統合デプロイメントパイプラインとフリー・ツー・オペレートアプローチを提案する。
しかし、このアプローチは、実際のプロダクショングレードシステムに機械学習機能を実際にデプロイするために必要な手順やパイプラインを提供していない。
論文 参考訳(メタデータ) (2021-12-22T14:45:37Z) - Knowledge-Aware Procedural Text Understanding with Multi-Stage Training [110.93934567725826]
本稿では,このような文書の理解とプロセス中のエンティティの状態や場所の追跡を目的とした手続き的テキスト理解の課題に焦点をあてる。
常識的推論の難しさとデータ不足という2つの課題はまだ未解決のままである。
我々は、複数の外部知識を効果的に活用する、KnOwledge-Aware ProceduraL text understAnding (KOALA)モデルを提案する。
論文 参考訳(メタデータ) (2020-09-28T10:28:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。