論文の概要: Beyond Rule-based Named Entity Recognition and Relation Extraction for
Process Model Generation from Natural Language Text
- arxiv url: http://arxiv.org/abs/2305.03960v2
- Date: Mon, 7 Aug 2023 06:35:25 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-08 23:02:02.255589
- Title: Beyond Rule-based Named Entity Recognition and Relation Extraction for
Process Model Generation from Natural Language Text
- Title(参考訳): 自然言語テキストからのプロセスモデル生成のためのルールベース名前付きエンティティ認識と関係抽出
- Authors: Julian Neuberger, Lars Ackermann, Stefan Jablonski
- Abstract要約: 既存のパイプラインを拡張して、完全にデータ駆動にします。
改善されたパイプラインの競争力を示す。これは、機能エンジニアリングとルール定義に関連するかなりのオーバーヘッドを取り除くだけでなく、改善されたパイプラインの競争力も排除します。
本稿では,言語参照に関する情報を取り入れたPETデータセットの拡張と,それを解決する方法を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Process-aware information systems offer extensive advantages to companies,
facilitating planning, operations, and optimization of day-to-day business
activities. However, the time-consuming but required step of designing formal
business process models often hampers the potential of these systems. To
overcome this challenge, automated generation of business process models from
natural language text has emerged as a promising approach to expedite this
step. Generally two crucial subtasks have to be solved: extracting
process-relevant information from natural language and creating the actual
model. Approaches towards the first subtask are rule based methods, highly
optimized for specific domains, but hard to adapt to related applications. To
solve this issue, we present an extension to an existing pipeline, to make it
entirely data driven. We demonstrate the competitiveness of our improved
pipeline, which not only eliminates the substantial overhead associated with
feature engineering and rule definition, but also enables adaptation to
different datasets, entity and relation types, and new domains. Additionally,
the largest available dataset (PET) for the first subtask, contains no
information about linguistic references between mentions of entities in the
process description. Yet, the resolution of these mentions into a single visual
element is essential for high quality process models. We propose an extension
to the PET dataset that incorporates information about linguistic references
and a corresponding method for resolving them. Finally, we provide a detailed
analysis of the inherent challenges in the dataset at hand.
- Abstract(参考訳): プロセス対応情報システムは、計画、運用、日々のビジネス活動の最適化を容易にし、企業に対して広範なアドバンテージを提供する。
しかし、形式的なビジネスプロセスモデルを設計するための時間を要するが必要なステップは、しばしばこれらのシステムの可能性を妨げます。
この課題を克服するために、自然言語テキストからビジネスプロセスモデルの自動生成が、このステップを高速化するための有望なアプローチとして登場した。
一般に、自然言語からプロセス関連情報を抽出し、実際のモデルを作成するという2つの重要なサブタスクを解決しなければならない。
最初のサブタスクへのアプローチはルールベースのメソッドで、特定のドメインに高度に最適化されているが、関連するアプリケーションへの適応は困難である。
この問題を解決するために,我々は,既存のパイプラインの完全なデータ駆動を実現するための拡張を提案する。
我々は、機能エンジニアリングとルール定義に関連するかなりのオーバーヘッドを取り除くだけでなく、異なるデータセット、エンティティとリレーショナルタイプ、新しいドメインへの適応を可能にする改良されたパイプラインの競争力を実証する。
さらに、最初のサブタスクで利用可能な最大のデータセット(pet)は、プロセス記述におけるエンティティの言及間の言語的参照に関する情報を含まない。
しかし、これらの言及を単一のビジュアル要素に分解することは、高品質なプロセスモデルに不可欠である。
本稿では,言語参照に関する情報を取り入れたPETデータセットの拡張と,それを解決する方法を提案する。
最後に、目の前のデータセットに固有の課題を詳細に分析します。
関連論文リスト
- Generative Context Distillation [48.91617280112579]
Generative Context Distillation (GCD) は、ジョイントトレーニングアプローチを採用した軽量なプロンプト内在化手法である。
エージェントベースのアプリケーションシナリオにおいて,このアプローチが複雑なプロンプトを効果的に内部化することを示す。
論文 参考訳(メタデータ) (2024-11-24T17:32:20Z) - A New Pipeline For Generating Instruction Dataset via RAG and Self Fine-Tuning [0.0]
本研究では,特定のドメインを微調整するための高品質な命令データセットを構築するパイプラインを提案する。
ドメイン固有の文書を取り込み、パイプラインは関連性のある適切な命令を生成する。
ケーススタディでは、専門知識と患者情報の繊細な取り扱いを必要とする領域である精神医学の領域にこのアプローチを適用した。
論文 参考訳(メタデータ) (2024-08-12T03:52:11Z) - Leveraging Data Augmentation for Process Information Extraction [0.0]
自然言語テキストデータに対するデータ拡張の適用について検討する。
データ拡張は、自然言語テキストからビジネスプロセスモデルを生成するタスクのための機械学習メソッドを実現する上で重要なコンポーネントである。
論文 参考訳(メタデータ) (2024-04-11T06:32:03Z) - From Dialogue to Diagram: Task and Relationship Extraction from Natural
Language for Accelerated Business Process Prototyping [0.0]
本稿では、依存性解析と名前付きエンティティ認識(NER)の利用を、我々のアプローチの中心とする現代的ソリューションを紹介します。
我々は,行動関係の同定にSVO(Subject-Verb-Object)構造を用い,コンテキスト理解のためのWordNetなどの意味分析ツールを統合する。
このシステムはデータ変換と視覚化を十分に処理し、冗長に抽出された情報をBPMN(Business Process Model and Notation)ダイアグラムに変換する。
論文 参考訳(メタデータ) (2023-12-16T12:35:28Z) - Adapting Large Language Models for Content Moderation: Pitfalls in Data
Engineering and Supervised Fine-tuning [79.53130089003986]
大規模言語モデル(LLM)は、様々なドメインでタスクを処理するための実現可能なソリューションとなっている。
本稿では、コンテンツモデレーションのためにプライベートにデプロイ可能なLLMモデルを微調整する方法を紹介する。
論文 参考訳(メタデータ) (2023-10-05T09:09:44Z) - Information Association for Language Model Updating by Mitigating
LM-Logical Discrepancy [68.31760483418901]
大規模言語モデル(LLM)は、時代遅れの事前学習データのために現在の情報を提供するのに苦労する。
知識編集や連続的な微調整など,従来のLCMの更新方法は,新たな情報の一般化に重大な欠点がある。
これらの欠点の中核となる課題は,言語モデリングの確率と論理的確率の差を特徴とするLM論理的相違である。
論文 参考訳(メタデータ) (2023-05-29T19:48:37Z) - STAR: Boosting Low-Resource Information Extraction by Structure-to-Text
Data Generation with Large Language Models [56.27786433792638]
STARは大規模言語モデル(LLM)を利用してデータインスタンスを合成するデータ生成手法である。
我々は、初期データインスタンスを取得するための詳細なステップバイステップ命令を設計する。
実験の結果,STARが生成したデータは,低リソースイベント抽出および関係抽出タスクの性能を著しく向上させることがわかった。
論文 参考訳(メタデータ) (2023-05-24T12:15:19Z) - A Case for Business Process-Specific Foundation Models [6.25118865553438]
ビジネスプロセスデータ表現には,新たな基盤モデルの開発を保証できるユニークな特徴がある,と我々は主張する。
これらのモデルは、データ不足、マルチモーダル表現、ドメイン固有の用語、プライバシに関する懸念を含む、ビジネスプロセスにAIを適用するというユニークな課題に取り組む必要がある。
論文 参考訳(メタデータ) (2022-10-26T14:17:47Z) - PET: A new Dataset for Process Extraction from Natural Language Text [15.16406344719132]
我々は、アクティビティ、ゲートウェイ、アクター、フロー情報に注釈を付けた、ビジネスプロセス記述の最初のコーパスを開発する。
我々は、アノテーションスキーマとガイドラインの詳細な概要や、テキストからビジネスプロセスを抽出することの難しさと難しさをベンチマークするための様々なベースラインを含む、新しいリソースを提示する。
論文 参考訳(メタデータ) (2022-03-09T16:33:59Z) - SOLIS -- The MLOps journey from data acquisition to actionable insights [62.997667081978825]
本稿では,基本的なクロスプラットフォームテンソルフレームワークとスクリプト言語エンジンを使用しながら,すべての要件をサポートする統合デプロイメントパイプラインとフリー・ツー・オペレートアプローチを提案する。
しかし、このアプローチは、実際のプロダクショングレードシステムに機械学習機能を実際にデプロイするために必要な手順やパイプラインを提供していない。
論文 参考訳(メタデータ) (2021-12-22T14:45:37Z) - Knowledge-Aware Procedural Text Understanding with Multi-Stage Training [110.93934567725826]
本稿では,このような文書の理解とプロセス中のエンティティの状態や場所の追跡を目的とした手続き的テキスト理解の課題に焦点をあてる。
常識的推論の難しさとデータ不足という2つの課題はまだ未解決のままである。
我々は、複数の外部知識を効果的に活用する、KnOwledge-Aware ProceduraL text understAnding (KOALA)モデルを提案する。
論文 参考訳(メタデータ) (2020-09-28T10:28:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。