論文の概要: From Chaos to Automation: Enabling the Use of Unstructured Data for Robotic Process Automation
- arxiv url: http://arxiv.org/abs/2507.11364v1
- Date: Tue, 15 Jul 2025 14:32:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-16 19:46:03.154791
- Title: From Chaos to Automation: Enabling the Use of Unstructured Data for Robotic Process Automation
- Title(参考訳): カオスから自動化へ - ロボットプロセス自動化における非構造化データの利用の実現
- Authors: Kelly Kurowski, Xixi Lu, Hajo A. Reijers,
- Abstract要約: Unstructured Document Retrieval SyStem (UNDRESS) は、ファジィ正規表現、自然言語処理のための技術、そしてRPAプラットフォームが非構造化文書から情報を効率的に取得できるようにするための大きな言語モデルを使用するシステムである。
その結果、UNDRESSが非構造化データに対するRPA能力の向上に有効であることを示し、この分野において大きな進歩をもたらした。
- 参考スコア(独自算出の注目度): 0.6144680854063939
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The growing volume of unstructured data within organizations poses significant challenges for data analysis and process automation. Unstructured data, which lacks a predefined format, encompasses various forms such as emails, reports, and scans. It is estimated to constitute approximately 80% of enterprise data. Despite the valuable insights it can offer, extracting meaningful information from unstructured data is more complex compared to structured data. Robotic Process Automation (RPA) has gained popularity for automating repetitive tasks, improving efficiency, and reducing errors. However, RPA is traditionally reliant on structured data, limiting its application to processes involving unstructured documents. This study addresses this limitation by developing the UNstructured Document REtrieval SyStem (UNDRESS), a system that uses fuzzy regular expressions, techniques for natural language processing, and large language models to enable RPA platforms to effectively retrieve information from unstructured documents. The research involved the design and development of a prototype system, and its subsequent evaluation based on text extraction and information retrieval performance. The results demonstrate the effectiveness of UNDRESS in enhancing RPA capabilities for unstructured data, providing a significant advancement in the field. The findings suggest that this system could facilitate broader RPA adoption across processes traditionally hindered by unstructured data, thereby improving overall business process efficiency.
- Abstract(参考訳): 組織内の非構造化データの量の増加は、データ分析とプロセスの自動化に重大な課題をもたらします。
予め定義されたフォーマットを持たない非構造化データは、Eメール、レポート、スキャンなどの様々な形式を含んでいる。
企業データの約80%を占めると見積もられている。
価値ある洞察を提供するにもかかわらず、構造化されていないデータから意味のある情報を抽出することは、構造化データよりも複雑である。
ロボットプロセス自動化(RPA)は、繰り返しタスクの自動化、効率の改善、エラーの低減で人気を集めている。
しかしながら、RPAは伝統的に構造化データに依存しており、非構造化ドキュメントを含むプロセスにその適用を制限している。
本研究は, ファジィ正規表現, 自然言語処理技術, 大規模言語モデルを用いた非構造化文書から効率的に情報を取得するためのunstructured Document Retrieval SyStem (UNDRESS) の開発により, この制限に対処する。
本研究は,プロトタイプシステムの設計・開発と,テキスト抽出と情報検索性能に基づくその後の評価を含む。
その結果、UNDRESSが非構造化データに対するRPA能力の向上に有効であることを示し、この分野において大きな進歩をもたらした。
このシステムは、従来、構造化されていないデータによって妨げられていたプロセス全体にわたって、より広範なRPA採用を促進する可能性があることを示唆している。
関連論文リスト
- WebShaper: Agentically Data Synthesizing via Information-Seeking Formalization [68.46693401421923]
WebShaperは集合論を通してISタスクを体系的に定式化する。
WebShaperは、GAIAおよびWebWalkerQAベンチマーク上で、オープンソースISエージェントの最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-07-20T17:53:37Z) - Leveraging Machine Learning and Enhanced Parallelism Detection for BPMN Model Generation from Text [75.77648333476776]
本稿では、テキストからBPMNモデルを抽出する自動パイプラインについて紹介する。
この研究の重要な貢献は、新たに注釈付けされたデータセットの導入である。
モデルトレーニング用の32のパラレルゲートウェイを含む15の注釈付き文書でデータセットを増強する。
論文 参考訳(メタデータ) (2025-07-11T07:25:55Z) - Structuring the Unstructured: A Multi-Agent System for Extracting and Querying Financial KPIs and Guidance [54.25184684077833]
構造化されていない財務文書から定量的な洞察を抽出する,効率的でスケーラブルな手法を提案する。
提案システムは,emphExtraction AgentとemphText-to-Agentの2つの特殊エージェントから構成される。
論文 参考訳(メタデータ) (2025-05-25T15:45:46Z) - MDSF: Context-Aware Multi-Dimensional Data Storytelling Framework based on Large language Model [1.33134751838052]
本稿では,大規模言語モデルに基づく多次元データストーリーテリングフレームワーク(MDSF)について紹介する。
このフレームワークには、高度な前処理技術、拡張分析アルゴリズム、行動可能な洞察を特定し優先順位付けするためのユニークなスコアリングメカニズムが含まれている。
論文 参考訳(メタデータ) (2025-01-02T02:35:38Z) - ERPA: Efficient RPA Model Integrating OCR and LLMs for Intelligent Document Processing [0.0]
本稿では,移民におけるOCRタスクのIDデータ抽出と最適化を目的とした,革新的なロボットプロセス自動化(RPA)モデルであるERPAを提案する。
ベンチマークの結果、ERPAは処理時間を最大94%削減し、IDデータの抽出をわずか9.94秒で完了している。
論文 参考訳(メタデータ) (2024-12-24T09:44:43Z) - Enhancing Structured-Data Retrieval with GraphRAG: Soccer Data Case Study [4.742245127121496]
Structured-GraphRAGは自然言語クエリにおける構造化データセット間の情報検索を強化するために設計された汎用フレームワークである。
その結果,Structured-GraphRAGはクエリ処理効率を大幅に改善し,応答時間を短縮することがわかった。
論文 参考訳(メタデータ) (2024-09-26T06:53:29Z) - Optimizing Structured Data Processing through Robotic Process Automation [2.3997896447030653]
本研究では、構造化データ抽出における RPA の利用について検討し、手作業による処理よりもその優位性を評価する。
人為的なタスクとRPAソフトウェアボットが実行するタスクを比較することにより、請求書からのデータ抽出の効率性と精度を評価する。
本研究は,ロボットが作業の完了を手作業よりもはるかに少ない時間で行うことにより,RPAが達成した顕著な効率向上を浮き彫りにした。
論文 参考訳(メタデータ) (2024-08-27T05:53:02Z) - STAR: Boosting Low-Resource Information Extraction by Structure-to-Text
Data Generation with Large Language Models [56.27786433792638]
STARは大規模言語モデル(LLM)を利用してデータインスタンスを合成するデータ生成手法である。
我々は、初期データインスタンスを取得するための詳細なステップバイステップ命令を設計する。
実験の結果,STARが生成したデータは,低リソースイベント抽出および関係抽出タスクの性能を著しく向上させることがわかった。
論文 参考訳(メタデータ) (2023-05-24T12:15:19Z) - An Empirical Study of Automatic Post-Editing [56.86393786396992]
APEは、機械翻訳出力のエラーを自動的に修正することで、手作業による後処理の労力を削減することを目的としている。
真のトレーニングデータの不足を軽減するため、現在のAPEシステムの多くは、大規模な人工コーパスを生成するためにデータ拡張手法を採用している。
本研究では,既存のAPEシステムにおける問題点を解析するために,難解なAPEデータセット上での最先端のAPEモデルの出力について検討する。
論文 参考訳(メタデータ) (2022-09-16T07:38:27Z) - SOLIS -- The MLOps journey from data acquisition to actionable insights [62.997667081978825]
本稿では,基本的なクロスプラットフォームテンソルフレームワークとスクリプト言語エンジンを使用しながら,すべての要件をサポートする統合デプロイメントパイプラインとフリー・ツー・オペレートアプローチを提案する。
しかし、このアプローチは、実際のプロダクショングレードシステムに機械学習機能を実際にデプロイするために必要な手順やパイプラインを提供していない。
論文 参考訳(メタデータ) (2021-12-22T14:45:37Z) - Automatic Business Process Structure Discovery using Ordered Neurons
LSTM: A Preliminary Study [6.6599132213053185]
本稿では,ニューラルネットワークの構築により,ビジネスプロセス文書に存在する潜在意味階層構造を検索する。
我々は,実践的なロボットプロセス自動化(RPA)プロジェクトから提案したプロセス記述文書(PDD)のデータセットに対するアプローチを検証した。
論文 参考訳(メタデータ) (2020-01-05T14:19:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。