論文の概要: Document Automation Architectures: Updated Survey in Light of Large
Language Models
- arxiv url: http://arxiv.org/abs/2308.09341v1
- Date: Fri, 18 Aug 2023 06:59:55 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-21 14:15:36.842753
- Title: Document Automation Architectures: Updated Survey in Light of Large
Language Models
- Title(参考訳): ドキュメント自動化アーキテクチャ: 大きな言語モデルに照らして最新の調査
- Authors: Mohammad Ahmadi Achachlouei, Omkar Patil, Tarun Joshi, Vijayan N. Nair
- Abstract要約: 本稿では,文書自動化(DA)における技術の現状について調査する。
DAの目的は、異なるソースからの入力を自動生成して統合し、定義されたテンプレートに準拠した文書を組み立てることにより、文書作成時の手作業を削減することである。
DAの商業的ソリューションのレビューは、特に法律分野において行われてきたが、これまでDAアーキテクチャと技術に関する学術研究の包括的なレビューは行われていない。
- 参考スコア(独自算出の注目度): 2.990411348977783
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper surveys the current state of the art in document automation (DA).
The objective of DA is to reduce the manual effort during the generation of
documents by automatically creating and integrating input from different
sources and assembling documents conforming to defined templates. There have
been reviews of commercial solutions of DA, particularly in the legal domain,
but to date there has been no comprehensive review of the academic research on
DA architectures and technologies. The current survey of DA reviews the
academic literature and provides a clearer definition and characterization of
DA and its features, identifies state-of-the-art DA architectures and
technologies in academic research, and provides ideas that can lead to new
research opportunities within the DA field in light of recent advances in
generative AI and large language models.
- Abstract(参考訳): 本稿では,文書自動化技術(da)の現状について概説する。
DAの目的は、異なるソースからの入力を自動生成して統合し、定義されたテンプレートに従って文書を組み立てることにより、文書作成時の手作業を削減することである。
DAの商業的ソリューションのレビューは、特に法律分野において行われているが、これまでDAアーキテクチャと技術に関する学術研究の包括的なレビューは行われていない。
DAの現在の調査は学術文献をレビューし、DAとその特徴を明確に定義し、学術研究における最先端のDAアーキテクチャと技術を特定し、生成型AIや大規模言語モデルの最近の進歩を踏まえて、DA分野における新たな研究機会につながるアイデアを提供する。
関連論文リスト
- Are Large Language Models Good Classifiers? A Study on Edit Intent Classification in Scientific Document Revisions [62.12545440385489]
大規模言語モデル(LLM)は、テキスト生成の大幅な進歩をもたらしたが、分類タスクの強化の可能性はまだ未検討である。
生成と符号化の両方のアプローチを含む分類のための微調整LDMを徹底的に研究するためのフレームワークを提案する。
我々はこのフレームワークを編集意図分類(EIC)においてインスタンス化する。
論文 参考訳(メタデータ) (2024-10-02T20:48:28Z) - Large Language Models for Generative Information Extraction: A Survey [89.71273968283616]
大規模言語モデル(LLM)は、テキスト理解と生成において顕著な能力を示した。
各種IEサブタスクと技術の観点から,これらの作品を分類して概観する。
我々は,最も先進的な手法を実証的に分析し,LLMによるIEタスクの出現傾向を明らかにする。
論文 参考訳(メタデータ) (2023-12-29T14:25:22Z) - Document Understanding Dataset and Evaluation (DUDE) [29.78902147806488]
文書理解データセットと評価(DUDE)は、視覚に富む文書(VRD)の理解において、研究の進展が止まったことを改善しようとしている。
我々は,様々な起源と日付の多産業,多ドメイン,多ページVRDに基づく,質問の種類,回答,文書レイアウトに関する新しいデータセットを提案する。
論文 参考訳(メタデータ) (2023-05-15T08:54:32Z) - Deep learning for table detection and structure recognition: A survey [49.09628624903334]
本調査の目的は,テーブル検出の分野での大きな進展を深く理解することである。
この分野における古典的アプリケーションと新しいアプリケーションの両方について分析する。
既存のモデルのデータセットとソースコードは、読者にこの膨大な文献のコンパスを提供するために組織されている。
論文 参考訳(メタデータ) (2022-11-15T19:42:27Z) - A Survey on Open Information Extraction from Rule-based Model to Large Language Model [29.017823043117144]
オープン情報抽出(OpenIE)は、構造化されていないテキストから構造化情報を引き出すための重要なNLPタスクである。
本調査では,2007年から2024年までのOpenIE技術の概要を概説し,時系列的視点を強調した。
この記事では、OpenIEアプローチをルールベース、ニューラル、トレーニング済みの大規模言語モデルに分類し、時系列フレームワーク内でそれぞれについて議論する。
論文 参考訳(メタデータ) (2022-08-18T08:03:45Z) - Document AI: Benchmarks, Models and Applications [35.46858492311289]
ドキュメントAI(Document AI)とは、ビジネス文書を自動的に読み、理解し、分析する技術である。
近年、ディープラーニング技術の人気は、Document AIの開発を大きく進めている。
本稿では,代表モデル,タスク,ベンチマークデータセットについて概説する。
論文 参考訳(メタデータ) (2021-11-16T16:43:07Z) - Document Automation Architectures and Technologies: A Survey [0.0]
本稿では,文書自動化(DA)における技術の現状について調査する。
DAの目的は、異なるソースからの入力を自動的に統合し、定義されたテンプレートに従って文書を組み立てることにより、文書作成時の手作業を削減することである。
DAの商業的ソリューションのレビューは、特に法律分野において行われてきたが、これまでDAアーキテクチャと技術に関する学術研究の包括的なレビューは行われていない。
論文 参考訳(メタデータ) (2021-09-23T19:12:26Z) - Data-Driven Design-by-Analogy: State of the Art and Future Directions [11.025196033751786]
デザイン・バイ・アナロジー(Design-by- Analogy、DbA)は、ソース・ドメインから引き出されたインスピレーションに基づいて、ターゲット・ドメインに新しいソリューション、機会、あるいは設計が生成される設計手法である。
近年,DbA サポートのためのデータ駆動手法やツールを開発するための新たな機会として,設計データベースやデータサイエンス,人工知能技術が急速に進歩している。
論文 参考訳(メタデータ) (2021-06-03T04:35:34Z) - A Survey of Deep Learning Approaches for OCR and Document Understanding [68.65995739708525]
我々は、英語で書かれた文書の文書理解のための様々な手法をレビューする。
文献に現れる方法論を集約し,この領域を探索する研究者の跳躍点として機能させる。
論文 参考訳(メタデータ) (2020-11-27T03:05:59Z) - A New Neural Search and Insights Platform for Navigating and Organizing
AI Research [56.65232007953311]
我々は、古典的なキーワード検索とニューラル検索を組み合わせた新しいプラットフォームであるAI Research Navigatorを導入し、関連する文献を発見し整理する。
本稿では,システム全体のアーキテクチャの概要と,文書分析,質問応答,検索,分析,専門家検索,レコメンデーションの構成要素について概説する。
論文 参考訳(メタデータ) (2020-10-30T19:12:25Z) - Towards Inheritable Models for Open-Set Domain Adaptation [56.930641754944915]
本稿では、将来、ソースデータセットが存在しない場合の適応を容易にするために、ソース学習モデルを用いた実用的なドメイン適応パラダイムを提案する。
本稿では,ソースデータがない場合でも,対象領域に対して最適なソースモデルの選択を可能にするために,継承可能性の定量化を目的とする手法を提案する。
論文 参考訳(メタデータ) (2020-04-09T07:16:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。