Fugu-MT 論文翻訳(概要): A Survey of Deep Learning Approaches for OCR and Document Understanding

論文の概要: A Survey of Deep Learning Approaches for OCR and Document Understanding

arxiv url: http://arxiv.org/abs/2011.13534v2
Date: Thu, 4 Feb 2021 23:48:39 GMT
ステータス: 翻訳完了
システム内更新日: 2022-09-20 01:30:25.666549
Title: A Survey of Deep Learning Approaches for OCR and Document Understanding
Title（参考訳）: ocrと文書理解のためのディープラーニングアプローチに関する調査
Authors: Nishant Subramani and Alexandre Matton and Malcolm Greaves and Adrian Lam
Abstract要約: 我々は、英語で書かれた文書の文書理解のための様々な手法をレビューする。文献に現れる方法論を集約し,この領域を探索する研究者の跳躍点として機能させる。
参考スコア（独自算出の注目度）: 68.65995739708525
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Documents are a core part of many businesses in many fields such as law, finance, and technology among others. Automatic understanding of documents such as invoices, contracts, and resumes is lucrative, opening up many new avenues of business. The fields of natural language processing and computer vision have seen tremendous progress through the development of deep learning such that these methods have started to become infused in contemporary document understanding systems. In this survey paper, we review different techniques for document understanding for documents written in English and consolidate methodologies present in literature to act as a jumping-off point for researchers exploring this area.
Abstract（参考訳）: 文書は法律、金融、技術など多くの分野における多くのビジネスの中核部分である。請求書、契約書、履歴書などの文書の自動理解は利益があり、多くの新しいビジネスの道を開く。自然言語処理とコンピュータビジョンの分野は、これらの手法が現代の文書理解システムに浸透し始め、深層学習の発展によって大きな進歩を遂げている。本稿では,英語で書かれた文書の文書理解のためのさまざまな手法を概説し,文献に現れる方法論を統合し,この領域を探索する研究者の跳躍点として機能させる。

関連論文リスト

Beyond Text: Characterizing Domain Expert Needs in Document Research [10.98467955215441]
文書研究のプロセスを理解するために、2つのドメインにまたがる16のドメインエキスパートに頼みます。参加者のプロセスは、慣用的で反復的で、文書の社会的文脈に大きく依存していることが分かりました。我々はNLPコミュニティに、有用なツールを構築する上でのドキュメントの役割をより慎重に検討するよう呼びかける。
論文参考訳（メタデータ） (2025-04-16T21:24:41Z)
Unified Multi-Modal Interleaved Document Representation for Information Retrieval [57.65409208879344]
我々は、異なるモダリティでインターリーブされた文書を均等に埋め込み、より包括的でニュアンスのある文書表現を生成する。具体的には、テキスト、画像、テーブルの処理と統合を統一されたフォーマットと表現に統合する、近年のビジョン言語モデルの能力を活用して、これを実現する。
論文参考訳（メタデータ） (2024-10-03T17:49:09Z)
Leveraging Distillation Techniques for Document Understanding: A Case Study with FLAN-T5 [0.0]
本稿では,LLM ChatGPTから文書理解知識をFLAN-T5に抽出する手法を提案する。本研究は, 実世界のシナリオにおける高度言語モデルの展開を促進する蒸留技術の可能性を明らかにするものである。
論文参考訳（メタデータ） (2024-09-17T15:37:56Z)
Deep Learning based Key Information Extraction from Business Documents: Systematic Literature Review [51.61531917413708]
鍵情報抽出のための深層学習に基づくアプローチは、文書理解(Document Understanding)という用語で提案されている。この体系的な文献レビューの目的は、この領域における既存のアプローチの詳細な分析とさらなる研究の機会の同定である。
論文参考訳（メタデータ） (2024-07-23T08:15:55Z)
Understanding Archives: Towards New Research Interfaces Relying on the Semantic Annotation of Documents [0.2302001830524133]
本稿では,研究資料のコーパスのテキスト内容の意味的アノテーションが,その活用と評価を促進する方法を示す。まず,テキスト・セマンティクスに基づく新しいインタフェース構築のための方法論的枠組みを提案する。
論文参考訳（メタデータ） (2024-03-28T07:55:29Z)
Workshop on Document Intelligence Understanding [3.2929609168290543]
このワークショップは、ドキュメントインテリジェンス分野の研究者と業界開発者を集結させることを目的としている。また、最近導入されたドキュメントレベルのVQAデータセットであるPDFVQAに関するデータ課題もリリースしました。
論文参考訳（メタデータ） (2023-07-31T02:14:25Z)
DLUE: Benchmarking Document Language Understanding [32.550855843975484]
文書理解能力を包括的に評価する方法については、確固たるコンセンサスはない。本稿では,文書分類,文書構造解析,文書情報抽出,文書書き起こしの4つの代表的能力について要約する。新しい評価フレームワークでは、新しいタスクスイートである textbfDLUE の textbfDocument Language Understanding Evaluation を提案する。
論文参考訳（メタデータ） (2023-05-16T15:16:24Z)
Embedding Knowledge for Document Summarization: A Survey [66.76415502727802]
従来の研究は、知識を組み込んだ文書要約器が優れた消化器を生成するのに優れていたことを証明した。本稿では,文書要約ビューに基づいて,知識と知識の埋め込みを再カプセル化する手法を提案する。
論文参考訳（メタデータ） (2022-04-24T04:36:07Z)
Unified Pretraining Framework for Document Understanding [52.224359498792836]
文書理解のための統合事前学習フレームワークであるUDocを紹介する。 UDocは、ほとんどのドキュメント理解タスクをサポートするように設計されており、Transformerを拡張してマルチモーダル埋め込みを入力とする。 UDocの重要な特徴は、3つの自己管理的損失を利用して汎用的な表現を学ぶことである。
論文参考訳（メタデータ） (2022-04-22T21:47:04Z)
Document AI: Benchmarks, Models and Applications [35.46858492311289]
ドキュメントAI(Document AI)とは、ビジネス文書を自動的に読み、理解し、分析する技術である。近年、ディープラーニング技術の人気は、Document AIの開発を大きく進めている。本稿では,代表モデル,タスク,ベンチマークデータセットについて概説する。
論文参考訳（メタデータ） (2021-11-16T16:43:07Z)
Explaining Relationships Between Scientific Documents [55.23390424044378]
本稿では,2つの学術文書間の関係を自然言語テキストを用いて記述する課題に対処する。本稿では154K文書から622Kサンプルのデータセットを作成する。
論文参考訳（メタデータ） (2020-02-02T03:54:47Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。