Fugu-MT 論文翻訳(概要): Deep learning for table detection and structure recognition: A survey

論文の概要: Deep learning for table detection and structure recognition: A survey

arxiv url: http://arxiv.org/abs/2211.08469v1
Date: Tue, 15 Nov 2022 19:42:27 GMT
ステータス: 翻訳完了
システム内更新日: 2022-11-17 15:13:07.411142
Title: Deep learning for table detection and structure recognition: A survey
Title（参考訳）: テーブル検出と構造認識のための深層学習:調査
Authors: Mahmoud Kasem, Abdelrahman Abdallah, Alexander Berendeyev, Ebrahem Elkady, Mahmoud Abdalla, Mohamed Mahmoud, Mohamed Hamada, Daniyar Nurseitov, Islam Taj-Eddin
Abstract要約: 本調査の目的は,テーブル検出の分野での大きな進展を深く理解することである。この分野における古典的アプリケーションと新しいアプリケーションの両方について分析する。既存のモデルのデータセットとソースコードは、読者にこの膨大な文献のコンパスを提供するために組織されている。
参考スコア（独自算出の注目度）: 49.09628624903334
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Tables are everywhere, from scientific journals, papers, websites, and newspapers all the way to items we buy at the supermarket. Detecting them is thus of utmost importance to automatically understanding the content of a document. The performance of table detection has substantially increased thanks to the rapid development of deep learning networks. The goals of this survey are to provide a profound comprehension of the major developments in the field of Table Detection, offer insight into the different methodologies, and provide a systematic taxonomy of the different approaches. Furthermore, we provide an analysis of both classic and new applications in the field. Lastly, the datasets and source code of the existing models are organized to provide the reader with a compass on this vast literature. Finally, we go over the architecture of utilizing various object detection and table structure recognition methods to create an effective and efficient system, as well as a set of development trends to keep up with state-of-the-art algorithms and future research. We have also set up a public GitHub repository where we will be updating the most recent publications, open data, and source code. The GitHub repository is available at https://github.com/abdoelsayed2016/table-detection-structure-recognition.
Abstract（参考訳）: テーブルは科学雑誌、新聞、ウェブサイト、新聞からスーパーマーケットで購入した商品まで、至るところにある。それらを検出することは、文書の内容を自動的に理解する上で最も重要である。深層学習ネットワークの急速な発展により,テーブル検出の性能は大幅に向上した。この調査の目的は、テーブル検出の分野における主要な発展を深く理解し、異なる方法論についての洞察を提供し、異なるアプローチの体系的分類を提供することである。さらに,この分野の古典的アプリケーションと新しいアプリケーションの分析も提供する。最後に、既存のモデルのデータセットとソースコードが整理され、読者にこの膨大な文献に対するコンパスを提供する。最後に、さまざまなオブジェクト検出とテーブル構造認識手法を利用して効率的かつ効率的なシステムを構築するアーキテクチャと、最先端のアルゴリズムと将来の研究に追従する開発動向のセットについて検討する。私たちはまた、最新の出版物、オープンデータ、ソースコードを更新する、パブリックなGitHubリポジトリも設置しました。 githubリポジトリはhttps://github.com/abdoelsayed2016/table-detection-structure-recognitionで入手できる。

関連論文リスト

From Web Search towards Agentic Deep Research: Incentivizing Search with Reasoning Agents [96.65646344634524]
推論とエージェント能力を備えた大規模言語モデル(LLM)は、エージェントディープリサーチ(Agenic Deep Research)と呼ばれる新しいパラダイムを取り入れている。静的なWeb検索から,計画,探索,学習を行う対話型エージェントベースのシステムへの進化を辿ります。我々はエージェントディープリサーチが既存のアプローチを著しく上回るだけでなく、将来の情報探索において支配的なパラダイムになることを実証する。
論文参考訳（メタデータ） (2025-06-23T17:27:19Z)
Weak Supervision for Improved Precision in Search Systems [1.5773159234875098]
本稿では,クエリとドキュメントのペアの品質を推定するための弱い監視手法を提案する。大規模検索システムの精度を高めるために,ラーニング・トゥ・ランク・フレームワークに応用する。
論文参考訳（メタデータ） (2025-03-10T08:06:30Z)
Masked Image Modeling: A Survey [73.21154550957898]
マスク付き画像モデリングは、コンピュータビジョンにおける強力な自己教師付き学習技術として登場した。我々は近年,分類学を構築し,最も顕著な論文をレビューしている。我々は,最も人気のあるデータセット上で,様々なマスク付き画像モデリング手法の性能評価結果を集約する。
論文参考訳（メタデータ） (2024-08-13T07:27:02Z)
DiscoveryBench: Towards Data-Driven Discovery with Large Language Models [50.36636396660163]
我々は、データ駆動探索の多段階プロセスを形式化する最初の包括的なベンチマークであるDiscoveryBenchを紹介する。我々のベンチマークには、社会学や工学などの6つの分野にまたがる264のタスクが含まれている。私たちのベンチマークでは、自律的なデータ駆動型発見の課題を説明し、コミュニティが前進するための貴重なリソースとして役立ちます。
論文参考訳（メタデータ） (2024-07-01T18:58:22Z)
From Pixels to Insights: A Survey on Automatic Chart Understanding in the Era of Large Foundation Models [98.41645229835493]
グラフ形式のデータの可視化は、データ分析において重要な役割を担い、重要な洞察を提供し、情報的な意思決定を支援する。大規模言語モデルのような大規模な基盤モデルは、様々な自然言語処理タスクに革命をもたらした。本研究は,自然言語処理,コンピュータビジョン,データ解析の分野における研究者や実践者の包括的資源として機能する。
論文参考訳（メタデータ） (2024-03-18T17:57:09Z)
FaKnow: A Unified Library for Fake News Detection [11.119667583594483]
FaKnowは統合的で総合的なフェイクニュース検出アルゴリズムライブラリである。モデルトレーニングと評価プロセスの全スペクトルをカバーする。視覚化やロギングなど,一連の補助機能やツールを備えている。
論文参考訳（メタデータ） (2024-01-27T13:29:17Z)
Large Language Models for Generative Information Extraction: A Survey [89.71273968283616]
大規模言語モデル(LLM)は、テキスト理解と生成において顕著な能力を示した。各種IEサブタスクと技術の観点から,これらの作品を分類して概観する。我々は,最も先進的な手法を実証的に分析し,LLMによるIEタスクの出現傾向を明らかにする。
論文参考訳（メタデータ） (2023-12-29T14:25:22Z)
Source Code Data Augmentation for Deep Learning: A Survey [32.035973285175075]
ソースコードに対するデータ拡張に関する包括的調査を行う。 DAの品質を最適化するための一般的な戦略とテクニックを強調します。今後の研究の課題と可能性について概説する。
論文参考訳（メタデータ） (2023-05-31T14:47:44Z)
ALBench: A Framework for Evaluating Active Learning in Object Detection [102.81795062493536]
本稿では、オブジェクト検出におけるアクティブラーニングを評価するために、ALBenchという名前のアクティブラーニングベンチマークフレームワークをコントリビュートする。自動深層モデルトレーニングシステム上で開発されたこのALBenchフレームワークは、使いやすく、さまざまなアクティブな学習アルゴリズムと互換性があり、同じトレーニングおよびテストプロトコルを保証する。
論文参考訳（メタデータ） (2022-07-27T07:46:23Z)
A Survey of Deep Learning Models for Structural Code Understanding [21.66270320648155]
本稿では,コードデータから形成される構造について概観する。近年のコード理解モデルは,シーケンスベースモデルとグラフベースモデルという2つのグループに分類されている。メトリクスやデータセット、下流タスクも導入しています。
論文参考訳（メタデータ） (2022-05-03T03:56:17Z)
Autoregressive Search Engines: Generating Substrings as Document Identifiers [53.0729058170278]
自動回帰言語モデルは、回答を生成するデファクト標準として現れています。これまでの研究は、探索空間を階層構造に分割する方法を探究してきた。本研究では,検索空間の任意の構造を強制しない代替として,経路内のすべてのngramを識別子として使用することを提案する。
論文参考訳（メタデータ） (2022-04-22T10:45:01Z)
Tell Me How to Survey: Literature Review Made Simple with Automatic Reading Path Generation [16.07200776251764]
論文を大量の文献から読めば、簡単な調査をしたり、特定の研究トピックに関する最新の進歩に遅れないようにする方法が課題になっている。 Google Scholarのような既存の学術検索エンジンは、各論文とクエリ間の関連性を個別に計算することで、関連論文を返す。本稿では,あるクエリに対して読み込む論文のパスを自動生成することを目的とした読解パス生成(RPG)を紹介する。
論文参考訳（メタデータ） (2021-10-12T20:58:46Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。