論文の概要: Automatic Page Segmentation Without Decompressing the Run-Length
Compressed Text Documents
- arxiv url: http://arxiv.org/abs/2007.01142v1
- Date: Thu, 2 Jul 2020 14:29:35 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-14 14:28:33.453278
- Title: Automatic Page Segmentation Without Decompressing the Run-Length
Compressed Text Documents
- Title(参考訳): 実行長圧縮文書を非圧縮で自動ページ分割
- Authors: Mohammed Javed and P. Nagabhushan
- Abstract要約: ページセグメンテーションは複雑なレイアウトを持つ文書の自動解析において重要な段階であると考えられている。
本稿では,CCITT Group-3圧縮文書の実行長データに直接ページ分割操作を行う可能性を示す。
テキスト文書の前処理は、通常テキスト領域と反転テキスト領域を識別し、反転テキスト領域を通常モードに切り替える。
- 参考スコア(独自算出の注目度): 1.2487990897680425
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Page segmentation is considered to be the crucial stage for the automatic
analysis of documents with complex layouts. This has traditionally been carried
out in uncompressed documents, although most of the documents in real life
exist in a compressed form warranted by the requirement to make storage and
transfer efficient. However, carrying out page segmentation directly in
compressed documents without going through the stage of decompression is a
challenging goal. This research paper proposes demonstrating the possibility of
carrying out a page segmentation operation directly in the run-length data of
the CCITT Group-3 compressed text document, which could be single- or
multi-columned and might even have some text regions in the inverted text color
mode. Therefore, before carrying out the segmentation of the text document into
columns, each column into paragraphs, each paragraph into text lines, each line
into words, and, finally, each word into characters, a pre-processing of the
text document needs to be carried out. The pre-processing stage identifies the
normal text regions and inverted text regions, and the inverted text regions
are toggled to the normal mode. In the sequel to initiate column separation, a
new strategy of incremental assimilation of white space runs in the vertical
direction and the auto-estimation of certain related parameters is proposed. A
procedure to realize column-segmentation employing these extracted parameters
has been devised. Subsequently, what follows first is a two-level horizontal
row separation process, which segments every column into paragraphs, and in
turn, into text-lines. Then, there is a two-level vertical column separation
process, which completes the separation into words and characters.
- Abstract(参考訳): ページ分割は複雑なレイアウトを持つ文書の自動分析において重要な段階であると考えられている。
これは伝統的に圧縮されていない文書で行われてきたが、実際の文書のほとんどは保存と転送を効率よくすることを要求する圧縮形式で存在する。
しかし,圧縮の段階を経ることなく,圧縮文書内で直接ページ分割を行うことは難しい課題である。
本研究では,ccitt group-3圧縮テキスト文書のラン長データに直接ページ分割操作を行う可能性を示す。
そのため、テキスト文書を列に分割する前に、各欄を段落に、各段落をテキスト行に、各行を単語に分割し、最後に各単語を文字に分割して、テキスト文書の事前処理を行う必要がある。
プリプロセッシングステージは、通常のテキスト領域と反転したテキスト領域を識別し、反転したテキスト領域を通常のモードにトグルする。
カラム分離開始の続編では,空白空間の漸進的同化の新たな戦略が垂直方向に実行され,関連するパラメータの自己推定が提案されている。
これらのパラメータを用いた列セグメンテーションを実現する手法を考案した。
次に、次に示すのは2段階の水平行分離プロセスで、各列を段落に分割し、次にテキストラインに分割する。
そして、単語と文字の分離を完了させる2段階の縦列分離プロセスが存在する。
関連論文リスト
- Visually Guided Generative Text-Layout Pre-training for Document Intelligence [51.09853181377696]
視覚誘導型生成テキスト事前学習(ViTLP)を提案する。
文書画像が与えられた場合、モデルは階層言語とレイアウトモデリングの目的を最適化し、インターリーブされたテキストとレイアウトシーケンスを生成する。
ViTLPは、文書画像のテキストをローカライズし、認識するためのネイティブなOCRモデルとして機能する。
論文 参考訳(メタデータ) (2024-03-25T08:00:43Z) - From Text Segmentation to Smart Chaptering: A Novel Benchmark for
Structuring Video Transcriptions [63.11097464396147]
音声コンテンツに焦点をあてた新しいベンチマークYTSegを導入し、その内容は本質的に非構造的であり、トポロジと構造的にも多様である。
また,高効率な階層分割モデルMiniSegを導入する。
論文 参考訳(メタデータ) (2024-02-27T15:59:37Z) - Segmenting Messy Text: Detecting Boundaries in Text Derived from
Historical Newspaper Images [0.0]
新聞の結婚発表リストを1つの発表単位に分けるという,困難なテキストセグメンテーションの課題について考察する。
多くの場合、情報は文に構造化されず、隣接するセグメントは互いに位相的に区別されない。
本稿では,このようなテキストをセグメント化するための新しいディープラーニングモデルを提案する。
論文 参考訳(メタデータ) (2023-12-20T05:17:06Z) - Handwritten and Printed Text Segmentation: A Signature Case Study [0.0]
我々は手書きテキストセグメンテーションの課題に対処するための新しいアプローチを開発する。
我々の目的は、クラス全体からテキストを復元することであり、特に重なり合う部分のセグメンテーション性能を向上させることである。
私たちの最高の設定は、以前の2つの異なるデータセットで17.9%、IoUスコアで7.3%のパフォーマンスを上回っています。
論文 参考訳(メタデータ) (2023-07-15T21:49:22Z) - Copy Is All You Need [66.00852205068327]
既存のテキストコレクションからテキストセグメントを段階的にコピーするテキスト生成を定式化する。
提案手法は, 自動評価と人的評価の両方により, より優れた生成品質を実現する。
当社のアプローチでは,より大規模なテキストコレクションにスケールアップすることで,さらなるパフォーマンス向上を実現しています。
論文 参考訳(メタデータ) (2023-07-13T05:03:26Z) - Towards End-to-end Handwritten Document Recognition [0.0]
手書き文字認識は、その多くの応用のために過去数十年にわたって広く研究されてきた。
本稿では,文書全体の手書きテキスト認識をエンドツーエンドで行うことで,これらの課題に対処することを提案する。
RIMES 2011, IAM, READ 2016 データセットの段落レベルでの最先端結果に到達し, これらのデータセットのラインレベル状態よりも優れていた。
論文 参考訳(メタデータ) (2022-09-30T10:31:22Z) - Towards End-to-End Unified Scene Text Detection and Layout Analysis [60.68100769639923]
本稿では,シーンテキストの検出とレイアウト解析を統合化するタスクについて紹介する。
この新たな研究課題を実現するために、最初の階層的なシーンテキストデータセットが導入された。
また,シーンテキストを同時に検出し,テキストクラスタを統一的に形成する手法を提案する。
論文 参考訳(メタデータ) (2022-03-28T23:35:45Z) - A Simple and Strong Baseline: Progressively Region-based Scene Text
Removal Networks [72.32357172679319]
本稿では, Progressively Region-based scene Text eraser (PERT)を提案する。
PERTはSTRタスクをいくつかの消去段階に分解する。
PERTは、テキストフリー領域の完全性を保証するために、リージョンベースの修正戦略を導入している。
論文 参考訳(メタデータ) (2021-06-24T14:06:06Z) - Topical Change Detection in Documents via Embeddings of Long Sequences [4.13878392637062]
テキストセグメンテーションのタスクを独立した教師付き予測タスクとして定式化する。
類似セクションの段落を微調整することで、学習した特徴がトピック情報をエンコードすることを示すことができます。
文レベルで操作する従来のアプローチとは異なり、我々は常により広いコンテキストを使用します。
論文 参考訳(メタデータ) (2020-12-07T12:09:37Z) - Learning to Select Bi-Aspect Information for Document-Scale Text Content
Manipulation [50.01708049531156]
我々は、テキストスタイルの転送とは逆の文書スケールのテキストコンテンツ操作という、新しい実践的なタスクに焦点を当てる。
詳細は、入力は構造化されたレコードと、別のレコードセットを記述するための参照テキストのセットである。
出力は、ソースレコードセットの部分的内容と参照の書き込みスタイルを正確に記述した要約である。
論文 参考訳(メタデータ) (2020-02-24T12:52:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。