論文の概要: Unsupervised Deep Learning for Handwritten Page Segmentation
- arxiv url: http://arxiv.org/abs/2101.07487v1
- Date: Tue, 19 Jan 2021 07:13:38 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-23 14:05:29.151527
- Title: Unsupervised Deep Learning for Handwritten Page Segmentation
- Title(参考訳): 手書きページセグメンテーションのための教師なしディープラーニング
- Authors: Ahmad Droby, Berat Kurar Barakat, Borak Madi, Reem Alaasam and Jihad
El-Sana
- Abstract要約: ページ分割のための教師なし深層学習法を提案する。
サイアムスニューラルネットワークは、測定可能な特性を使用してパッチを区別するように訓練される。
実験の結果,提案手法は通常の教師なし手法と同じくらい有効であることがわかった。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Segmenting handwritten document images into regions with homogeneous patterns
is an important pre-processing step for many document images analysis tasks.
Hand-labeling data to train a deep learning model for layout analysis requires
significant human effort. In this paper, we present an unsupervised deep
learning method for page segmentation, which revokes the need for annotated
images. A siamese neural network is trained to differentiate between patches
using their measurable properties such as number of foreground pixels, and
average component height and width. The network is trained that spatially
nearby patches are similar. The network's learned features are used for page
segmentation, where patches are classified as main and side text based on the
extracted features. We tested the method on a dataset of handwritten document
images with quite complex layouts. Our experiments show that the proposed
unsupervised method is as effective as typical supervised methods.
- Abstract(参考訳): 手書きの文書画像を均質なパターンで領域に分割することは、多くの文書画像分析タスクにおいて重要な前処理ステップである。
レイアウト分析のためのディープラーニングモデルをトレーニングするための手ラベルデータには、かなりの人的労力が必要です。
本稿では,注釈付き画像の必要性を排除したページセグメンテーションのための教師なしディープラーニング手法を提案する。
サイムズニューラルネットワークは、前景画素数、平均コンポーネント高さと幅などの測定可能な特性を用いてパッチを区別するように訓練される。
ネットワークは、空間的に近接するパッチが似ているように訓練される。
ネットワークの学習した機能はページセグメンテーションに使用され、パッチは抽出された特徴に基づいてメインテキストとサイドテキストに分類される。
非常に複雑なレイアウトで手書き文書画像のデータセット上で本手法を検証した。
実験の結果,提案手法は通常の教師なし手法と同じくらい有効であることがわかった。
- 全文 参考訳へのリンク
関連論文リスト
- LEAD: Self-Supervised Landmark Estimation by Aligning Distributions of
Feature Similarity [49.84167231111667]
自己監督型ランドマーク検出における既存の研究は、画像から高密度(ピクセルレベルの)特徴表現を学習することに基づいている。
自己教師付き方式で高密度同変表現の学習を強化するアプローチを提案する。
機能抽出器にそのような先行性があることは,アノテーションの数が大幅に制限されている場合でも,ランドマーク検出に役立ちます。
論文 参考訳(メタデータ) (2022-04-06T17:48:18Z) - Learning To Segment Dominant Object Motion From Watching Videos [72.57852930273256]
我々は,有意な移動物体セグメンテーションのための単純なフレームワークを構想する。このフレームワークは,有意なデータを必要としないし,有意な前処理や事前学習された光フローマップに依存しない。
層状画像表現に着想を得て,アフィンパラメトリックの動きに応じて画素領域をグループ化する手法を提案する。
これにより、トレーニングと推論の両方の入力として、RGBイメージペアのみを使用して、支配的なフォアグラウンドオブジェクトのセグメンテーションを学習することができる。
論文 参考訳(メタデータ) (2021-11-28T14:51:00Z) - A Pixel-Level Meta-Learner for Weakly Supervised Few-Shot Semantic
Segmentation [40.27705176115985]
Few-shotのセマンティックセマンティックセグメンテーションは、興味のある新しいクラスのために、地上の真実のピクセルレベルのラベルを持つ少数の画像しか利用できない学習タスクに対処する。
限られたデータとその意味ラベルから擬似画素レベルのセグメンテーションマスクを予測するメタラーニングフレームワークを提案する。
提案する学習モデルは,画素レベルのメタラーナーとみなすことができる。
論文 参考訳(メタデータ) (2021-11-02T08:28:11Z) - Grasp-Oriented Fine-grained Cloth Segmentation without Real Supervision [66.56535902642085]
本稿では, 深度画像のみを用いて, 変形した衣服のきめ細かい領域検出の問題に取り組む。
最大で6つの意味領域を定義し, 首の縁, スリーブカフ, ヘム, 上と下をつかむ点を含む。
これらの部品のセグメント化とラベル付けを行うために,U-net ベースのネットワークを導入する。
合成データのみを用いてネットワークをトレーニングし、提案したDAが実データでトレーニングしたモデルと競合する結果が得られることを示す。
論文 参考訳(メタデータ) (2021-10-06T16:31:20Z) - Segmentation of VHR EO Images using Unsupervised Learning [19.00071868539993]
単一のラベルのないシーンでトレーニングできる教師なしセマンティックセマンティックセマンティクス手法を提案する。
提案手法は、この特性を利用して、より大きなシーンから小さなパッチをサンプリングする。
対象画像/シーンの教師なしトレーニングの後、モデルはシーンに存在する主要なクラスを自動的に分離し、セグメンテーションマップを生成する。
論文 参考訳(メタデータ) (2021-07-09T11:42:48Z) - Exploiting the relationship between visual and textual features in
social networks for image classification with zero-shot deep learning [0.0]
本稿では,CLIPニューラルネットワークアーキテクチャの伝達可能な学習能力に基づく分類器アンサンブルを提案する。
本研究は,Placesデータセットのラベルによる画像分類タスクに基づいて,視覚的部分のみを考慮した実験である。
画像に関連付けられたテキストを考えることは、目標に応じて精度を向上させるのに役立つ。
論文 参考訳(メタデータ) (2021-07-08T10:54:59Z) - Unsupervised learning of text line segmentation by differentiating
coarse patterns [0.0]
距離が粗いテキスト行パターンに類似するコンパクトユークリッド空間に文書イメージパッチを埋め込む教師なしのディープラーニング手法を提案する。
テキスト行のセグメンテーションは、埋め込み特徴ベクトルを使って標準技術を使って容易に実装できる。
本手法は,テキスト行分割データセットのいくつかの変種に対して定性的かつ定量的に評価し,その効果を実証する。
論文 参考訳(メタデータ) (2021-05-19T21:21:30Z) - Semantic Segmentation with Generative Models: Semi-Supervised Learning
and Strong Out-of-Domain Generalization [112.68171734288237]
本論文では,画像とラベルの再生モデルを用いた識別画素レベルのタスクのための新しいフレームワークを提案する。
我々は,共同画像ラベルの分布を捕捉し,未ラベル画像の大規模な集合を用いて効率的に訓練する生成的対向ネットワークを学習する。
ドメイン内性能をいくつかのベースラインと比較し,ドメイン外一般化を極端に示す最初の例である。
論文 参考訳(メタデータ) (2021-04-12T21:41:25Z) - Data Augmentation for Object Detection via Differentiable Neural
Rendering [71.00447761415388]
注釈付きデータが乏しい場合、堅牢なオブジェクト検出器を訓練することは困難です。
この問題に対処する既存のアプローチには、ラベル付きデータからラベル付きデータを補間する半教師付き学習が含まれる。
オブジェクト検出のためのオフラインデータ拡張手法を導入し、新しいビューでトレーニングデータを意味的に補間する。
論文 参考訳(メタデータ) (2021-03-04T06:31:06Z) - Multiple Document Datasets Pre-training Improves Text Line Detection
With Deep Neural Networks [2.5352713493505785]
本稿では,文書レイアウト解析タスクのための完全畳み込みネットワークを提案する。
Doc-UFCNは、歴史的文書から物体を検出するためにゼロから訓練されたU字型モデルを用いています。
Doc-UFCNが様々なデータセットの最先端のメソッドより優れていることを示す。
論文 参考訳(メタデータ) (2020-12-28T09:48:33Z) - Group-Wise Semantic Mining for Weakly Supervised Semantic Segmentation [49.90178055521207]
この研究は、画像レベルのアノテーションとピクセルレベルのセグメンテーションのギャップを埋めることを目標に、弱い監督されたセマンティックセグメンテーション(WSSS)に対処する。
画像群における意味的依存関係を明示的にモデル化し,より信頼性の高い擬似的基盤構造を推定する,新たなグループ学習タスクとしてWSSSを定式化する。
特に、入力画像がグラフノードとして表現されるグループ単位のセマンティックマイニングのためのグラフニューラルネットワーク(GNN)を考案する。
論文 参考訳(メタデータ) (2020-12-09T12:40:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。