論文の概要: Confidence Score for Unsupervised Foreground Background Separation of
Document Images
- arxiv url: http://arxiv.org/abs/2204.04044v1
- Date: Sun, 3 Apr 2022 18:22:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-17 07:43:29.279978
- Title: Confidence Score for Unsupervised Foreground Background Separation of
Document Images
- Title(参考訳): 文書画像の教師なし背景分離のための信頼スコア
- Authors: Soumyadeep Dey and Pratik Jawanpuria
- Abstract要約: このようなアルゴリズムにおける分類の信頼性スコアを計算するための新しい手法を提案する。
提案手法の計算複雑性は、基礎となる二項化アルゴリズムと同じである。
- 参考スコア(独自算出の注目度): 5.279475826661642
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Foreground-background separation is an important problem in document image
analysis. Popular unsupervised binarization methods (such as the Sauvola's
algorithm) employ adaptive thresholding to classify pixels as foreground or
background. In this work, we propose a novel approach for computing confidence
scores of the classification in such algorithms. This score provides an insight
of the confidence level of the prediction. The computational complexity of the
proposed approach is the same as the underlying binarization algorithm. Our
experiments illustrate the utility of the proposed scores in various
applications like document binarization, document image cleanup, and texture
addition.
- Abstract(参考訳): 前景背景分離は文書画像解析において重要な問題である。
一般的な教師なし双対化法(ソーヴォーラのアルゴリズムなど)では、ピクセルを前景や背景として分類するために適応しきい値を用いる。
本研究では,このようなアルゴリズムにおける分類の信頼度スコアを計算するための新しい手法を提案する。
このスコアは、予測の信頼性レベルに関する洞察を提供する。
提案手法の計算複雑性は基礎となる2値化アルゴリズムと同じである。
提案するスコアは,文書のバイナリ化,文書画像のクリーンアップ,テクスチャの追加など,さまざまなアプリケーションにおいて有用性を示す。
関連論文リスト
- DeepClean: Integrated Distortion Identification and Algorithm Selection for Rectifying Image Corruptions [1.8024397171920883]
画像歪みの自動分類と修正のための2段階逐次計画手法を提案する。
提案手法の利点は、入力画像に条件付けされた動的再構成と、推論時に未確認候補アルゴリズムの一般化である。
論文 参考訳(メタデータ) (2024-07-23T08:57:11Z) - Breaking the Frame: Visual Place Recognition by Overlap Prediction [53.17564423756082]
本稿では,重なり合う予測に基づく新しい視覚的位置認識手法 VOP を提案する。
VOPは、Vision Transformerのバックボーンを使用してパッチレベルの埋め込みを取得することで、コビジュアブルなイメージセクションを進める。
提案手法では,データベース画像の重複点の評価に投票機構を用いる。
論文 参考訳(メタデータ) (2024-06-23T20:00:20Z) - Secure Information Embedding in Images with Hybrid Firefly Algorithm [2.9182357325967145]
本研究は,ホストイメージ内に機密文書フォーマット(PDF)を隠蔽する新たなステガノグラフィ手法を提案する。
この探索の目的は、ホスト画像のキャパシティを増大させ、歪みを減少させる2つの主要な目標を達成することである。
その結果,画像の歪みの減少と探索過程における収束速度の加速が示唆された。
論文 参考訳(メタデータ) (2023-12-21T01:50:02Z) - Pattern Spotting and Image Retrieval in Historical Documents using Deep
Hashing [60.67014034968582]
本稿では,歴史文書のデジタルコレクションにおける画像検索とパターンスポッティングのためのディープラーニング手法を提案する。
ディープラーニングモデルは、実数値またはバイナリコード表現を提供する2つの異なるバリエーションを考慮して、特徴抽出に使用される。
また,提案手法により検索時間を最大200倍に短縮し,関連する作業と比較してストレージコストを最大6,000倍に削減する。
論文 参考訳(メタデータ) (2022-08-04T01:39:37Z) - Two-stream Hierarchical Similarity Reasoning for Image-text Matching [66.43071159630006]
文脈情報を自動的に抽出する階層的類似性推論モジュールを提案する。
従来のアプローチでは、シングルストリームの類似性アライメントを学習することしか検討されていなかった。
イメージ・ツー・テキスト・レベルの類似性計算とテキスト・ツー・テキスト・レベルの類似性計算に画像・テキストマッチングを分解する2ストリームアーキテクチャを開発した。
論文 参考訳(メタデータ) (2022-03-10T12:56:10Z) - Region-level Active Learning for Cluttered Scenes [60.93811392293329]
本稿では,従来の画像レベルのアプローチとオブジェクトレベルのアプローチを一般化した領域レベルのアプローチに仮定する新たな戦略を提案する。
その結果,本手法はラベル付けの労力を大幅に削減し,クラス不均衡や散らかったシーンを生かしたリアルなデータに対する希少なオブジェクト検索を改善することが示唆された。
論文 参考訳(メタデータ) (2021-08-20T14:02:38Z) - Controllable Confidence-Based Image Denoising [0.0]
本稿では,信頼度に基づくノイズ除去を制御可能なフレームワークを提案する。
このフレームワークは、2つの異なる識別された画像の融合に基づいている。
提案するフレームワークの有効性を,異なるユースケースで示す。
論文 参考訳(メタデータ) (2021-06-17T08:25:12Z) - An Unsupervised Sampling Approach for Image-Sentence Matching Using
Document-Level Structural Information [64.66785523187845]
教師なし画像文マッチングの問題に焦点をあてる。
既存の研究では、文書レベルの構造情報を用いて、モデルトレーニングの正および負のインスタンスをサンプリングする方法が検討されている。
そこで本研究では,追加の文書内画像-文対を正あるいは負のサンプルとして選択する新しいサンプリング手法を提案する。
論文 参考訳(メタデータ) (2021-03-21T05:43:29Z) - Unsupervised Neural Domain Adaptation for Document Image Binarization [13.848843012433187]
本稿では,ニューラルネットワークとドメイン適応(DA)を組み合わせて,教師なし文書のバイナライゼーションを行う手法を提案する。
その結果,ラベル付きデータを必要とせず,新たな文書領域の双対化をうまく処理できることが示唆された。
論文 参考訳(メタデータ) (2020-12-02T13:42:38Z) - Distilling Localization for Self-Supervised Representation Learning [82.79808902674282]
コントラスト学習は教師なし表現学習に革命をもたらした。
現在のコントラストモデルでは、前景オブジェクトのローカライズには効果がない。
本稿では,背景変化を学習するためのデータ駆動型手法を提案する。
論文 参考訳(メタデータ) (2020-04-14T16:29:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。