論文の概要: Post-Processing Mask-Based Table Segmentation for Structural Coordinate Extraction
- arxiv url: http://arxiv.org/abs/2512.21287v1
- Date: Wed, 24 Dec 2025 17:10:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-25 19:43:21.836752
- Title: Post-Processing Mask-Based Table Segmentation for Structural Coordinate Extraction
- Title(参考訳): 構造コーディネート抽出のためのポストプロシースマスク型テーブルセグメンテーション
- Authors: Suren Bandara,
- Abstract要約: 本稿では,テーブルマスクからテーブルエッジを検出するためのマルチスケール信号処理手法を提案する。
ロウとカラムの遷移は1次元信号としてモデル化され、ガウスの畳み込みを用いて処理される。
この方法は、ゼロパディングとスケーリング戦略による解像度の変動に対して堅牢である。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Structured data extraction from tables plays a crucial role in document image analysis for scanned documents and digital archives. Although many methods have been proposed to detect table structures and extract cell contents, accurately identifying table segment boundaries (rows and columns) remains challenging, particularly in low-resolution or noisy images. In many real-world scenarios, table data are incomplete or degraded, limiting the adaptability of transformer-based methods to noisy inputs. Mask-based edge detection techniques have shown greater robustness under such conditions, as their sensitivity can be adjusted through threshold tuning; however, existing approaches typically apply masks directly to images, leading to noise sensitivity, resolution loss, or high computational cost. This paper proposes a novel multi-scale signal-processing method for detecting table edges from table masks. Row and column transitions are modeled as one-dimensional signals and processed using Gaussian convolution with progressively increasing variances, followed by statistical thresholding to suppress noise while preserving stable structural edges. Detected signal peaks are mapped back to image coordinates to obtain accurate segment boundaries. Experimental results show that applying the proposed approach to column edge detection improves Cell-Aware Segmentation Accuracy (CASA) a layout-aware metric evaluating both textual correctness and correct cell placement from 67% to 76% on the PubLayNet-1M benchmark when using TableNet with PyTesseract OCR. The method is robust to resolution variations through zero-padding and scaling strategies and produces optimized structured tabular outputs suitable for downstream analysis.
- Abstract(参考訳): テーブルから構造化されたデータ抽出は、スキャンされた文書やデジタルアーカイブの文書画像解析において重要な役割を果たす。
テーブル構造の検出やセルの内容の抽出には多くの方法が提案されているが、特に低解像度画像やノイズ画像において、テーブルセグメントの境界(行と列)を正確に識別することは困難である。
多くの実世界のシナリオでは、テーブルデータは不完全または劣化しており、変換器ベースのメソッドのノイズの多い入力への適応性を制限する。
マスクベースのエッジ検出技術は、しきい値調整によって感度を調整できるため、そのような条件下でより堅牢性を示すが、既存のアプローチではマスクを画像に直接適用し、ノイズ感度、分解能損失、高い計算コストをもたらすのが一般的である。
本稿では,テーブルマスクからテーブルエッジを検出するためのマルチスケール信号処理手法を提案する。
ロウとカラムの遷移は1次元信号としてモデル化され、ガウスの畳み込みを用いて処理される。
検出された信号ピークを画像座標にマッピングして正確なセグメント境界を求める。
提案手法をカラムエッジ検出に適用することにより,PyTesseract OCRでTableNetを使用する場合のPubLayNet-1Mベンチマークにおいて,テキストの正確さと正しいセル配置を67%から76%評価するレイアウトアウェアセグメンテーション精度(CASA)が向上することを示す。
本手法は,ゼロパディングおよびスケーリング戦略による分解能の変動に対して堅牢であり,下流解析に適した最適化された表形式出力を生成する。
関連論文リスト
- High-Frequency Prior-Driven Adaptive Masking for Accelerating Image Super-Resolution [87.56382172827526]
高周波領域は再建に最も重要である。
本稿では,アクセラレーションのためのトレーニング不要適応マスキングモジュールを提案する。
本手法は,最先端モデルのFLOPを24~43%削減する。
論文 参考訳(メタデータ) (2025-05-11T13:18:03Z) - Edge-preserving Image Denoising via Multi-scale Adaptive Statistical Independence Testing [2.8724598079549715]
マルチスケール適応独立性テストに基づくエッジ検出・デノイング(EDD-MAIT)を提案する。
EDD-MAITはチャンネルアテンション機構と独立テストを統合している。
Fスコア、MSE、PSNR、ランタイムの削減など、堅牢性、正確性、効率性の向上を実現している。
論文 参考訳(メタデータ) (2025-05-02T06:09:32Z) - Best Transition Matrix Esitimation or Best Label Noise Robustness Classifier? Two Possible Methods to Enhance the Performance of T-revision [1.53744306569115]
ラベルノイズ(英: Label noise)とは、人間のエラーやコレクションの欠陥に起因するデータセットの不正なラベルを指す。
本稿では,雑音遷移行列を推定し,ラベル雑音に対して頑健なディープラーニング分類器を構築する方法について検討する。
論文 参考訳(メタデータ) (2025-01-02T18:27:30Z) - Adaptive Signal Analysis for Automated Subsurface Defect Detection Using Impact Echo in Concrete Slabs [0.0]
本研究は,コンクリートスラブの地下欠陥発生領域を検出するための,新しい,自動化された,スケーラブルな手法を提案する。
このアプローチは、高度な信号処理、クラスタリング、および視覚分析を統合して、地下の異常を識別する。
結果は方法論の堅牢性を示し、最小限の偽陽性とほとんど欠陥のない欠陥発生領域を一貫して同定した。
論文 参考訳(メタデータ) (2024-12-23T20:05:53Z) - A Hybrid Framework for Statistical Feature Selection and Image-Based Noise-Defect Detection [55.2480439325792]
本稿では,統計的特徴選択と分類技術を統合し,欠陥検出精度を向上させるハイブリッドフレームワークを提案する。
工業画像から抽出した55個の特徴を統計的手法を用いて解析した。
これらの手法をフレキシブルな機械学習アプリケーションに統合することにより、検出精度を改善し、偽陽性や誤分類を減らす。
論文 参考訳(メタデータ) (2024-12-11T22:12:21Z) - TSRFormer: Table Structure Recognition with Transformers [15.708108572696064]
本稿では,TSRFormerと呼ばれる新しいテーブル構造認識手法を提案する。
新たな2段階DETRに基づくセパレータ予測手法である textbfSeparator textbfREgression textbfTRansformer (SepRETR) を提案する。
我々は、SciTSR、PubTabNet、WTWなど、いくつかのベンチマークデータセットで最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2022-08-09T17:36:13Z) - Real-Time Scene Text Detection with Differentiable Binarization and
Adaptive Scale Fusion [62.269219152425556]
セグメンテーションに基づくシーンテキスト検出手法はシーンテキスト検出分野において大きな注目を集めている。
本稿では,二項化処理をセグメンテーションネットワークに統合する分散二項化(DB)モジュールを提案する。
アダプティブ・スケール・フュージョン (ASF) モジュールは, 異なるスケールの特徴を適応的に融合させることにより, スケールのロバスト性を向上させる。
論文 参考訳(メタデータ) (2022-02-21T15:30:14Z) - Adaptive Shrink-Mask for Text Detection [91.34459257409104]
既存のリアルタイムテキスト検出器は、ストリップマスクによってテキストの輪郭を直接再構築する。
予測された収縮マスクへの依存は不安定な検出結果をもたらす。
スーパーピクセルウィンドウ (SPW) はネットワークを監督するように設計されている。
論文 参考訳(メタデータ) (2021-11-18T07:38:57Z) - Hierarchical Convolutional Neural Network with Feature Preservation and
Autotuned Thresholding for Crack Detection [5.735035463793008]
ドローンの画像はインフラ表面の欠陥の自動検査にますます使われている。
本稿では,階層型畳み込みニューラルネットワークを用いた深層学習手法を提案する。
提案手法は, 道路, 橋, 舗装の表面ひび割れの同定に応用されている。
論文 参考訳(メタデータ) (2021-04-21T13:07:58Z) - Dense Label Encoding for Boundary Discontinuity Free Rotation Detection [69.75559390700887]
本稿では,分類に基づく比較的研究の少ない方法論について検討する。
我々は2つの側面でフロンティアを推し進めるための新しい手法を提案する。
航空画像のための大規模公開データセットの実験と視覚解析は,我々のアプローチの有効性を示している。
論文 参考訳(メタデータ) (2020-11-19T05:42:02Z) - Refined Plane Segmentation for Cuboid-Shaped Objects by Leveraging Edge
Detection [63.942632088208505]
本稿では,セグメント化された平面マスクを画像に検出されたエッジと整列するための後処理アルゴリズムを提案する。
これにより、立方体形状の物体に制限を加えながら、最先端のアプローチの精度を高めることができます。
論文 参考訳(メタデータ) (2020-03-28T18:51:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。