論文の概要: Page Segmentation using Visual Adjacency Analysis
- arxiv url: http://arxiv.org/abs/2112.11975v1
- Date: Sat, 11 Dec 2021 00:20:30 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-26 13:20:35.869279
- Title: Page Segmentation using Visual Adjacency Analysis
- Title(参考訳): Visual Adjacency Analysis を用いたページセグメンテーション
- Authors: Mohammad Bajammal, Ali Mesbah
- Abstract要約: 本稿では,局所化隣接領域の視覚的解析に基づく新しいページセグメンテーション手法を提案する。
DOM属性とビジュアル分析を組み合わせて、特定のページの機能を構築し、教師なしクラスタリングをガイドします。
実世界の35のWebページに対するアプローチを評価し,セグメンテーションの有効性と効率について検討した。
- 参考スコア(独自算出の注目度): 5.9521013526545925
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Page segmentation is a web page analysis process that divides a page into
cohesive segments, such as sidebars, headers, and footers. Current page
segmentation approaches use either the DOM, textual content, or rendering style
information of the page. However, these approaches have a number of drawbacks,
such as a large number of parameters and rigid assumptions about the page,
which negatively impact their segmentation accuracy. We propose a novel page
segmentation approach based on visual analysis of localized adjacency regions.
It combines DOM attributes and visual analysis to build features of a given
page and guide an unsupervised clustering. We evaluate our approach on 35
real-world web pages, and examine the effectiveness and efficiency of
segmentation. The results show that, compared with state-of-the-art, our
approach achieves an average of 156% increase in precision and 249% improvement
in F-measure.
- Abstract(参考訳): ページセグメンテーション(英: Page segmentation)は、ページをサイドバー、ヘッダ、フッタなどの凝集セグメントに分割するWebページ分析プロセスである。
現在のページセグメンテーションアプローチでは、DOM、テキストコンテンツ、ページのスタイル情報のいずれかを使用する。
しかし、これらのアプローチには、多数のパラメータやページに関する厳密な仮定など、多くの欠点があり、セグメンテーションの精度に悪影響を及ぼす。
局所化隣接領域の視覚的解析に基づく新しいページセグメンテーション手法を提案する。
DOM属性とビジュアル分析を組み合わせて、特定のページの機能を構築し、教師なしクラスタリングをガイドします。
実世界の35のWebページに対するアプローチを評価し,セグメンテーションの有効性と効率について検討した。
その結果,最先端の手法と比較して,精度は平均156%向上し,f-measureは249%向上した。
関連論文リスト
- Visual Prompt Selection for In-Context Learning Segmentation [77.15684360470152]
本稿では,サンプル選択戦略の再考と改善に焦点をあてる。
まず、ICLに基づくセグメンテーションモデルが異なる文脈に敏感であることを示す。
さらに、経験的証拠は、文脈的プロンプトの多様性がセグメンテーションを導く上で重要な役割を担っていることを示している。
論文 参考訳(メタデータ) (2024-07-14T15:02:54Z) - Language Guided Domain Generalized Medical Image Segmentation [68.93124785575739]
単一ソースドメインの一般化は、より信頼性が高く一貫性のあるイメージセグメンテーションを現実の臨床環境にわたって約束する。
本稿では,テキストエンコーダ機能によって案内されるコントラスト学習機構を組み込むことで,テキスト情報を明確に活用する手法を提案する。
文献における既存手法に対して,本手法は良好な性能を発揮する。
論文 参考訳(メタデータ) (2024-04-01T17:48:15Z) - Page Layout Analysis of Text-heavy Historical Documents: a Comparison of
Textual and Visual Approaches [0.0]
ページレイアウト分析は、ページを関心のある領域に分割できるドキュメント処理の基本的なステップである。
高度に複雑なレイアウトと混在したスクリプトにより、学術的に注釈付けされた文書は、最先端のモデルでは困難なままである。
論文 参考訳(メタデータ) (2022-12-12T10:10:29Z) - Semantic Parsing of Interpage Relations [0.0]
本稿では,ページ間関係のセマンティック解析としてタスクを形式化し,ページ間の依存関係抽出のためのエンドツーエンドアプローチを提案する。
また、ページ依存のセグメンテーション、分類、解析に使用されるページ埋め込みを協調的に最適化するマルチタスクトレーニング手法を設計する。
実験の結果,提案手法は,意味解析の点数41ポイント,ページストリームセグメンテーションの点数33ポイント,ナイーブベースライン上のページ分類の点数45ポイントに向上した。
論文 参考訳(メタデータ) (2022-05-26T17:50:43Z) - Unsupervised Deep Learning for Handwritten Page Segmentation [0.0]
ページ分割のための教師なし深層学習法を提案する。
サイアムスニューラルネットワークは、測定可能な特性を使用してパッチを区別するように訓練される。
実験の結果,提案手法は通常の教師なし手法と同じくらい有効であることがわかった。
論文 参考訳(メタデータ) (2021-01-19T07:13:38Z) - Rethinking Interactive Image Segmentation: Feature Space Annotation [68.8204255655161]
本稿では,特徴空間投影による複数画像からの対話的・同時セグメントアノテーションを提案する。
本手法は,前景セグメンテーションデータセットにおける最先端手法の精度を上回ることができることを示す。
論文 参考訳(メタデータ) (2021-01-12T10:13:35Z) - WikiAsp: A Dataset for Multi-domain Aspect-based Summarization [69.13865812754058]
マルチドメインアスペクトベースの要約のための大規模データセットであるWikiAspを提案する。
具体的には、アスペクトアノテーションのプロキシとして、各記事のセクションタイトルとバウンダリを使用して、20の異なるドメインからウィキペディア記事を使用してデータセットを構築します。
その結果,既存の要約モデルがこの設定で直面する重要な課題,例えば引用されたソースの適切な代名詞処理,時間に敏感なイベントの一貫した説明などが浮き彫りになった。
論文 参考訳(メタデータ) (2020-11-16T10:02:52Z) - Improving Semantic Segmentation via Decoupled Body and Edge Supervision [89.57847958016981]
既存のセグメンテーションアプローチは、グローバルコンテキストをモデル化することでオブジェクトの内部の一貫性を改善すること、あるいはマルチスケールの特徴融合によって境界に沿ったオブジェクトの詳細を洗練することを目的としている。
本稿では,セマンティックセグメンテーションのための新しいパラダイムを提案する。
我々の洞察は、セマンティックセグメンテーションの魅力ある性能には、画像の高頻度と低頻度に対応するオブジェクトのテキストボディとテキストエッジを具体的にモデル化する必要があるということである。
さまざまなベースラインやバックボーンネットワークを備えた提案したフレームワークが,オブジェクト内部の一貫性とオブジェクト境界を向上させることを示す。
論文 参考訳(メタデータ) (2020-07-20T12:11:22Z) - Webpage Segmentation for Extracting Images and Their Surrounding
Contextual Information [0.0]
本稿では,Web ページ上に表示される特徴に基づいて,Web 画像の抽出とそのコンテキスト情報を対象とした Web ページ分割アルゴリズムを提案する。
提案手法の有効性を検証するために,提案手法が既存のセグメンテーションアルゴリズムよりも優れた結果が得られることを示した。
論文 参考訳(メタデータ) (2020-05-18T19:00:03Z) - An Evaluation of DNN Architectures for Page Segmentation of Historical
Newspapers [0.0]
我々は11種類の異なるDeep Neural Networksバックボーンアーキテクチャと9つの異なるタイリングとスケーリング構成を評価し、テキスト、テーブル、テーブル列を分離する。
本稿では,ラベル数とトレーニングページ数がセグメンテーション品質に与える影響を,マシューズ相関係数を用いて測定する。
この結果から,Inception-ResNet-v2とEfficientNetのバックボーンが最適であることがわかった。
論文 参考訳(メタデータ) (2020-04-15T20:05:54Z) - SceneEncoder: Scene-Aware Semantic Segmentation of Point Clouds with A
Learnable Scene Descriptor [51.298760338410624]
本研究では,グローバル情報の効果を高めるために,シーン認識型ガイダンスを付加するSceneEncoderモジュールを提案する。
モジュールはシーン記述子を予測し、シーンに存在するオブジェクトのカテゴリを表現することを学習する。
また,同じラベルを持つ隣接点に対する特徴の識別を伝搬する領域類似度損失を設計する。
論文 参考訳(メタデータ) (2020-01-24T16:53:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。