論文の概要: Examining DOM Coordinate Effectiveness For Page Segmentation
- arxiv url: http://arxiv.org/abs/2601.09543v1
- Date: Wed, 14 Jan 2026 15:05:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-15 18:59:20.443457
- Title: Examining DOM Coordinate Effectiveness For Page Segmentation
- Title(参考訳): ページセグメンテーションにおけるDOMコーディネートの有効性の検討
- Authors: Jason Carpenter, Faaiq Bilal, Eman Ramadan, Zhi-Li Zhang,
- Abstract要約: Webページは、日々の人的消費のために利用可能なデータの基盤を形成します。
既存の作業、Webページを利用したドキュメントオブジェクトモデル(DOM)は、しばしばDOMから通知される座標からクラスタ化ベクターを導出します。
本研究は,WebページセグメンテーションにおけるDOMコーディネートの影響を詳細に把握するために,DOMコーディネートを提案し,検討する。
- 参考スコア(独自算出の注目度): 8.785745354964552
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Web pages form a cornerstone of available data for daily human consumption and with the rise of LLM-based search and learning systems a treasure trove of valuable data. The scale of this data and its unstructured format still continue to grow requiring ever more robust automated extraction and retrieval mechanisms. Existing work, leveraging the web pages Document Object Model (DOM), often derives clustering vectors from coordinates informed by the DOM such as visual placement or tree structure. The construction and component value of these vectors often go unexamined. Our work proposes and examines DOM coordinates in a detail to understand their impact on web page segmentation. Our work finds that there is no one-size-fits-all vector, and that visual coordinates under-perform compared to DOM coordinates by about 20-30% on average. This challenges the necessity of including visual coordinates in clustering vectors. Further, our work finds that simple vectors, comprised of single coordinates, fare better than complex vectors constituting 68.2% of the top performing vectors of the pages examined. Finally, we find that if a vector, clustering algorithm, and page are properly matched, one can achieve overall high segmentation accuracy at 74%. This constitutes a 20% improvement over a naive application of vectors. Conclusively, our results challenge the current orthodoxy for segmentation vector creation, opens up the possibility to optimize page segmentation via clustering on DOM coordinates, and highlights the importance of finding mechanisms to match the best approach for web page segmentation.
- Abstract(参考訳): ウェブページは、日々の人的消費のために利用可能なデータの基盤を形成し、LLMベースの検索・学習システムが台頭し、貴重なデータの宝庫となっている。
このデータの規模と非構造化フォーマットは依然として増加を続けており、より堅牢な自動抽出と検索機構を必要としている。
既存の作業は、Webページのドキュメントオブジェクトモデル(DOM)を利用しており、視覚的な配置やツリー構造といったDOMによって通知される座標から、しばしばクラスタリングベクターを導出します。
これらのベクトルの構成と成分値は検査されないことが多い。
本研究は,WebページセグメンテーションにおけるDOMコーディネートの影響を詳細に把握するために,DOMコーディネートを提案し,検討する。
我々の研究によると、一様ベクトルは存在せず、視覚座標は平均で約20~30%の精度でDOM座標と比較される。
これは、クラスタ化ベクトルに視覚座標を含める必要性に挑戦する。
さらに, 単一座標からなる単純ベクトルは, ページの上位実行ベクトルの68.2%を構成する複素ベクトルよりも優れていることがわかった。
最後に,ベクトル,クラスタリングアルゴリズム,ページが適切に一致すれば,全体の高いセグメンテーション精度を74%で達成できることがわかった。
これはベクトルの単純適用よりも20%改善されている。
結論として、この結果は、セグメンテーションベクトル生成の現在の正統性に挑戦し、DOM座標上のクラスタリングによるページセグメンテーションを最適化する可能性を開放し、Webページセグメンテーションのベストアプローチに適合するメカニズムを見つけることの重要性を強調した。
関連論文リスト
- A Lightweight Clustering Framework for Unsupervised Semantic
Segmentation [28.907274978550493]
教師なしセマンティックセグメンテーションは、注釈付きデータを用いることなく、画像の各ピクセルを対応するクラスに分類することを目的としている。
教師なしセマンティックセグメンテーションのための軽量クラスタリングフレームワークを提案する。
本フレームワークは,PASCAL VOCおよびMS COCOデータセットの最先端結果を実現する。
論文 参考訳(メタデータ) (2023-11-30T15:33:42Z) - Deep learning-based interactive segmentation in remote sensing [2.328864986845849]
本研究の目的は,クリックベースインタラクティブセグメンテーションとリモートセンシング画像解析のギャップを埋めることである。
我々は,2つの高解像度空中画像データセットに対して,最先端の対話的セグメンテーション手法の5つの性能評価を行った。
これらの知見に基づいて、リモートセンシングデータの対話的セグメンテーションのためのSegMapという専用オンラインツールを開発した。
論文 参考訳(メタデータ) (2023-08-25T04:49:49Z) - CorrMatch: Label Propagation via Correlation Matching for
Semi-Supervised Semantic Segmentation [73.89509052503222]
本稿では、CorrMatchと呼ばれる、単純だが実行可能な半教師付きセマンティックセマンティックセマンティックセマンティクス手法を提案する。
相関写像は、同一カテゴリのクラスタリングピクセルを容易に実現できるだけでなく、良好な形状情報も含んでいることを観察する。
我々は,高信頼画素を拡大し,さらに掘り出すために,画素の対の類似性をモデル化して画素伝搬を行う。
そして、相関地図から抽出した正確なクラス非依存マスクを用いて、領域伝搬を行い、擬似ラベルを強化する。
論文 参考訳(メタデータ) (2023-06-07T10:02:29Z) - HGFormer: Hierarchical Grouping Transformer for Domain Generalized
Semantic Segmentation [113.6560373226501]
本研究は領域一般化設定の下で意味的セグメンテーションを研究する。
本稿では,階層型グループ化変換器(HGFormer)を提案する。
実験により、HGFormerはピクセルごとの分類法やフラットグルーピング変換器よりも、より堅牢なセマンティックセグメンテーション結果が得られることが示された。
論文 参考訳(メタデータ) (2023-05-22T13:33:41Z) - Learning Implicit Feature Alignment Function for Semantic Segmentation [51.36809814890326]
Implicit Feature Alignment Function (IFA)は、暗黙の神経表現の急速に拡大するトピックにインスパイアされている。
IFAは機能マップを異なるレベルで暗黙的に整列し、任意の解像度でセグメンテーションマップを生成することができることを示す。
提案手法は,様々なアーキテクチャの改善と組み合わせて,一般的なベンチマークにおける最先端の精度のトレードオフを実現する。
論文 参考訳(メタデータ) (2022-06-17T09:40:14Z) - Dynamic Focus-aware Positional Queries for Semantic Segmentation [94.6834904076914]
本稿では,動的焦点認識型位置情報クエリと呼ばれるセマンティックセグメンテーションのための,シンプルで効果的なクエリ設計を提案する。
我々のフレームワークはSOTAの性能を達成し、ResNet-50、Swin-T、Swin-Bのバックボーンによる1.1%、1.9%、および1.1%の単一スケールmIoUでMask2formerより優れています。
論文 参考訳(メタデータ) (2022-04-04T05:16:41Z) - Page Segmentation using Visual Adjacency Analysis [5.9521013526545925]
本稿では,局所化隣接領域の視覚的解析に基づく新しいページセグメンテーション手法を提案する。
DOM属性とビジュアル分析を組み合わせて、特定のページの機能を構築し、教師なしクラスタリングをガイドします。
実世界の35のWebページに対するアプローチを評価し,セグメンテーションの有効性と効率について検討した。
論文 参考訳(メタデータ) (2021-12-11T00:20:30Z) - Depth-aware Object Segmentation and Grasp Detection for Robotic Picking
Tasks [13.337131101813934]
本稿では,ロボットピッキングタスクの協調型クラス非依存オブジェクト分割と把握検出のための新しいディープニューラルネットワークアーキテクチャを提案する。
本稿では,ポイント提案に基づくオブジェクトインスタンスセグメンテーションの精度を高める手法であるDeep-Aware Coordinate Convolution(CoordConv)を紹介する。
我々は,Sil'eane と OCID_grasp という,難易度の高いロボットピッキングデータセットに対して,把握検出とインスタンスセグメンテーションの精度を評価する。
論文 参考訳(メタデータ) (2021-11-22T11:06:33Z) - Deep ensembles based on Stochastic Activation Selection for Polyp
Segmentation [82.61182037130406]
本研究は,大腸内視鏡検査における画像分割,特に正確なポリープ検出とセグメンテーションを扱う。
イメージセグメンテーションの基本アーキテクチャはエンコーダとデコーダで構成されている。
我々はデコーダのバックボーンを変更することで得られるDeepLabアーキテクチャのバリエーションを比較した。
論文 参考訳(メタデータ) (2021-04-02T02:07:37Z) - Learning to Predict Context-adaptive Convolution for Semantic
Segmentation [66.27139797427147]
長距離コンテキスト情報は、高性能なセマンティックセグメンテーションを実現するために不可欠である。
空間的に変化する特徴重み付けベクトルを予測するためのコンテキスト適応畳み込みネットワーク(CaC-Net)を提案する。
当社のCaC-Netは,3つの公開データセット上でのセグメンテーション性能に優れています。
論文 参考訳(メタデータ) (2020-04-17T13:09:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。