論文の概要: Bounding Box Label Propagation for Re-Annotation of Document Layout Analysis Datasets
- arxiv url: http://arxiv.org/abs/2606.17644v1
- Date: Tue, 16 Jun 2026 08:04:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-17 17:15:32.341444
- Title: Bounding Box Label Propagation for Re-Annotation of Document Layout Analysis Datasets
- Title(参考訳): 文書レイアウト解析データセットの再アノテーションのためのバウンディングボックスラベルの伝搬
- Authors: Nick Jochum, Tobias Alt-Veit, Christian Schön, Alexander Lück, René Schuster, Didier Stricker,
- Abstract要約: BBLP(Bounding Box Label Propagation)は、オブジェクト検出のための擬似ラベリングフレームワークである。
境界ボックスの高品質なクラスアノテーションを生成する。
完全な教師付きパフォーマンスの81.6%に相当する54.0%のmAPを達成し、10%のラベル付きデータしか使用していない。
- 参考スコア(独自算出の注目度): 49.345169562968415
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Datasets in practical document processing scenarios typically grow over time, and their class annotations undergo continuous refinement. This creates significant re-annotation efforts, which are time-consuming and costly. A promising remedy is to re-annotate only a small subset of available documents manually and apply semi-supervised learning techniques that leverage both labelled and unlabelled data. Although there are numerous approaches to tackle this problem for classification, there exists no adaptation for the problem of re-classifying object detection instances, e.g. for document layout analysis. To this end, we propose Bounding Box Label Propagation (BBLP), a pseudo-labelling framework for object detection. An object encoder integrates visual, textual, and positional embeddings from object detection samples to come up with a joint embedding that can be used for Label Propagation on partially annotated datasets in a plug-and-play fashion. Evaluation results indicate that the proposed approach produces high-quality class annotations of bounding boxes. In the D4LA layout analysis dataset, it achieves a mAP of 54.0%, corresponding to 81.6% of fully supervised performance, while using only 10% labelled data. Our work demonstrates the potential of Label Propagation for object detection and lays the groundwork for reducing manual annotation efforts in real-world document processing applications.
- Abstract(参考訳): 実用的なドキュメント処理シナリオのデータセットは通常、時間とともに成長し、それらのクラスアノテーションは継続的な改善を受けます。
これは、時間とコストのかかる、大幅な再アノテーションの取り組みを生み出します。
有望な治療法は、利用可能なドキュメントのごく一部だけを手作業で再注釈し、ラベル付きデータと非ラベル付きデータの両方を活用する半教師付き学習技術を適用することである。
この問題の分類には多くのアプローチがあるが、文書レイアウト解析などのオブジェクト検出インスタンスを再分類する問題には適応していない。
そこで本研究では,オブジェクト検出のための擬似ラベリングフレームワークであるBunding Box Label Propagation (BBLP)を提案する。
オブジェクトエンコーダは、オブジェクト検出サンプルからの視覚的、テキスト的、位置的埋め込みを統合し、プラグイン・アンド・プレイ方式で部分的に注釈付けされたデータセット上でラベルの伝搬に使用できる共同埋め込みを作成できる。
評価結果は,提案手法がバウンディングボックスの高品質なクラスアノテーションを生成することを示す。
D4LAレイアウト分析データセットでは、完全な教師付きパフォーマンスの81.6%に相当する54.0%のmAPを達成し、10%のラベル付きデータしか使用していない。
本研究は,オブジェクト検出のためのラベル伝搬の可能性を実証し,実世界の文書処理アプリケーションにおける手動アノテーションの取り組みを減らし,その基礎を定めている。
関連論文リスト
- Bridging Annotation Gaps: Transferring Labels to Align Object Detection Datasets [26.566426911250296]
Label-Aligned Transfer Proposal (LAT)は、さまざまなソースデータセットからのアノテーションをターゲットラベル空間に体系的にプロジェクションする。
LATは目標領域検出性能を一貫した改善し、半教師付きベースラインよりも最大4.8APのゲインを得る。
論文 参考訳(メタデータ) (2025-06-05T08:16:15Z) - Exploring Structured Semantic Prior for Multi Label Recognition with
Incomplete Labels [60.675714333081466]
不完全なラベルを持つマルチラベル認識(MLR)は非常に難しい。
最近の研究は、視覚言語モデルであるCLIPにおける画像とラベルの対応を探り、不十分なアノテーションを補うことを目指している。
我々は,MLRにおけるラベル管理の欠如を,構造化されたセマンティクスを導出することにより,不完全なラベルで修復することを提唱する。
論文 参考訳(メタデータ) (2023-03-23T12:39:20Z) - Omni-DETR: Omni-Supervised Object Detection with Transformers [165.4190908259015]
我々は、ラベルなし、完全ラベル付き、弱ラベル付きアノテーションを使用できるOmni教師付きオブジェクト検出の問題を考察する。
この統一アーキテクチャの下では、異なる種類の弱いラベルを利用して正確な擬似ラベルを生成することができる。
弱いアノテーションは検出性能を向上させるのに役立ち、それらの混合はアノテーションのコストと精度のトレードオフを改善することができる。
論文 参考訳(メタデータ) (2022-03-30T06:36:09Z) - SparseDet: Improving Sparsely Annotated Object Detection with
Pseudo-positive Mining [76.95808270536318]
Pseudo- positive mining を用いてラベル付き地域とラベルなし地域を分離するエンド・ツー・エンドシステムを提案する。
ラベル付き領域は通常通り処理されるが、ラベルなし領域の処理には自己教師付き学習が使用される。
我々は,PASCAL-VOCとCOCOデータセットの5つの分割に対して,最先端の性能を達成するための徹底的な実験を行った。
論文 参考訳(メタデータ) (2022-01-12T18:57:04Z) - Assisted Text Annotation Using Active Learning to Achieve High Quality
with Little Effort [9.379650501033465]
研究者は、手動の注釈だけで、大規模で高品質な注釈付きデータセットを作成できるツールを提案する。
我々は、アクティブラーニング(AL)アプローチと事前訓練された言語モデルを組み合わせて、アノテーションカテゴリを半自動で識別する。
予備的な結果から,ALを用いることで,複雑なフレームや微妙なフレームを正しく分類するアノテーションの数が大幅に削減されることがわかった。
論文 参考訳(メタデータ) (2021-12-15T13:14:58Z) - Multi-label Classification with Partial Annotations using Class-aware
Selective Loss [14.3159150577502]
大規模なマルチラベル分類データセットは、一般的に部分的に注釈付けされている。
部分的なラベリング問題を解析し、2つの重要なアイデアに基づいた解を提案する。
われわれの新しいアプローチにより、OpenImagesデータセット上で最先端の結果が得られる。
論文 参考訳(メタデータ) (2021-10-21T08:10:55Z) - Object Detection with a Unified Label Space from Multiple Datasets [94.33205773893151]
異なるラベル空間を持つ複数のデータセットが与えられた場合、この研究の目標は、すべてのラベル空間の結合について予測する単一のオブジェクト検出器をトレーニングすることである。
あるデータセットにアノテートされているが、別のデータセットにアノテートされていない顔のようなオブジェクトカテゴリを考えてみましょう。
顔のようないくつかのカテゴリは、あるデータセットでは前景と見なされるが、別のデータセットでは背景と見なされる。
本稿では,部分的だが正しいアノテーションを補完的だがノイズの多い擬似ラベルと注意深く統合する損失関数を提案する。
論文 参考訳(メタデータ) (2020-08-15T00:51:27Z) - Weakly-Supervised Salient Object Detection via Scribble Annotations [54.40518383782725]
本稿では,スクリブルラベルからサリエンシを学習するための弱教師付きサリエント物体検出モデルを提案する。
そこで本研究では,予測されたサリエンシマップの構造アライメントを測定するために,新しい尺度であるサリエンシ構造尺度を提案する。
我々の手法は、既存の弱教師付き/非教師付き手法よりも優れているだけでなく、いくつかの完全教師付き最先端モデルと同等である。
論文 参考訳(メタデータ) (2020-03-17T12:59:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。