論文の概要: Table Detection with Active Learning
- arxiv url: http://arxiv.org/abs/2509.20003v1
- Date: Wed, 24 Sep 2025 11:22:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-25 20:53:19.790346
- Title: Table Detection with Active Learning
- Title(参考訳): アクティブラーニングによるテーブル検出
- Authors: Somraj Gautam, Nachiketa Purohit, Gaurav Harit,
- Abstract要約: アクティブラーニングは、最も有益なサンプルを選択することで、アノテーションコストを最小限に抑える、有望なソリューションである。
提案手法は,モデル一般化を改善する代表例の選択を保証する。
その結果,ALに基づくサンプル選択は,ランダムサンプリングよりも有意に優れていた。
- 参考スコア(独自算出の注目度): 1.9881456274482427
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Efficient data annotation remains a critical challenge in machine learning, particularly for object detection tasks requiring extensive labeled data. Active learning (AL) has emerged as a promising solution to minimize annotation costs by selecting the most informative samples. While traditional AL approaches primarily rely on uncertainty-based selection, recent advances suggest that incorporating diversity-based strategies can enhance sampling efficiency in object detection tasks. Our approach ensures the selection of representative examples that improve model generalization. We evaluate our method on two benchmark datasets (TableBank-LaTeX, TableBank-Word) using state-of-the-art table detection architectures, CascadeTabNet and YOLOv9. Our results demonstrate that AL-based example selection significantly outperforms random sampling, reducing annotation effort given a limited budget while maintaining comparable performance to fully supervised models. Our method achieves higher mAP scores within the same annotation budget.
- Abstract(参考訳): 効率的なデータアノテーションは、マシンラーニング、特に広範なラベル付きデータを必要とするオブジェクト検出タスクにおいて、依然として重要な課題である。
アクティブラーニング(AL)は,最も情報性の高いサンプルを選択することで,アノテーションコストを最小限に抑える,有望なソリューションとして登場した。
従来のALアプローチは、主に不確実性に基づく選択に依存しているが、近年の進歩は、多様性に基づく戦略を取り入れることで、オブジェクト検出タスクのサンプリング効率を高めることを示唆している。
提案手法は,モデル一般化を改善する代表例の選択を保証する。
本研究では,2つのベンチマークデータセット(TableBank-LaTeX, TableBank-Word)に対して,最先端のテーブル検出アーキテクチャ,CascadeTabNet,YOLOv9を用いて評価を行った。
その結果,ALに基づくサンプル選択はランダムサンプリングよりも大幅に優れており,完全教師付きモデルに匹敵する性能を維持しつつ,限られた予算でアノテーションの労力を削減できることがわかった。
提案手法は同じアノテーション予算内で高いmAPスコアを達成する。
関連論文リスト
- Optimizing Active Learning in Vision-Language Models via Parameter-Efficient Uncertainty Calibration [6.7181844004432385]
本稿では,アクティブラーニングフレームワークに不確実な校正損失を組み込んだパラメータ効率学習手法を提案する。
提案手法は,複雑な特徴量に基づくサンプリング手法の性能に適合し,超越できることを実証する。
論文 参考訳(メタデータ) (2025-07-29T06:08:28Z) - Active Prompt Learning with Vision-Language Model Priors [9.173468790066956]
視覚言語モデルの事前学習画像とテキストエンコーダを利用するクラス誘導クラスタリングを提案する。
適応型クラスワイドしきい値に基づく予算削減型選択クエリを提案する。
論文 参考訳(メタデータ) (2024-11-23T02:34:33Z) - Prompt Optimization with EASE? Efficient Ordering-aware Automated Selection of Exemplars [66.823588073584]
大規模言語モデル(LLM)は、現実世界のアプリケーションで印象的な機能を示している。
これらの卓越した作品の品質は、パフォーマンスに大きな影響を与えます。
既存の方法は、先行注文がパフォーマンスに与える影響を適切に説明できない。
論文 参考訳(メタデータ) (2024-05-25T08:23:05Z) - An Experimental Design Framework for Label-Efficient Supervised Finetuning of Large Language Models [55.01592097059969]
命令データセットの監視された微調整は、目覚ましいゼロショットの一般化能力を達成する上で重要な役割を担っている。
アクティブラーニングは、未ラベルのプールからアノテートするサンプルの有用なサブセットを特定するのに効果的である。
本研究では,能動学習の計算ボトルネックを回避するための実験設計を提案する。
論文 参考訳(メタデータ) (2024-01-12T16:56:54Z) - Aligning Data Selection with Performance: Performance-driven Reinforcement Learning for Active Learning in Object Detection [31.304039641225504]
本稿では,オブジェクト検出のための平均APガイド型アクティブラーニングについて紹介する。
MGRALは、予測されたモデル出力変化の概念を深層検知ネットワークの情報性として活用する新しいアプローチである。
提案手法は,物体検出のための強化学習に基づく能動学習における新たなパラダイムを確立し,高い性能を示す。
論文 参考訳(メタデータ) (2023-10-12T14:59:22Z) - Temporal Output Discrepancy for Loss Estimation-based Active Learning [65.93767110342502]
ラベルのないサンプルが高損失を伴っていると信じられている場合に,データアノテーションのオラクルに問い合わせる,新しいディープラーニングアプローチを提案する。
本手法は,画像分類やセマンティックセグメンテーションタスクにおける最先端の能動学習手法よりも優れた性能を実現する。
論文 参考訳(メタデータ) (2022-12-20T19:29:37Z) - Pareto Optimization for Active Learning under Out-of-Distribution Data
Scenarios [79.02009938011447]
本研究では,未ラベルデータプールからバッチサイズを固定した未ラベルサンプルの最適なサブセットを選択するサンプリング手法を提案する。
実験の結果,従来の機械学習(ML)タスクとディープラーニング(DL)タスクの両方において,その効果が示された。
論文 参考訳(メタデータ) (2022-07-04T04:11:44Z) - Mitigating Sampling Bias and Improving Robustness in Active Learning [13.994967246046008]
教師付き環境下での能動学習に比較学習の損失を生かして教師付き能動学習を導入する。
多様な特徴表現の情報的データサンプルを選択するアンバイアスなクエリ戦略を提案する。
提案手法は,アクティブな学習環境において,サンプリングバイアスを低減し,最先端の精度を実現し,モデルの校正を行う。
論文 参考訳(メタデータ) (2021-09-13T20:58:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。