論文の概要: Confidence Estimation for Object Detection in Document Images
- arxiv url: http://arxiv.org/abs/2208.13391v1
- Date: Mon, 29 Aug 2022 06:47:18 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-30 14:05:53.381975
- Title: Confidence Estimation for Object Detection in Document Images
- Title(参考訳): 文書画像における物体検出の信頼度推定
- Authors: M\'elodie Boillet and Christopher Kermorvant and Thierry Paquet
- Abstract要約: オブジェクト検出予測の信頼性を推定する4つの推定器を提案する。
最初の2つはモンテカルロの落下に基づくもので、第3は記述統計であり、最後の1つは検出器後部確率である。
アクティブな学習フレームワークでは、最初の3つの推定器は、文書の物理ページやテキスト行の検出において、大幅な性能向上を示す。
- 参考スコア(独自算出の注目度): 1.9938405188113029
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep neural networks are becoming increasingly powerful and large and always
require more labelled data to be trained. However, since annotating data is
time-consuming, it is now necessary to develop systems that show good
performance while learning on a limited amount of data. These data must be
correctly chosen to obtain models that are still efficient. For this, the
systems must be able to determine which data should be annotated to achieve the
best results.
In this paper, we propose four estimators to estimate the confidence of
object detection predictions. The first two are based on Monte Carlo dropout,
the third one on descriptive statistics and the last one on the detector
posterior probabilities. In the active learning framework, the three first
estimators show a significant improvement in performance for the detection of
document physical pages and text lines compared to a random selection of
images. We also show that the proposed estimator based on descriptive
statistics can replace MC dropout, reducing the computational cost without
compromising the performances.
- Abstract(参考訳): ディープニューラルネットワークはますます強力で大きくなり、トレーニングするためにラベル付きデータを必要とする。
しかし,データアノテートには時間を要するため,限られたデータ量で学習しながら優れた性能を示すシステムを開発する必要がある。
これらのデータは、まだ効率的であるモデルを得るために正しく選択されなければならない。
そのため、システムはどのデータにアノテートして最良の結果を得るべきかを判断できなければなりません。
本稿では,物体検出予測の信頼性を推定する4つの推定器を提案する。
最初の2つはモンテカルロの落下に基づくもので、第3は記述統計であり、最後は検出器後部確率である。
アクティブラーニングフレームワークでは,3つの第1次推定器は,画像のランダムな選択と比較して,文書の物理ページやテキスト行の検出性能が大幅に向上したことを示す。
また,記述統計に基づく推定器がMCドロップアウトに取って代わり,性能を損なうことなく計算コストを低減できることを示す。
関連論文リスト
- Estimating Uncertainty with Implicit Quantile Network [0.0]
不確かさの定量化は多くの性能クリティカルなアプリケーションにおいて重要な部分である。
本稿では,アンサンブル学習やベイズニューラルネットワークなど,既存のアプローチに対する簡単な代替手段を提供する。
論文 参考訳(メタデータ) (2024-08-26T13:33:14Z) - Adaptive Pre-training Data Detection for Large Language Models via Surprising Tokens [1.2549198550400134]
大きな言語モデル(LLM)は広く使われているが、プライバシー、セキュリティ、著作権については不透明なトレーニングデータのために懸念されている。
この問題に対する現在の解決策は、メンバーシップ推論攻撃(MIA)のような機械学習プライバシで探索されたテクニックを活用する。
本稿では、この信頼性を軽減し、同定を効果的に増幅する適応型事前学習データ検出法を提案する。
論文 参考訳(メタデータ) (2024-07-30T23:43:59Z) - Efficient Transferability Assessment for Selection of Pre-trained Detectors [63.21514888618542]
本稿では,事前学習対象検出器の効率的な伝達性評価について検討する。
我々は、事前訓練された検出器の大規模で多様な動物園を含む検出器転送性ベンチマークを構築した。
実験により,本手法は伝達性の評価において,他の最先端手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2024-03-14T14:23:23Z) - Certain and Approximately Certain Models for Statistical Learning [4.318959672085627]
特定のトレーニングデータや対象モデルに対して,不足値を持つデータから,正確なモデルを直接学習することが可能であることを示す。
我々は、理論的に保証された効率的なアルゴリズムを構築し、この必要条件を確認し、計算が不要な場合に正確なモデルを返す。
論文 参考訳(メタデータ) (2024-02-27T22:49:33Z) - Task-Aware Machine Unlearning and Its Application in Load Forecasting [4.00606516946677]
本稿では、すでに訓練済みの予測器に対するデータセットの一部の影響を除去するために特別に設計された機械学習の概念を紹介する。
局所モデルパラメータ変化の感度を影響関数とサンプル再重み付けを用いて評価することにより,性能認識アルゴリズムを提案する。
リアルな負荷データセットを用いて,線形,CNN,Mixerベースの負荷予測器上で,未学習アルゴリズムを検証した。
論文 参考訳(メタデータ) (2023-08-28T08:50:12Z) - A Meta-Learning Approach to Predicting Performance and Data Requirements [163.4412093478316]
本稿では,モデルが目標性能に達するために必要なサンプル数を推定する手法を提案する。
モデル性能を推定するデファクト原理であるパワー法則が,小さなデータセットを使用する場合の誤差が大きいことが判明した。
本稿では,2つのデータを異なる方法で処理するPPL法について紹介する。
論文 参考訳(メタデータ) (2023-03-02T21:48:22Z) - Effective Robustness against Natural Distribution Shifts for Models with
Different Training Data [113.21868839569]
効果的ロバスト性」は、分配内(ID)性能から予測できる以上の余分な分配外ロバスト性を測定する。
異なるデータに基づいてトレーニングされたモデルの有効ロバスト性を評価・比較するための新しい評価指標を提案する。
論文 参考訳(メタデータ) (2023-02-02T19:28:41Z) - Learning to be a Statistician: Learned Estimator for Number of Distinct
Values [54.629042119819744]
列内の異なる値の数(NDV)を推定することは、データベースシステムにおける多くのタスクに有用である。
本研究では、ランダム(オンライン/オフライン)サンプルから正確なNDV推定を導出する方法に焦点を当てる。
教師付き学習フレームワークにおいて,NDV推定タスクを定式化し,モデルを推定対象として学習することを提案する。
論文 参考訳(メタデータ) (2022-02-06T15:42:04Z) - Improved Fine-tuning by Leveraging Pre-training Data: Theory and
Practice [52.11183787786718]
対象データに事前学習されたモデルを微調整することは、多くのディープラーニングアプリケーションで広く利用されている。
近年の研究では、スクラッチからのトレーニングが、この事前トレーニング戦略に比較して、最終的なパフォーマンスを示すことが実証されている。
本稿では,対象タスクの一般化を改善するために,事前学習データからサブセットを選択する新しい選択戦略を提案する。
論文 参考訳(メタデータ) (2021-11-24T06:18:32Z) - Meta-Learned Confidence for Few-shot Learning [60.6086305523402]
数ショットのメトリックベースのアプローチのための一般的なトランスダクティブ推論手法は、最も確実なクエリ例の平均で、各クラスのプロトタイプを更新することである。
本稿では,各クエリの信頼度をメタラーニングして,ラベルのないクエリに最適な重みを割り当てる手法を提案する。
4つのベンチマークデータセットに対してメタ学習の信頼度で、少数ショットの学習モデルを検証した。
論文 参考訳(メタデータ) (2020-02-27T10:22:17Z) - Early Forecasting of Text Classification Accuracy and F-Measure with
Active Learning [0.7614628596146599]
テキスト分類システムの性能指標として,精度とF尺度を用いた場合の予測困難度の違いについて検討する。
予測は決定木学習において最も容易であり、サポートベクトルマシンでは適度であり、ニューラルネットワークでは最も難しい。
論文 参考訳(メタデータ) (2020-01-20T06:27:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。