論文の概要: Domain Agnostic Few-Shot Learning For Document Intelligence
- arxiv url: http://arxiv.org/abs/2111.00007v1
- Date: Fri, 29 Oct 2021 03:19:31 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-02 13:58:34.794231
- Title: Domain Agnostic Few-Shot Learning For Document Intelligence
- Title(参考訳): ドキュメントインテリジェンスのためのドメイン非依存な少数ショット学習
- Authors: Jaya Krishna Mandivarapu, Eric bunch, Glenn fung
- Abstract要約: ほとんどショット学習は、クラスラベルを持つ少数のサンプルだけで、新しいクラスに一般化することを目的としていない。
本研究では,ドメインシフト下での文書画像分類の問題に対処する。
- 参考スコア(独自算出の注目度): 4.243926243206826
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Few-shot learning aims to generalize to novel classes with only a few samples
with class labels. Research in few-shot learning has borrowed techniques from
transfer learning, metric learning, meta-learning, and Bayesian methods. These
methods also aim to train models from limited training samples, and while
encouraging performance has been achieved, they often fail to generalize to
novel domains. Many of the existing meta-learning methods rely on training data
for which the base classes are sampled from the same domain as the novel
classes used for meta-testing. However, in many applications in the industry,
such as document classification, collecting large samples of data for
meta-learning is infeasible or impossible. While research in the field of the
cross-domain few-shot learning exists, it is mostly limited to computer vision.
To our knowledge, no work yet exists that examines the use of few-shot learning
for classification of semi-structured documents (scans of paper documents)
generated as part of a business workflow (forms, letters, bills, etc.). Here
the domain shift is significant, going from natural images to the
semi-structured documents of interest. In this work, we address the problem of
few-shot document image classification under domain shift. We evaluate our work
by extensive comparisons with existing methods. Experimental results
demonstrate that the proposed method shows consistent improvements on the
few-shot classification performance under domain shift.
- Abstract(参考訳): ほとんどショット学習は、クラスラベルを持つ少数のサンプルだけで、新しいクラスに一般化することを目的としていない。
少数ショット学習の研究は、移動学習、メートル法学習、メタラーニング、ベイズ的手法などの技術を借りている。
これらの手法はまた、限られたトレーニングサンプルからモデルを訓練することを目的としており、パフォーマンスを奨励する一方で、しばしば新しい領域への一般化に失敗している。
既存のメタ学習メソッドの多くは、ベースクラスがメタテストに使われる新しいクラスと同じドメインからサンプリングされるトレーニングデータに依存している。
しかし、文書分類などの業界における多くのアプリケーションでは、メタ学習のための大量のデータ収集は不可能か不可能である。
クロスドメインの少数ショット学習の分野での研究は存在するが、ほとんどはコンピュータビジョンに限られている。
私たちの知る限り、ビジネスワークフロー(フォーム、レター、請求書など)の一部として生成された半構造化文書(書類のスキャン)の分類に、少額の学習を用いることを調べる作業はまだありません。
ここでは、ドメインシフトが重要で、自然画像から興味のある半構造化ドキュメントに移行します。
本稿では,ドメインシフト下での文書画像分類の問題点について述べる。
既存の手法との比較により研究成果を評価する。
実験により,提案手法はドメインシフト下でのショット分類性能を一貫した改善を示した。
関連論文リスト
- Adversarial Feature Augmentation for Cross-domain Few-shot
Classification [2.68796389443975]
本稿では, ドメインギャップを補うために, 対角的特徴拡張法(AFA)を提案する。
提案手法はプラグイン・アンド・プレイモジュールであり,既存の数発学習手法に容易に組み込むことができる。
論文 参考訳(メタデータ) (2022-08-23T15:10:22Z) - FHIST: A Benchmark for Few-shot Classification of Histological Images [20.182417148565147]
画像分類にはあまり関心が寄せられていないが、現在の公開ベンチマークのほとんどは自然画像に焦点を当てている。
本稿では、様々な公開データセットから収集された高度に多様化した公開ベンチマークを、数発のヒストロジーデータ分類のために導入する。
本ベンチマークでは,最新の数ショット学習手法の性能評価を行い,単純な微調整法と正規化法が,一般的なメタラーニングやエピソディック学習のパラダイムよりも優れた結果が得られることを検証した。
論文 参考訳(メタデータ) (2022-05-31T20:03:40Z) - Multi-Modal Few-Shot Object Detection with Meta-Learning-Based
Cross-Modal Prompting [77.69172089359606]
本稿では,マルチモーダルな複数ショットオブジェクト検出(FSOD)について,少数ショット視覚例とクラスセマンティック情報の両方を用いて検討する。
我々のアプローチは、(メトリックベース)メタラーニングとプロンプトベースラーニングの高レベルな概念的類似性によって動機付けられている。
提案するマルチモーダルFSODモデルを,複数の複数ショットオブジェクト検出ベンチマークで総合的に評価し,有望な結果を得た。
論文 参考訳(メタデータ) (2022-04-16T16:45:06Z) - Few-Shot Classification in Unseen Domains by Episodic Meta-Learning
Across Visual Domains [36.98387822136687]
興味のあるカテゴリのラベル付き例がほとんどないため、いくつかのショット分類は、分類を実行することを目的としている。
本稿では,ドメイン一般化型少ショット分類のための一意学習フレームワークを提案する。
メタ学習戦略を進めることで、学習フレームワークは複数のソースドメインにまたがるデータを利用して、ドメイン不変の機能をキャプチャします。
論文 参考訳(メタデータ) (2021-12-27T06:54:11Z) - Meta Navigator: Search for a Good Adaptation Policy for Few-shot
Learning [113.05118113697111]
少ないショット学習は、ラベル付きデータしか持たない新しいタスクに、以前のタスクから学んだ知識を適応させることを目的としている。
少数ショット学習に関する研究文献は、大きな多様性を示し、異なるアルゴリズムは、しばしば異なる少数ショット学習シナリオで優れている。
本稿では,メタナビゲータ(Meta Navigator)について紹介する。
論文 参考訳(メタデータ) (2021-09-13T07:20:01Z) - Few-shot Weakly-Supervised Object Detection via Directional Statistics [55.97230224399744]
少数ショットコモンオブジェクトローカライゼーション(COL)と少数ショット弱監視オブジェクト検出(WSOD)のための確率論的多重インスタンス学習手法を提案する。
本モデルでは,新しいオブジェクトの分布を同時に学習し,期待-最大化ステップにより局所化する。
提案手法は, 単純であるにもかかわらず, 少数のCOLとWSOD, 大規模WSODタスクにおいて, 高いベースラインを達成できることを示す。
論文 参考訳(メタデータ) (2021-03-25T22:34:16Z) - Unsupervised Neural Domain Adaptation for Document Image Binarization [13.848843012433187]
本稿では,ニューラルネットワークとドメイン適応(DA)を組み合わせて,教師なし文書のバイナライゼーションを行う手法を提案する。
その結果,ラベル付きデータを必要とせず,新たな文書領域の双対化をうまく処理できることが示唆された。
論文 参考訳(メタデータ) (2020-12-02T13:42:38Z) - Region Comparison Network for Interpretable Few-shot Image
Classification [97.97902360117368]
新しいクラスのモデルをトレーニングするために、ラベル付きサンプルの限られた数だけを効果的に活用するための画像分類が提案されている。
本研究では,領域比較ネットワーク (RCN) と呼ばれる距離学習に基づく手法を提案する。
また,タスクのレベルからカテゴリへの解釈可能性の一般化も提案する。
論文 参考訳(メタデータ) (2020-09-08T07:29:05Z) - UniT: Unified Knowledge Transfer for Any-shot Object Detection and
Segmentation [52.487469544343305]
オブジェクト検出とセグメンテーションの方法は、トレーニングのための大規模インスタンスレベルのアノテーションに依存します。
本稿では,直感的かつ統一的な半教師付きモデルを提案する。
論文 参考訳(メタデータ) (2020-06-12T22:45:47Z) - Meta-Baseline: Exploring Simple Meta-Learning for Few-Shot Learning [79.25478727351604]
評価基準に基づいて,分類済みモデル全体に対するメタラーニング(メタラーニング)を提案する。
我々は,この単純な手法が標準ベンチマークにおける最先端手法との競合性能を達成するのを観察する。
論文 参考訳(メタデータ) (2020-03-09T20:06:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。