論文の概要: Text Detection on Roughly Placed Books by Leveraging a Learning-based
Model Trained with Another Domain Data
- arxiv url: http://arxiv.org/abs/2006.14808v1
- Date: Fri, 26 Jun 2020 05:53:23 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-16 21:39:36.601512
- Title: Text Detection on Roughly Placed Books by Leveraging a Learning-based
Model Trained with Another Domain Data
- Title(参考訳): 他分野データを用いた学習モデルを活用した粗配置書籍のテキスト検出
- Authors: Riku Anegawa and Masayoshi Aritsugi
- Abstract要約: 本稿では,本書におけるテキスト領域の把握に適したバウンディングボックスの生成方法に焦点をあてる。
我々は,学習に基づく手法の結果を改善し,活用することで,境界ボックスを構築するアルゴリズムを開発した。
我々のアルゴリズムは、異なる学習に基づくアプローチを用いてシーンテキストを検出することができる。
- 参考スコア(独自算出の注目度): 0.30458514384586394
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Text detection enables us to extract rich information from images. In this
paper, we focus on how to generate bounding boxes that are appropriate to grasp
text areas on books to help implement automatic text detection. We attempt not
to improve a learning-based model by training it with an enough amount of data
in the target domain but to leverage it, which has been already trained with
another domain data. We develop algorithms that construct the bounding boxes by
improving and leveraging the results of a learning-based method. Our algorithms
can utilize different learning-based approaches to detect scene texts.
Experimental evaluations demonstrate that our algorithms work well in various
situations where books are roughly placed.
- Abstract(参考訳): テキスト検出により、画像から豊富な情報を抽出できる。
本稿では,テキストの自動検出を実現するために,書籍のテキスト領域を把握するのに適した境界ボックスを生成する方法に注目する。
対象ドメイン内の十分な量のデータをトレーニングすることで、学習ベースのモデルを改善するのではなく、すでに他のドメインデータでトレーニングされているそれを活用することを試みる。
学習に基づく手法の結果を改善し,活用することで,境界ボックスを構築するアルゴリズムを開発した。
本アルゴリズムは,異なる学習に基づく手法を用いてシーンテキストを検出することができる。
実験的評価により,本が大まかに配置されている様々な状況において,アルゴリズムがうまく機能することが示された。
関連論文リスト
- Self-supervised Pre-training of Text Recognizers [0.0]
マスク付きラベル予測に基づく自己教師付き事前学習手法について検討する。
我々は、歴史的手書き(ベンサム)と歴史的印刷データセットの実験を行う。
評価の結果,対象領域からのデータの自己教師付き事前学習は非常に効果的であるが,近縁領域からの移行学習よりも優れていることがわかった。
論文 参考訳(メタデータ) (2024-05-01T09:58:57Z) - Efficiently Leveraging Linguistic Priors for Scene Text Spotting [63.22351047545888]
本稿では,大規模テキストコーパスから言語知識を活用する手法を提案する。
シーンテキストデータセットとよく一致したテキスト分布を生成し、ドメイン内の微調整の必要性を取り除く。
実験結果から,本手法は認識精度を向上するだけでなく,単語のより正確な局所化を可能にすることが示された。
論文 参考訳(メタデータ) (2024-02-27T01:57:09Z) - Learning from the Best: Active Learning for Wireless Communications [9.523381807291049]
アクティブな学習アルゴリズムは、ラベル付けされていないデータセットの中で最も重要で情報に富んだサンプルを特定し、完全なデータセットではなく、これらのサンプルのみをラベル付けする。
本稿では, ディープラーニングに基づくmmWaveビーム選択のケーススタディとして, 包括探索に基づく計算集約アルゴリズムを用いてラベル付けを行う。
この結果から,クラス不均衡データセットに対するアクティブな学習アルゴリズムを用いることで,データセットのラベル付けオーバーヘッドを最大50%削減できることがわかった。
論文 参考訳(メタデータ) (2024-01-23T12:21:57Z) - CDFSL-V: Cross-Domain Few-Shot Learning for Videos [58.37446811360741]
ビデオのアクション認識は、いくつかのラベル付き例でのみ、新しいカテゴリを認識するための効果的なアプローチである。
既存のビデオアクション認識の方法は、同じドメインからの大きなラベル付きデータセットに依存している。
本稿では,自己教師付き学習とカリキュラム学習を活用した,クロスドメインな数ショットビデオ行動認識手法を提案する。
論文 参考訳(メタデータ) (2023-09-07T19:44:27Z) - CSSL-MHTR: Continual Self-Supervised Learning for Scalable Multi-script Handwritten Text Recognition [16.987008461171065]
我々は,手書き文字認識における破滅的な忘れの問題を軽減するために,連続的な自己指導型学習の可能性を探究する。
提案手法は,各タスクにアダプタと呼ばれる中間層を追加し,現在のタスクを学習しながら,前モデルからの知識を効率的に抽出する。
私たちは英語、イタリア語、ロシア語のスクリプトで最先端のパフォーマンスを達成しましたが、タスクごとにいくつかのパラメータしか追加していません。
論文 参考訳(メタデータ) (2023-03-16T14:27:45Z) - A Deep Learning Anomaly Detection Method in Textual Data [0.45687771576879593]
本稿では,従来の機械学習アルゴリズムと組み合わせたディープラーニングとトランスフォーマーアーキテクチャを提案する。
我々は、異常を予測するために、文変換器、オート、ロジスティック回帰、距離計算など、複数の機械学習手法を使用した。
論文 参考訳(メタデータ) (2022-11-25T05:18:13Z) - Budget-aware Few-shot Learning via Graph Convolutional Network [56.41899553037247]
本稿では,いくつかの例から新しい視覚概念を学習することを目的とした,数ショット学習の課題に取り組む。
数ショット分類における一般的な問題設定は、データラベルの取得においてランダムサンプリング戦略を前提としている。
そこで我々は,新しい対象カテゴリーの学習を目的とした,予算に配慮した数発の学習問題を新たに導入する。
論文 参考訳(メタデータ) (2022-01-07T02:46:35Z) - Human-in-the-Loop Disinformation Detection: Stance, Sentiment, or
Something Else? [93.91375268580806]
政治とパンデミックは、機械学習対応の偽ニュース検出アルゴリズムの開発に十分な動機を与えている。
既存の文献は、主に完全自動化されたケースに焦点を当てているが、その結果得られた技術は、軍事応用に必要な様々なトピック、ソース、時間スケールに関する偽情報を確実に検出することはできない。
既に利用可能なアナリストを人間のループとして活用することにより、感情分析、アスペクトベースの感情分析、姿勢検出といった標準的な機械学習技術は、部分的に自動化された偽情報検出システムに使用するためのもっとも有効な方法となる。
論文 参考訳(メタデータ) (2021-11-09T13:30:34Z) - Meta Self-Learning for Multi-Source Domain Adaptation: A Benchmark [3.6248855491320016]
近年,ディープラーニングに基づく手法は,コンピュータビジョン領域において有望な結果を示している。
一般的なディープラーニングモデルは大量のラベル付きデータを必要とします。
本稿では,メタ学習パラダイムと自己学習手法を組み合わせたメタ自己学習手法を提案する。
論文 参考訳(メタデータ) (2021-08-24T17:07:34Z) - TEACHTEXT: CrossModal Generalized Distillation for Text-Video Retrieval [103.85002875155551]
本研究では,大規模言語前訓練を利用した一般化蒸留法TeachTextを提案する。
提案手法をビデオ側モダリティに拡張し,テスト時に使用するモダリティの数を効果的に削減できることを示す。
提案手法は,いくつかのビデオ検索ベンチマークの精度を著しく向上させ,テスト時の計算オーバーヘッドを増加させない。
論文 参考訳(メタデータ) (2021-04-16T17:55:28Z) - Exploring the Limits of Transfer Learning with a Unified Text-to-Text
Transformer [64.22926988297685]
下流タスクで微調整される前に、まずデータリッチタスクでモデルが事前訓練されるトランスファーラーニングは、自然言語処理(NLP)において強力な手法として登場した。
本稿では,すべてのテキストベースの言語問題をテキスト・トゥ・テキスト・フォーマットに変換する統一フレームワークにより,NLPのためのトランスファー学習手法を導入する状況について検討する。
論文 参考訳(メタデータ) (2019-10-23T17:37:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。