論文の概要: WSRNet: Joint Spotting and Recognition of Handwritten Words
- arxiv url: http://arxiv.org/abs/2008.07109v1
- Date: Mon, 17 Aug 2020 06:22:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-28 03:51:11.777236
- Title: WSRNet: Joint Spotting and Recognition of Handwritten Words
- Title(参考訳): WSRNet: 手書き単語の共同スポッティングと認識
- Authors: George Retsinas, Giorgos Sfikas, Petros Maragos
- Abstract要約: 提案するネットワークは、非リカレントCTCブランチとSeq2Seqブランチで構成されており、Autoencodingモジュールでさらに拡張されている。
本稿では、これらの表現をさらに2項化して処理する方法と、コンパクトで高効率な記述子を提供するリトレーニングスキームを示す。
- 参考スコア(独自算出の注目度): 38.212002652391
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this work, we present a unified model that can handle both Keyword
Spotting and Word Recognition with the same network architecture. The proposed
network is comprised of a non-recurrent CTC branch and a Seq2Seq branch that is
further augmented with an Autoencoding module. The related joint loss leads to
a boost in recognition performance, while the Seq2Seq branch is used to create
efficient word representations. We show how to further process these
representations with binarization and a retraining scheme to provide compact
and highly efficient descriptors, suitable for keyword spotting. Numerical
results validate the usefulness of the proposed architecture, as our method
outperforms the previous state-of-the-art in keyword spotting, and provides
results in the ballpark of the leading methods for word recognition.
- Abstract(参考訳): 本稿では,同じネットワークアーキテクチャを用いてキーワードスポッティングと単語認識の両方を処理できる統一モデルを提案する。
提案するネットワークは、非リカレントctcブランチとseq2seqブランチで構成され、さらにオートエンコーディングモジュールによって拡張される。
関連した結合損失により認識性能が向上する一方、Seq2Seqブランチは効率的な単語表現を生成するために使用される。
キーワードスポッティングに適したコンパクトかつ高効率なディスクリプタを提供するために,バイナリ化と再トレーニングスキームを用いて,これらの表現をさらに処理する方法を示す。
提案手法はキーワードスポッティングにおける先行手法よりも優れているため,提案手法の有用性を検証し,単語認識の先駆的手法であるballparkで結果を提供する。
関連論文リスト
- A Generative Approach for Wikipedia-Scale Visual Entity Recognition [56.55633052479446]
与えられたクエリ画像をWikipediaにある600万の既存エンティティの1つにマッピングするタスクに対処する。
本稿では,対象エンティティを識別する「意味的・識別的コード」の自動復号化を学習する,新しい生成エンティティ認識フレームワークを紹介する。
論文 参考訳(メタデータ) (2024-03-04T13:47:30Z) - SimCKP: Simple Contrastive Learning of Keyphrase Representations [36.88517357720033]
そこで本論文では,(1)文脈認識型フレーズレベルの表現からキーフレーズを抽出する抽出器・ジェネレータと,(2)生成したフレーズのスコアを対応する文書と整列させることで,文書に現れないキーフレーズを生成するリランカと,の2つの段階からなる単純なコントラスト学習フレームワークであるSimCKPを提案する。
論文 参考訳(メタデータ) (2023-10-12T11:11:54Z) - Self-Sufficient Framework for Continuous Sign Language Recognition [75.60327502570242]
この作業の目標は、継続的手話認識のための自己充足型のフレームワークを開発することです。
これには、理解のための手、顔、口などの複雑なマルチスケール機能、フレームレベルのアノテーションの欠如が含まれる。
ネットワークやアノテーションを必要とせずに手動と非手動の両方の機能を抽出するDivide and Focus Convolution (DFConv)を提案する。
DPLRは、基底真理グロスシーケンスラベルと予測シーケンスを組み合わせることにより、非スパイクフレームレベルの擬似ラベルを伝搬する。
論文 参考訳(メタデータ) (2023-03-21T11:42:57Z) - Using virtual edges to extract keywords from texts modeled as complex
networks [0.1611401281366893]
我々は,単語とエッジが文脈的あるいは意味的類似性によって確立されるようなテキスト共起ネットワークをモデル化した。
実際、仮想エッジを使用することで、共起ネットワークの識別性が向上することがわかった。
論文 参考訳(メタデータ) (2022-05-04T16:43:03Z) - Instant One-Shot Word-Learning for Context-Specific Neural
Sequence-to-Sequence Speech Recognition [62.997667081978825]
本稿では、単語/フレーズメモリと、このメモリにアクセスして単語やフレーズを正しく認識する機構を備えたエンドツーエンドのASRシステムを提案する。
本稿では,この機構により,これまで認識できなかった単語の85%以上を認識できることを示す。
論文 参考訳(メタデータ) (2021-07-05T21:08:34Z) - Unsupervised Key-phrase Extraction and Clustering for Classification
Scheme in Scientific Publications [0.0]
本稿では,システムマッピング (SM) とシステムレビュー (SR) プロセスの自動化の可能性について検討する。
キーフレーズは教師なしの方法で科学文書から抽出され、対応する分類体系を構築するために使用される。
また、クラスタリングを使って関連するキーフレーズをグループ化する方法についても検討する。
論文 参考訳(メタデータ) (2021-01-25T10:17:33Z) - Keyphrase Extraction with Dynamic Graph Convolutional Networks and
Diversified Inference [50.768682650658384]
キーワード抽出(KE)は、ある文書でカバーされている概念やトピックを正確に表現するフレーズの集合を要約することを目的としている。
最近のシークエンス・ツー・シークエンス(Seq2Seq)ベースの生成フレームワークはKEタスクで広く使われ、様々なベンチマークで競合性能を得た。
本稿では,この2つの問題を同時に解くために,動的グラフ畳み込みネットワーク(DGCN)を採用することを提案する。
論文 参考訳(メタデータ) (2020-10-24T08:11:23Z) - Pairwise Learning for Name Disambiguation in Large-Scale Heterogeneous
Academic Networks [81.00481125272098]
本稿では,MA-PairRNN(Multi-view Attention-based Pairwise Recurrent Neural Network)を提案する。
MA-PairRNNは、不均一グラフ埋め込み学習とペアワイズ類似学習をフレームワークに統合する。
実世界の2つのデータセットの結果から、我々のフレームワークは名前の曖昧さに対するパフォーマンスを著しく一貫した改善をしていることがわかる。
論文 参考訳(メタデータ) (2020-08-30T06:08:20Z) - Keyphrase Extraction with Span-based Feature Representations [13.790461555410747]
キーフレーズは、文書を特徴付ける意味メタデータを提供することができる。
キーフレーズ抽出のための3つのアプローチ: (i) 従来の2段階ランキング法、 (ii) シーケンスラベリング、 (iii) ニューラルネットワークを用いた生成。
本稿では,すべてのコンテンツトークンから直接,キーフレーズのスパン的特徴表現を抽出する新規スパンキーフレーズ抽出モデルを提案する。
論文 参考訳(メタデータ) (2020-02-13T09:48:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。