論文の概要: Learning to Rank Words: Optimizing Ranking Metrics for Word Spotting
- arxiv url: http://arxiv.org/abs/2106.05144v1
- Date: Wed, 9 Jun 2021 15:39:05 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-10 21:13:40.624367
- Title: Learning to Rank Words: Optimizing Ranking Metrics for Word Spotting
- Title(参考訳): 単語のランク付け学習:単語スポッティングのためのランク付け基準の最適化
- Authors: Pau Riba, Adri\`a Molina, Lluis Gomez, Oriol Ramos-Terrades and Josep
Llad\'os
- Abstract要約: ユーザが定義した関連度スコアに従ってランク付けされた検索リストを期待する検索フレームワークを検討する。
単語スポッティング問題の文脈では、クエリ文字列から文字列編集距離に応じて関連スコアが設定されている。
本研究では,手書き語と実シーン語の両方の単語スポッティングにおいて,提案手法の競合性能を実験的に検証した。
- 参考スコア(独自算出の注目度): 3.5698678013121334
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: In this paper, we explore and evaluate the use of ranking-based objective
functions for learning simultaneously a word string and a word image encoder.
We consider retrieval frameworks in which the user expects a retrieval list
ranked according to a defined relevance score. In the context of a word
spotting problem, the relevance score has been set according to the string edit
distance from the query string. We experimentally demonstrate the competitive
performance of the proposed model on query-by-string word spotting for both,
handwritten and real scene word images. We also provide the results for
query-by-example word spotting, although it is not the main focus of this work.
- Abstract(参考訳): 本稿では,単語文字列と単語画像エンコーダを同時に学習するためのランキングベースの目的関数の利用について検討・評価する。
ユーザが定義した関連度スコアに従ってランク付けされた検索リストを期待する検索フレームワークを検討する。
単語スポッティング問題の文脈では、クエリ文字列から文字列編集距離に応じて関連スコアが設定されている。
本稿では,手書き語と実シーン語の両方の単語スポッティングにおいて,提案モデルの競合性能を実験的に実証する。
クエリ・バイ・例の単語スポッティングの結果も提供していますが、この研究の主な焦点ではありません。
関連論文リスト
- Dense X Retrieval: What Retrieval Granularity Should We Use? [56.90827473115201]
しばしば見過ごされる設計選択は、コーパスが索引付けされる検索単位である。
本稿では,高密度検索のための新しい検索ユニット,命題を提案する。
実験により、提案のような細粒度単位によるコーパスのインデックス付けは、検索タスクにおける通過レベル単位を著しく上回っていることが明らかとなった。
論文 参考訳(メタデータ) (2023-12-11T18:57:35Z) - What's in a Name? Beyond Class Indices for Image Recognition [28.02490526407716]
そこで本稿では,カテゴリの巨大語彙のみを先行情報として付与した画像に,クラス名を割り当てる視覚言語モデルを提案する。
非パラメトリックな手法を用いて画像間の有意義な関係を確立することにより、モデルが候補名のプールを自動的に絞り込むことができる。
本手法は,教師なし環境でのImageNetのベースラインを約50%改善する。
論文 参考訳(メタデータ) (2023-04-05T11:01:23Z) - Efficient Image-Text Retrieval via Keyword-Guided Pre-Screening [53.1711708318581]
現在の画像テキスト検索法は、N$関連時間複雑さに悩まされている。
本稿では,画像テキスト検索のための簡易かつ効果的なキーワード誘導事前スクリーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-14T09:36:42Z) - Disambiguation of Company names via Deep Recurrent Networks [101.90357454833845]
企業名文字列の埋め込みである教師付き学習を通じて,Siamese LSTM Network を抽出する手法を提案する。
私たちは、ラベル付けされるサンプルを優先するActive Learningアプローチが、より効率的な全体的な学習パイプラインをもたらす方法を分析します。
論文 参考訳(メタデータ) (2023-03-07T15:07:57Z) - Keyword Embeddings for Query Suggestion [3.7900158137749322]
本稿では,科学文献に基づいて学習したキーワード提案タスクのための2つの新しいモデルを提案する。
我々の手法はWord2VecとFastTextのアーキテクチャに適応し、文書のキーワード共起を利用してキーワード埋め込みを生成する。
我々は,タスクのベースラインよりも大幅に改善された,最先端の単語と文の埋め込みモデルに対する提案を評価した。
論文 参考訳(メタデータ) (2023-01-19T11:13:04Z) - An Empirical Study on Learning and Improving the Search Objective for
Unsupervised Paraphrasing [0.0]
本研究では,探索対象における雑音の平滑化に関する問題について,探索力学のモデル化を学習することによって検討する。
そして、学習したモデルを元の目的関数と組み合わせて、ブートストラップ方式で探索を誘導する。
実験結果から,学習モデルと元の探索対象とが組み合わさって,スムーズな効果が得られることがわかった。
論文 参考訳(メタデータ) (2022-03-23T00:30:28Z) - Keyphrase Extraction Using Neighborhood Knowledge Based on Word
Embeddings [17.198907789163123]
我々は、単語埋め込みを背景知識として活用して、単語間グラフに意味情報を加えることにより、グラフベースのランキングモデルを強化する。
提案手法は,確立されたベンチマークデータセットを用いて評価し,単語の埋め込み近傍情報によりモデル性能が向上することを示す。
論文 参考訳(メタデータ) (2021-11-13T21:48:18Z) - End-to-End Open Vocabulary Keyword Search [13.90172596423425]
本稿では,キーワード検索に最適化されたモデルを提案する。
提案モデルでは, 正と負の試行比率が人工的に均衡するタスクにおいて, 同様のエンド・ツー・エンドモデルより優れる。
LVCSRをベースとしたキーワード検索システムでは,出力の再スコア付けに本システムを用いることで,大幅な改善が期待できる。
論文 参考訳(メタデータ) (2021-08-23T18:34:53Z) - Improving Weakly Supervised Visual Grounding by Contrastive Knowledge
Distillation [55.198596946371126]
本稿では,領域句と画像文マッチングの両方を考慮したコントラスト学習フレームワークを提案する。
我々の中心となる革新は、画像文スコア関数を更に構築した領域句スコア関数の学習である。
このようなスコア関数の設計は、テスト時のオブジェクト検出の必要性を排除し、推論コストを大幅に削減する。
論文 参考訳(メタデータ) (2020-07-03T22:02:00Z) - On Vocabulary Reliance in Scene Text Recognition [79.21737876442253]
ボキャブラリ内の単語を持つ画像に対して、手法は良好に機能するが、ボキャブラリ外の単語を持つ画像にはあまり一般化しない。
私たちはこの現象を「語彙依存」と呼んでいる。
本研究では,2家族のモデルが協調的に学習できるようにするための,シンプルで効果的な相互学習戦略を提案する。
論文 参考訳(メタデータ) (2020-05-08T11:16:58Z) - Words aren't enough, their order matters: On the Robustness of Grounding
Visual Referring Expressions [87.33156149634392]
視覚的参照表現認識のための標準ベンチマークであるRefCOgを批判的に検討する。
83.7%のケースでは言語構造に関する推論は不要である。
比較学習とマルチタスク学習の2つの手法を提案し,ViLBERTのロバスト性を高める。
論文 参考訳(メタデータ) (2020-05-04T17:09:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。