論文の概要: Towards Writer Retrieval for Historical Datasets
- arxiv url: http://arxiv.org/abs/2305.05358v2
- Date: Wed, 14 Jun 2023 07:04:39 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-17 00:58:39.901215
- Title: Towards Writer Retrieval for Historical Datasets
- Title(参考訳): 歴史データセットのライター検索に向けて
- Authors: Marco Peer, Florian Kleber, Robert Sablatnig
- Abstract要約: キーポイントで検出されたクラスタリングSIFT記述子に基づく文字検索のための教師なしアプローチ。
残余ネットワークに続いて提案したNetRVLADは,複雑さを低減した符号化層である。
このアプローチは、現代的なデータセットでも同等のパフォーマンスを実現しています。
- 参考スコア(独自算出の注目度): 0.6445605125467572
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper presents an unsupervised approach for writer retrieval based on
clustering SIFT descriptors detected at keypoint locations resulting in
pseudo-cluster labels. With those cluster labels, a residual network followed
by our proposed NetRVLAD, an encoding layer with reduced complexity compared to
NetVLAD, is trained on 32x32 patches at keypoint locations. Additionally, we
suggest a graph-based reranking algorithm called SGR to exploit similarities of
the page embeddings to boost the retrieval performance. Our approach is
evaluated on two historical datasets (Historical-WI and HisIR19). We include an
evaluation of different backbones and NetRVLAD. It competes with related work
on historical datasets without using explicit encodings. We set a new
State-of-the-art on both datasets by applying our reranking scheme and show
that our approach achieves comparable performance on a modern dataset as well.
- Abstract(参考訳): 本稿では,キーポイント位置で検出されたクラスタリングSIFT記述子に基づいて,擬似クラスタラベルによる文字検索を行う手法を提案する。
これらのクラスタラベルを用いて,NetVLADに比べて複雑性の低い符号化層であるNetRVLADをキーポイント位置32x32パッチでトレーニングした。
さらに,ページ埋め込みの類似性を生かして検索性能を向上させるため,SGRと呼ばれるグラフベースの再ランクアルゴリズムを提案する。
本手法は2つの歴史的データセット(Historical-WIとHisIR19)で評価する。
我々は異なるバックボーンとNetRVLADの評価を含む。
明示的なエンコーディングを使わずに、歴史的なデータセットに関する関連作業と競合する。
再ランキング方式を適用することで,両データセットに新たな最先端技術を設定し,現代的なデータセットでも同等のパフォーマンスを達成できることを実証した。
関連論文リスト
- Evaluating Retrieval Quality in Retrieval-Augmented Generation [21.115495457454365]
従来のエンドツーエンド評価手法は計算コストが高い。
本稿では,検索リストの各文書をRAGシステム内の大規模言語モデルで個別に利用するeRAGを提案する。
eRAGは、ランタイムを改善し、エンドツーエンド評価の最大50倍のGPUメモリを消費する、大きな計算上のアドバンテージを提供する。
論文 参考訳(メタデータ) (2024-04-21T21:22:28Z) - Generalized Category Discovery with Clustering Assignment Consistency [56.92546133591019]
一般化圏発見(GCD)は、最近提案されたオープンワールドタスクである。
クラスタリングの一貫性を促進するための協調学習ベースのフレームワークを提案する。
提案手法は,3つの総合的なベンチマークと3つのきめ細かい視覚認識データセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2023-10-30T00:32:47Z) - Redundancy-Free Self-Supervised Relational Learning for Graph Clustering [13.176413653235311]
冗長フリーグラフクラスタリング(R$2$FGC)という,自己教師付き深層グラフクラスタリング手法を提案する。
オートエンコーダとグラフオートエンコーダに基づいて,グローバルビューとローカルビューの両方から属性レベルと構造レベルの関係情報を抽出する。
この実験は,R$2$FGCが最先端のベースラインよりも優れていることを示すために,広く使用されているベンチマークデータセット上で実施されている。
論文 参考訳(メタデータ) (2023-09-09T06:18:50Z) - Reinforcement Graph Clustering with Unknown Cluster Number [91.4861135742095]
本稿では,Reinforcement Graph Clusteringと呼ばれる新しいディープグラフクラスタリング手法を提案する。
提案手法では,クラスタ数決定と教師なし表現学習を統一的なフレームワークに統合する。
フィードバック動作を行うために、クラスタリング指向の報酬関数を提案し、同一クラスタの凝集を高め、異なるクラスタを分離する。
論文 参考訳(メタデータ) (2023-08-13T18:12:28Z) - Challenging the Myth of Graph Collaborative Filtering: a Reasoned and Reproducibility-driven Analysis [50.972595036856035]
本稿では,6つの人気グラフと最近のグラフ推薦モデルの結果を再現するコードを提案する。
これらのグラフモデルと従来の協調フィルタリングモデルを比較する。
ユーザの近所からの情報フローを調べることにより,データセット構造における内在的特徴にどのようなモデルが影響するかを同定することを目的とする。
論文 参考訳(メタデータ) (2023-08-01T09:31:44Z) - EGRC-Net: Embedding-induced Graph Refinement Clustering Network [66.44293190793294]
埋め込みによるグラフリファインメントクラスタリングネットワーク (EGRC-Net) という新しいグラフクラスタリングネットワークを提案する。
EGRC-Netは学習した埋め込みを利用して初期グラフを適応的に洗練し、クラスタリング性能を向上させる。
提案手法はいくつかの最先端手法より一貫して優れている。
論文 参考訳(メタデータ) (2022-11-19T09:08:43Z) - Self-supervised Contrastive Attributed Graph Clustering [110.52694943592974]
我々は,自己教師型コントラストグラフクラスタリング(SCAGC)という,新たな属性グラフクラスタリングネットワークを提案する。
SCAGCでは,不正確なクラスタリングラベルを活用することで,ノード表現学習のための自己教師付きコントラスト損失を設計する。
OOSノードでは、SCAGCはクラスタリングラベルを直接計算できる。
論文 参考訳(メタデータ) (2021-10-15T03:25:28Z) - Open-Set Recognition: A Good Closed-Set Classifier is All You Need [146.6814176602689]
分類器が「ゼロ・オブ・ア・ア・ア・ベ」決定を行う能力は、閉集合クラスにおける精度と高い相関関係があることが示される。
この相関を利用して、閉セット精度を向上させることにより、クロスエントロピーOSR'ベースライン'の性能を向上させる。
また、セマンティックノベルティを検出するタスクをより尊重する新しいベンチマークを構築した。
論文 参考訳(メタデータ) (2021-10-12T17:58:59Z) - Variational Auto Encoder Gradient Clustering [0.0]
近年,ディープニューラルネットワークモデルを用いたクラスタリングが広く研究されている。
本稿では、より良いクラスタリングを実現するために確率関数勾配上昇を使用してデータを処理する方法を検討する。
DBSCANクラスタリングアルゴリズムに基づいて,データに適したクラスタ数を調べるための簡便かつ効果的な方法を提案する。
論文 参考訳(メタデータ) (2021-05-11T08:00:36Z) - Writer Identification and Writer Retrieval Based on NetVLAD with
Re-ranking [0.0]
文書解析と認識の分野では,著者同定と著者検索が課題となっている。
特徴抽出器としてResNet-20からなる統一ニューラルネットワークアーキテクチャを採用することにより,新たなパイプラインを提案する。
k$-reciprocal neighbors に基づく識別と検索のタスクに対して,新たな階層戦略が導入された。
論文 参考訳(メタデータ) (2020-12-11T08:22:28Z) - GuCNet: A Guided Clustering-based Network for Improved Classification [15.747227188672088]
本稿では,既存の有分別データセットの分類容易性を活用した,新しい,かつ非常に単純な分類手法を提案する。
実験データセットとのセマンティックな関係を持たないかもしれないガイドデータセットは、提案されたネットワークは、課題データセットのクラスワイドな特徴をガイドセットの異なるクラスタに埋め込もうとする。
論文 参考訳(メタデータ) (2020-10-11T10:22:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。