論文の概要: Attention based Writer Independent Handwriting Verification
- arxiv url: http://arxiv.org/abs/2009.04532v3
- Date: Thu, 1 Oct 2020 00:59:36 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-21 02:02:19.451929
- Title: Attention based Writer Independent Handwriting Verification
- Title(参考訳): 注意に基づく手書き独立筆跡検証
- Authors: Mohammad Abuzar Shaikh, Tiehang Duan, Mihir Chauhan, Sargur Srihari
- Abstract要約: 我々は,2次元入力の特徴空間における有意点を捉えるために,クロスアテンション機構とソフトアテンション機構を実装し,統合する。
ネットワークの複数のレベルからアテンションマップを抽出することにより、提案した決定に対して意味のある説明を生成する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The task of writer verification is to provide a likelihood score for whether
the queried and known handwritten image samples belong to the same writer or
not. Such a task calls for the neural network to make it's outcome
interpretable, i.e. provide a view into the network's decision making process.
We implement and integrate cross-attention and soft-attention mechanisms to
capture the highly correlated and salient points in feature space of 2D inputs.
The attention maps serve as an explanation premise for the network's output
likelihood score. The attention mechanism also allows the network to focus more
on relevant areas of the input, thus improving the classification performance.
Our proposed approach achieves a precision of 86\% for detecting intra-writer
cases in CEDAR cursive "AND" dataset. Furthermore, we generate meaningful
explanations for the provided decision by extracting attention maps from
multiple levels of the network.
- Abstract(参考訳): 著者検証のタスクは、クエリされた画像と既知の手書き画像のサンプルが同一のライターに属するかどうかの確率スコアを提供することである。
このようなタスクでは、ニューラルネットワークが結果の解釈を可能にするために、すなわち、ネットワークの意思決定プロセスへのビューを提供する必要があります。
2次元入力の特徴空間における高相関点と正解点を捉えるために,クロスアテンションとソフトアテンションの機構を実装し,統合する。
注意マップは、ネットワークの出力確率スコアの説明前提として機能する。
また、アテンション機構により、ネットワークは入力の関連領域に集中することができ、分類性能が向上する。
提案手法は,シーダーカーシブ"and"データセットにおけるライター内症例の検出精度を86\%向上させる。
さらに,ネットワークの複数レベルから注目マップを抽出することにより,提案した決定に対して意味のある説明を生成する。
関連論文リスト
- Attention based End to end network for Offline Writer Identification on Word level data [3.5829161769306244]
注意駆動型畳み込みニューラルネットワーク(CNN)に基づく著者識別システムを提案する。
このシステムは、単語画像から抽出された断片として知られる画像セグメントを利用して、ピラミッドベースの戦略を用いて訓練されている。
提案アルゴリズムの有効性を3つのベンチマークデータベースで評価した。
論文 参考訳(メタデータ) (2024-04-11T09:41:14Z) - Semantics Meets Temporal Correspondence: Self-supervised Object-centric Learning in Videos [63.94040814459116]
自己教師付き手法は、高レベルの意味論と低レベルの時間対応の学習において顕著な進歩を見せている。
融合した意味特徴と対応地図の上に,意味認識型マスキングスロットアテンションを提案する。
我々は、時間的コヒーレントなオブジェクト中心表現を促進するために、セマンティックおよびインスタンスレベルの時間的一貫性を自己スーパービジョンとして採用する。
論文 参考訳(メタデータ) (2023-08-19T09:12:13Z) - Learning Feature Matching via Matchable Keypoint-Assisted Graph Neural
Network [52.29330138835208]
画像のペア間の局所的な特徴の正確なマッチングは、コンピュータビジョンの課題である。
従来の研究では、注意に基づくグラフニューラルネットワーク(GNN)と、画像内のキーポイントに完全に接続されたグラフを使用するのが一般的だった。
本稿では,非繰り返しキーポイントをバイパスし,マッチング可能なキーポイントを利用してメッセージパッシングを誘導する,疎注意に基づくGNNアーキテクチャであるMaKeGNNを提案する。
論文 参考訳(メタデータ) (2023-07-04T02:50:44Z) - Improving Fine-Grained Visual Recognition in Low Data Regimes via
Self-Boosting Attention Mechanism [27.628260249895973]
SAM(Self-boosting attention mechanism)は、ネットワークを正規化して、サンプルやクラス間で共有されるキー領域に集中するための新しい手法である。
我々はSAMを用いて、二線形プール方式で畳み込みマップをプールするために複数の注意マップを作成する変種を開発する。
論文 参考訳(メタデータ) (2022-08-01T05:36:27Z) - Semantic Reinforced Attention Learning for Visual Place Recognition [15.84086970453363]
大規模な視覚的位置認識(VPR)は、画像内のすべての視覚的手がかりがタスクに有益であるとは限らないため、本質的に困難である。
本稿では,セマンティック強化型注意学習ネットワーク(SRALNet)を提案する。
都市規模のVPRベンチマークデータセットにおいて,本手法が最先端技術より優れていることを示す実験結果を得た。
論文 参考訳(メタデータ) (2021-08-19T02:14:36Z) - Object Detection Based Handwriting Localization [2.6641834518599308]
文書から手書き領域をローカライズするオブジェクト検出手法を提案する。
提案手法は手書き文字認識や署名検証などの他の作業を容易にすることも期待されている。
論文 参考訳(メタデータ) (2021-06-28T21:25:20Z) - Bayesian Attention Belief Networks [59.183311769616466]
注意に基づくニューラルネットワークは、幅広いタスクにおいて最先端の結果を得た。
本稿では,非正規化注意重みをモデル化してデコーダネットワークを構築するベイズ的注意信念ネットワークについて紹介する。
提案手法は, 精度, 不確実性推定, ドメイン間の一般化, 敵攻撃において, 決定論的注意と最先端の注意よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-06-09T17:46:22Z) - Attentional Graph Neural Network for Parking-slot Detection [10.095984750382478]
本論文では,周辺画像におけるマーキングポイントをグラフ構造データとして参照する注目グラフニューラルネットワークに基づくパーキングスロット検出手法を提案する。
手動で設計した後処理がなければ、提案手法はエンドツーエンドのトレーニングが可能である。
公開ベンチマークデータセットでは,提案手法が最先端精度を達成する実験が行われている。
論文 参考訳(メタデータ) (2021-04-06T15:14:39Z) - Coordinate Attention for Efficient Mobile Network Design [96.40415345942186]
チャネルの注目に位置情報を埋め込むことにより,モバイルネットワークに対する新たな注意メカニズムを提案する。
2次元グローバルプーリングにより特徴テンソルを単一特徴ベクトルに変換するチャネルアテンションとは異なり、座標アテンションはチャネルアテンションを2つの1次元特徴符号化プロセスに分解する。
座標の注意はImageNetの分類に有用であり、オブジェクト検出やセマンティックセグメンテーションといった下流タスクではよりうまく振る舞う。
論文 参考訳(メタデータ) (2021-03-04T09:18:02Z) - PC-RGNN: Point Cloud Completion and Graph Neural Network for 3D Object
Detection [57.49788100647103]
LiDARベースの3Dオブジェクト検出は、自動運転にとって重要なタスクです。
現在のアプローチでは、遠方および閉ざされた物体の偏りと部分的な点雲に苦しむ。
本稿では,この課題を2つの解決法で解決する新しい二段階アプローチ,pc-rgnnを提案する。
論文 参考訳(メタデータ) (2020-12-18T18:06:43Z) - Ventral-Dorsal Neural Networks: Object Detection via Selective Attention [51.79577908317031]
我々はVDNet(Ventral-Dorsal Networks)と呼ばれる新しいフレームワークを提案する。
人間の視覚システムの構造にインスパイアされた我々は「Ventral Network」と「Dorsal Network」の統合を提案する。
実験の結果,提案手法は最先端の物体検出手法よりも優れていることがわかった。
論文 参考訳(メタデータ) (2020-05-15T23:57:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。