論文の概要: UESegNet: Context Aware Unconstrained ROI Segmentation Networks for Ear
Biometric
- arxiv url: http://arxiv.org/abs/2010.03990v1
- Date: Thu, 8 Oct 2020 14:05:15 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-09 11:13:26.180606
- Title: UESegNet: Context Aware Unconstrained ROI Segmentation Networks for Ear
Biometric
- Title(参考訳): UESegNet: 耳のバイオメトリックのための制約のないROIセグメンテーションネットワークを意識する
- Authors: Aman Kamboj, Rajneesh Rani, Aditya Nigam, Ranjeet Ranjan Jha
- Abstract要約: 耳のバイオメトリックスは 制約のない環境において かなりの困難を抱えています
野生における耳の局所化の問題に対処するため、我々は2つの高性能興味領域分割モデル UESegNet-1 と UESegNet-2 を提案している。
モデルの一般化をテストするために、6つの異なるベンチマークデータセットで評価される。
- 参考スコア(独自算出の注目度): 8.187718963808484
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Biometric-based personal authentication systems have seen a strong demand
mainly due to the increasing concern in various privacy and security
applications. Although the use of each biometric trait is problem dependent,
the human ear has been found to have enough discriminating characteristics to
allow its use as a strong biometric measure. To locate an ear in a 2D side face
image is a challenging task, numerous existing approaches have achieved
significant performance, but the majority of studies are based on the
constrained environment. However, ear biometrics possess a great level of
difficulties in the unconstrained environment, where pose, scale, occlusion,
illuminations, background clutter etc. varies to a great extent. To address the
problem of ear localization in the wild, we have proposed two high-performance
region of interest (ROI) segmentation models UESegNet-1 and UESegNet-2, which
are fundamentally based on deep convolutional neural networks and primarily
uses contextual information to localize ear in the unconstrained environment.
Additionally, we have applied state-of-the-art deep learning models viz; FRCNN
(Faster Region Proposal Network) and SSD (Single Shot MultiBox Detecor) for ear
localization task. To test the model's generalization, they are evaluated on
six different benchmark datasets viz; IITD, IITK, USTB-DB3, UND-E, UND-J2 and
UBEAR, all of which contain challenging images. The performance of the models
is compared on the basis of object detection performance measure parameters
such as IOU (Intersection Over Union), Accuracy, Precision, Recall, and
F1-Score. It has been observed that the proposed models UESegNet-1 and
UESegNet-2 outperformed the FRCNN and SSD at higher values of IOUs i.e. an
accuracy of 100\% is achieved at IOU 0.5 on majority of the databases.
- Abstract(参考訳): 生体認証ベースの個人認証システムには,プライバシやセキュリティ上のさまざまなアプリケーションに対する懸念が高まっているため,大きな需要がある。
それぞれの生体計測特性は問題に依存しているものの、ヒトの耳は強力な生体計測基準としての使用を可能にする十分な識別特性を持つことがわかった。
2次元側面画像における耳の特定は困難な課題であり,既存の手法が有意な性能を発揮してきたが,その大半は制約のある環境に基づいている。
しかし、耳のバイオメトリックスは、ポーズ、スケール、オクルージョン、イルミネーション、背景のぼやけなど、制約のない環境において大きな困難を抱えている。
耳の局所化問題に対処するため,本研究では,深い畳み込みニューラルネットワークを基本として,制約のない環境下での耳の局所化に主にコンテキスト情報を用いる,2つの高性能興味領域分割モデル UESegNet-1 と UESegNet-2 を提案する。
さらに、現在最先端のディープラーニングモデルviz、FRCNN(Faster Region Proposal Network)とSSD(Single Shot MultiBox Detecor)を耳局所化タスクに適用した。
モデルの一般化をテストするために、それらは6つのベンチマークデータセットviz、iitd、iitk、ustb-db3、und-e、und-j2、ubearで評価される。
モデルの性能は、IOU(Intersection Over Union)、精度、精度、リコール、F1スコアなどのオブジェクト検出性能測定パラメータに基づいて比較される。
提案したモデル UESegNet-1 と UESegNet-2 は FRCNN と SSD を IOU のより高い値で上回っている。
関連論文リスト
- EMWaveNet: Physically Explainable Neural Network Based on Microwave Propagation for SAR Target Recognition [4.251056028888424]
本研究では,複雑なSAR画像認識のための物理的に説明可能なフレームワークを提案する。
ネットワークアーキテクチャは完全にパラメータ化され、全ての学習可能なパラメータには明確な物理的意味があり、計算プロセスは完全に周波数領域で完了する。
提案手法は, 高い物理的論理, 高い物理的説明性, 堅牢性, および優れた処理能力を有することを示した。
論文 参考訳(メタデータ) (2024-10-13T07:04:49Z) - Adapting Segment Anything Model for Unseen Object Instance Segmentation [70.60171342436092]
Unseen Object Instance(UOIS)は、非構造環境で動作する自律ロボットにとって不可欠である。
UOISタスクのためのデータ効率のよいソリューションであるUOIS-SAMを提案する。
UOIS-SAMは、(i)HeatmapベースのPrompt Generator(HPG)と(ii)SAMのマスクデコーダに適応する階層識別ネットワーク(HDNet)の2つの重要なコンポーネントを統合する。
論文 参考訳(メタデータ) (2024-09-23T19:05:50Z) - FSD: Fully-Specialized Detector via Neural Architecture Search [2.149718433100702]
まず,FSDを設計するための完全自動パイプラインを提案し,検討する。
DeepLesionデータセットでは、FSDは2次病変検出タスクで約40%少ないパラメータを使用して3.1mAPゲインを達成することができる。
論文 参考訳(メタデータ) (2023-05-26T05:41:20Z) - SAN: a robust end-to-end ASR model architecture [0.0]
自動音声認識のためのSiamese Adversarial Network (SAN)アーキテクチャ
SANは音声特徴入力を区別するために2つのサブネットワークを構築し、これらのサブネットワークの出力分布を統合するために損失を導入する。
音声認識タスクのための複数のデータセット上で,SANモデルを用いて数値実験を行う。
論文 参考訳(メタデータ) (2022-10-27T09:36:25Z) - Deep Multi-Scale U-Net Architecture and Noise-Robust Training Strategies
for Histopathological Image Segmentation [6.236433671063744]
本稿では,U-Netエンコーダの各畳み込みモジュールにマルチスケールの特徴マップを明示的に付加し,ヒストロジー画像のセグメンテーションを改善することを提案する。
乳がんリンパ節のプライベートデータセットを用いた実験では, 提案した2つの拡張に基づいて, U-Netベースラインを大幅に改善した。
論文 参考訳(メタデータ) (2022-05-03T21:00:44Z) - Priming Cross-Session Motor Imagery Classification with A Universal Deep
Domain Adaptation Framework [3.6824205556465834]
運動画像(英: Motor image、MI)は、脳のコンピュータインタフェース(BCI)のパラダイムである。
本稿では,領域適応理論の数学的モデルに基づくクロスセッションMI分類のための,シームズ深部ドメイン適応(SDDA)フレームワークを提案する。
提案するフレームワークは、ネットワーク構造を変更することなく、既存のほとんどのニューラルネットワークに容易に適用することができる。
論文 参考訳(メタデータ) (2022-02-19T09:30:08Z) - AF$_2$: Adaptive Focus Framework for Aerial Imagery Segmentation [86.44683367028914]
航空画像のセグメンテーションにはいくつかの独特な課題があり、中でも最も重要なものは前景と背景のアンバランスにある。
本稿では,階層的なセグメンテーション手法を採用し,マルチスケール表現を適応的に活用するAdaptive Focus Framework (AF$)を提案する。
AF$は、広く使われている3つの航空ベンチマークの精度を大幅に改善した。
論文 参考訳(メタデータ) (2022-02-18T10:14:45Z) - Efficient Person Search: An Anchor-Free Approach [86.45858994806471]
パーソンサーチは、クエリーの人物を、リアルで切り刻まれていない画像から、同時にローカライズし、識別することを目的としている。
この目標を達成するために、最先端モデルは通常、Faster R-CNNのような2段階検出器にre-idブランチを追加する。
本研究では,この課題に対処するためのアンカーフリーな手法を提案する。
論文 参考訳(メタデータ) (2021-09-01T07:01:33Z) - UniCon: Unified Context Network for Robust Active Speaker Detection [111.90529347692723]
我々は、堅牢なアクティブ話者検出(ASD)のための新しい効率的なフレームワークUnified Context Network(UniCon)を導入する。
私たちのソリューションは、複数の種類のコンテキスト情報を共同でモデリングすることに焦点を当てた、新しく統合されたフレームワークです。
異なる設定下で、いくつかの挑戦的なASDベンチマークで徹底的なアブレーション研究が実施されている。
論文 参考訳(メタデータ) (2021-08-05T13:25:44Z) - KiU-Net: Towards Accurate Segmentation of Biomedical Images using
Over-complete Representations [59.65174244047216]
本稿では,高次元にデータを投影するオーバーコンプリートアーキテクチャ(Ki-Net)を提案する。
このネットワークは、U-Netで拡張されると、小さな解剖学的ランドマークを分割する場合に大幅に改善される。
早期新生児の2次元超音波による脳解剖学的セグメント化の課題について検討した。
論文 参考訳(メタデータ) (2020-06-08T18:59:24Z) - Deep Speaker Embeddings for Far-Field Speaker Recognition on Short
Utterances [53.063441357826484]
深層話者埋め込みに基づく話者認識システムは,制御条件下での大幅な性能向上を実現している。
制御されていない雑音環境下での短い発話に対する話者検証は、最も困難で要求の高いタスクの1つである。
本稿では,a)環境騒音の有無による遠距離話者検証システムの品質向上,b)短時間発話におけるシステム品質劣化の低減という2つの目標を達成するためのアプローチを提案する。
論文 参考訳(メタデータ) (2020-02-14T13:34:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。