論文の概要: Deep Multilabel CNN for Forensic Footwear Impression Descriptor
Identification
- arxiv url: http://arxiv.org/abs/2102.05090v1
- Date: Tue, 9 Feb 2021 19:39:28 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-11 14:37:34.291176
- Title: Deep Multilabel CNN for Forensic Footwear Impression Descriptor
Identification
- Title(参考訳): 法医学的履物印象記述子識別のための深層マルチラベルcnn
- Authors: Marcin Budka, Akanda Wahid Ul Ashraf, Scott Neville, Alun Mackrill,
Matthew Bennett
- Abstract要約: 我々は、法医学的ユースケースにおいて、Emphdescriptorsとして知られる履物印象の特徴を分類するために、深層学習アプローチを採用する。
我々は、異なるドメインのデータに基づいて事前訓練されたニューラルネットワークに、サンプル化されたグレースケールインプレッションを供給するための技術を開発し、評価する。
- 参考スコア(独自算出の注目度): 0.9786690381850356
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In recent years deep neural networks have become the workhorse of computer
vision. In this paper, we employ a deep learning approach to classify footwear
impression's features known as \emph{descriptors} for forensic use cases.
Within this process, we develop and evaluate an effective technique for feeding
downsampled greyscale impressions to a neural network pre-trained on data from
a different domain. Our approach relies on learnable preprocessing layer paired
with multiple interpolation methods used in parallel. We empirically show that
this technique outperforms using a single type of interpolated image without
learnable preprocessing, and can help to avoid the computational penalty
related to using high resolution inputs, by making more efficient use of the
low resolution inputs. We also investigate the effect of preserving the aspect
ratio of the inputs, which leads to considerable boost in accuracy without
increasing the computational budget with respect to squished rectangular
images. Finally, we formulate a set of best practices for transfer learning
with greyscale inputs, potentially widely applicable in computer vision tasks
ranging from footwear impression classification to medical imaging.
- Abstract(参考訳): 近年、ディープニューラルネットワークはコンピュータビジョンの原動力となっている。
本稿では,履物印象の特徴を分類する深層学習手法「emph{descriptors}」を,法医学的ユースケースに適用する。
このプロセスの中で,異なる領域のデータに基づいて事前学習したニューラルネットワークに対して,ダウンサンプリングされたグレイスケール印象を送付する効果的な手法を開発し,評価する。
提案手法は,複数の補間手法を並列に組み合わせた学習可能な前処理層に依存する。
本手法は,1種類の補間画像を学習前処理なしで処理し,低分解能入力をより効率的に利用することにより,高分解能入力による計算ペナルティの回避に有効であることを示す。
また,入力のアスペクト比の保存効果についても検討し,正方形画像に対する計算予算を増大させることなく精度を大幅に向上させることを示した。
最後に,履物印象分類から医用画像まで幅広いコンピュータビジョンタスクに適用可能な,グレースケールな入力による伝達学習のベストプラクティスを定式化した。
関連論文リスト
- AttentionPainter: An Efficient and Adaptive Stroke Predictor for Scene Painting [82.54770866332456]
ストロークベースのレンダリング(SBR)は、入力画像をパラメータ化されたストロークのシーケンスに分解することを目的としており、入力画像に似た絵に描画することができる。
単一ステップのニューラルペイントのための効率よく適応的なモデルであるAttentionPainterを提案する。
論文 参考訳(メタデータ) (2024-10-21T18:36:45Z) - ConKeD: Multiview contrastive descriptor learning for keypoint-based retinal image registration [6.618504904743609]
網膜画像登録のための記述子を学習するための新しい深層学習手法であるConKeDを提案する。
現在の登録方式とは対照的に,本手法では,新しい多正多負のコントラスト学習戦略を採用している。
本実験は, 新規多陽性多負戦略の利点を実証するものである。
論文 参考訳(メタデータ) (2024-01-11T13:22:54Z) - Deep Multi-Threshold Spiking-UNet for Image Processing [51.88730892920031]
本稿では,SNN(Spike Neural Networks)とU-Netアーキテクチャを組み合わせた,画像処理のためのスパイキング-UNetの概念を紹介する。
効率的なスパイキング-UNetを実現するためには,スパイクによる高忠実度情報伝播の確保と,効果的なトレーニング戦略の策定という2つの課題に直面する。
実験の結果,画像のセグメンテーションとデノイングにおいて,スパイキングUNetは非スパイキングと同等の性能を発揮することがわかった。
論文 参考訳(メタデータ) (2023-07-20T16:00:19Z) - Self-Supervised Endoscopic Image Key-Points Matching [1.3764085113103222]
本稿では,深層学習技術に基づく内視鏡画像マッチングのための新しい自己教師型アプローチを提案する。
提案手法は,手作りの標準的なローカル特徴記述子よりも精度とリコールの点で優れていた。
論文 参考訳(メタデータ) (2022-08-24T10:47:21Z) - On Efficient Transformer and Image Pre-training for Low-level Vision [74.22436001426517]
プレトレーニングは、ハイレベルコンピュータビジョンにおける多くの最先端の芸術である。
画像事前学習の詳細な研究について述べる。
低レベルのタスクでは,事前トレーニングが極めて異なる役割を担っています。
論文 参考訳(メタデータ) (2021-12-19T15:50:48Z) - Differentiable Patch Selection for Image Recognition [37.11810982945019]
そこで我々は,高解像度画像を処理するために,入力の最も関連性の高い部分を選択可能なTop-K演算子を提案する。
オブジェクト/部分境界ボックスアノテーションを使わずに,トラフィックサイン認識,パッチ間関係推論,微粒化認識の結果を示す。
論文 参考訳(メタデータ) (2021-04-07T11:15:51Z) - Leveraging Self-Supervision for Cross-Domain Crowd Counting [71.75102529797549]
混雑したシーンで人をカウントするための最先端の方法は、群衆密度を推定するために深いネットワークに依存します。
われわれのネットワークは、通常の画像から逆さまの実際の画像を認識できるように訓練し、その不確実性を予測する能力を組み込む。
このアルゴリズムは、推論時に余分な計算をせずに、最先端のクロスドメイン群をカウントするアルゴリズムを一貫して上回る。
論文 参考訳(メタデータ) (2021-03-30T12:37:55Z) - Blind deblurring for microscopic pathology images using deep learning
networks [0.0]
顕微鏡画像のデフォーカスや動きのぼかしを軽減できるディープラーニングベースのアプローチを実証する。
ぼやけたタイプ、ぼやけた範囲、病理染色を事前に知ることなく、より鮮明できめ細かな画像が得られる。
そこで我々は, 画像のぼかし補正とAIアルゴリズムの診断結果の改善に優れた性能を示した。
論文 参考訳(メタデータ) (2020-11-24T03:52:45Z) - Learning to Learn Parameterized Classification Networks for Scalable
Input Images [76.44375136492827]
畳み込みニューラルネットワーク(CNN)は、入力解像度の変化に関して予測可能な認識動作を持たない。
我々はメタラーナーを用いて、様々な入力スケールのメインネットワークの畳み込み重みを生成する。
さらに、異なる入力解像度に基づいて、モデル予測よりもフライでの知識蒸留を利用する。
論文 参考訳(メタデータ) (2020-07-13T04:27:25Z) - Guided interactive image segmentation using machine learning and color
based data set clustering [0.16683739531034203]
本稿では,スーパーボクセルを用いた機械学習によるインタラクティブな画像セグメント化と,大規模データセットにおける類似色画像の自動識別のためのクラスタリング手法を組み合わせた新しい手法を提案する。
本手法は, 生体画像や医用画像に有意な色変化が生じ, しばしば避けられない問題を解消する。
論文 参考訳(メタデータ) (2020-05-15T17:25:48Z) - BP-DIP: A Backprojection based Deep Image Prior [49.375539602228415]
画像復元手法として, (i)Deep Image Prior (DIP) と (ii) バックプロジェクション (BP) の2つの手法を提案する。
提案手法はBP-DIP(BP-DIP)と呼ばれ,高いPSNR値とより優れた推論実行時間を持つ通常のDIPよりも優れた性能を示す。
論文 参考訳(メタデータ) (2020-03-11T17:09:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。