論文の概要: Efficient Palm-Line Segmentation with U-Net Context Fusion Module
- arxiv url: http://arxiv.org/abs/2102.12127v1
- Date: Wed, 24 Feb 2021 08:42:52 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-25 22:26:43.596055
- Title: Efficient Palm-Line Segmentation with U-Net Context Fusion Module
- Title(参考訳): U-Netコンテキスト融合モジュールによる効率的なパームラインセグメンテーション
- Authors: Toan Pham Van, Son Trung Nguyen, Linh Bao Doan, Ngoc N. Tran and Ta
Minh Thanh
- Abstract要約: 人間の手の画像から原則的手のひら線を抽出するアルゴリズムを提案する。
本手法は,ディープラーニングネットワーク(DNN)を適用して性能向上を図る。
UNetセグメンテーションニューラルネットワークアーキテクチャに基づき、パームラインを検出するための高効率アーキテクチャを提案します。
- 参考スコア(独自算出の注目度): 1.1024591739346292
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Many cultures around the world believe that palm reading can be used to
predict the future life of a person. Palmistry uses features of the hand such
as palm lines, hand shape, or fingertip position. However, the research on
palm-line detection is still scarce, many of them applied traditional image
processing techniques. In most real-world scenarios, images usually are not in
well-conditioned, causing these methods to severely under-perform. In this
paper, we propose an algorithm to extract principle palm lines from an image of
a person's hand. Our method applies deep learning networks (DNNs) to improve
performance. Another challenge of this problem is the lack of training data. To
deal with this issue, we handcrafted a dataset from scratch. From this dataset,
we compare the performance of readily available methods with ours. Furthermore,
based on the UNet segmentation neural network architecture and the knowledge of
attention mechanism, we propose a highly efficient architecture to detect
palm-lines. We proposed the Context Fusion Module to capture the most important
context feature, which aims to improve segmentation accuracy. The experimental
results show that it outperforms the other methods with the highest F1 Score
about 99.42% and mIoU is 0.584 for the same dataset.
- Abstract(参考訳): 世界中の多くの文化は、パーム読書は人の将来の生活を予測するのに使えると信じている。
手のひらのライン、手の形、または指先の位置のような手の特徴を使用します。
しかし、手のひら線検出の研究はまだ少なく、その多くは伝統的な画像処理技術を適用している。
ほとんどの現実世界のシナリオでは、イメージは通常よく条件が整っていないため、これらのメソッドはパフォーマンスが著しく低下します。
本稿では,人の手の画像から原則的手のひら線を抽出するアルゴリズムを提案する。
本手法は,ディープラーニングネットワーク(DNN)を適用して性能向上を図る。
この問題のもうひとつの課題は、トレーニングデータの欠如だ。
この問題に対処するため、一からデータセットを手作りしました。
このデータセットから、利用可能なメソッドのパフォーマンスを我々のものと比べる。
さらに, unetセグメンテーションニューラルネットワークアーキテクチャと注意機構の知識に基づいて, パームラインを検出するための高効率なアーキテクチャを提案する。
セグメンテーション精度の向上を目的とした最も重要なコンテキスト機能をキャプチャするためのContext Fusion Moduleを提案しました。
実験結果は、最高F1スコアが99.42%、mIoUが0.584である他の方法よりも優れていることを示している。
関連論文リスト
- TrueDeep: A systematic approach of crack detection with less data [0.0]
ドメイン知識をディープラーニングアーキテクチャと組み合わせることで、少ないデータで同様のパフォーマンスを実現することができることを示す。
我々のアルゴリズムは、全データの23%で開発され、テストデータ上でも同様の性能を持ち、複数の盲点データセット上では大幅に性能が向上した。
論文 参考訳(メタデータ) (2023-05-30T14:51:58Z) - Interacting Hand-Object Pose Estimation via Dense Mutual Attention [97.26400229871888]
3Dハンドオブジェクトのポーズ推定は多くのコンピュータビジョンアプリケーションの成功の鍵となる。
本研究では,手と物体間の微粒な依存関係をモデル化できる新しい相互注意機構を提案する。
提案手法は,高品質かつリアルタイムな推論速度で,物理的に妥当なポーズを生成できる。
論文 参考訳(メタデータ) (2022-11-16T10:01:33Z) - ALADIN: Distilling Fine-grained Alignment Scores for Efficient
Image-Text Matching and Retrieval [51.588385824875886]
クロスモーダル検索は、与えられたクエリテキストまたはバイヴァーサに関連する画像を見つけることで構成される。
近年の多くの手法が画像テキストマッチング問題に対する効果的な解法を提案しており、主に近年の大規模視覚言語(VL)トランスフォーマーネットワークを用いている。
本稿では,有効性と効率のギャップを埋めるため,ALADIN(ALign And Distill Network)を提案する。
論文 参考訳(メタデータ) (2022-07-29T16:01:48Z) - Geometric Synthesis: A Free lunch for Large-scale Palmprint Recognition
Model Pretraining [27.81138870690135]
パラメータ化されたB'ezier曲線を持つパーマークリーゼを表す直観的幾何学モデルを導入する。
B'ezierパラメータをランダムにサンプリングすることで、多様なアイデンティティの大規模なトレーニングサンプルを合成できる。
実験結果から, 合成事前学習モデルは非常に強力な一般化能力を有することが示された。
論文 参考訳(メタデータ) (2022-03-11T01:20:22Z) - Learning Co-segmentation by Segment Swapping for Retrieval and Discovery [67.6609943904996]
この研究の目的は、一対のイメージから視覚的に類似したパターンを効率的に識別することである。
画像中のオブジェクトセグメントを選択し、それを別の画像にコピーペーストすることで、合成トレーニングペアを生成する。
提案手法は,Brueghelデータセット上でのアートワークの詳細検索に対して,明確な改善をもたらすことを示す。
論文 参考訳(メタデータ) (2021-10-29T16:51:16Z) - Understanding Egocentric Hand-Object Interactions from Hand Pose
Estimation [24.68535915849555]
本稿では,エゴセントリックな画像を含むデータセットをペアワイズにラベル付けする手法を提案する。
また、収集したペアワイズデータを用いて、効率的なエンコーダ-デコーダスタイルのネットワークをトレーニングします。
論文 参考訳(メタデータ) (2021-09-29T18:34:06Z) - Revisiting Point Cloud Shape Classification with a Simple and Effective
Baseline [111.3236030935478]
評価手法の違い,データ拡張戦略,損失関数などの補助的要因が,性能に大きな違いをもたらすことがわかった。
SimpleViewと呼ばれるプロジェクションベースのメソッドは驚くほどうまく機能します。
ポイントネット++の半分のサイズでありながら、ModelNet40の洗練された最先端メソッドよりも同等かそれ以上の結果が得られる。
論文 参考訳(メタデータ) (2021-06-09T18:01:11Z) - Group-Wise Semantic Mining for Weakly Supervised Semantic Segmentation [49.90178055521207]
この研究は、画像レベルのアノテーションとピクセルレベルのセグメンテーションのギャップを埋めることを目標に、弱い監督されたセマンティックセグメンテーション(WSSS)に対処する。
画像群における意味的依存関係を明示的にモデル化し,より信頼性の高い擬似的基盤構造を推定する,新たなグループ学習タスクとしてWSSSを定式化する。
特に、入力画像がグラフノードとして表現されるグループ単位のセマンティックマイニングのためのグラフニューラルネットワーク(GNN)を考案する。
論文 参考訳(メタデータ) (2020-12-09T12:40:13Z) - MVHM: A Large-Scale Multi-View Hand Mesh Benchmark for Accurate 3D Hand
Pose Estimation [32.12879364117658]
1枚のRGB画像から3Dハンドポーズを推定することは困難である。
我々は、任意のターゲットメッシュ基底真理に一致する剛性メッシュモデルを可能にするスピンマッチングアルゴリズムを設計する。
提案手法は,提案するデータセットを用いて手ポーズ推定器の訓練が性能を大幅に向上させることを示す。
論文 参考訳(メタデータ) (2020-12-06T07:55:08Z) - Palm-GAN: Generating Realistic Palmprint Images Using Total-Variation
Regularized GAN [7.119324327867636]
本稿では,現実的なヤシプリント画像を生成することができるGAN(Generative Adversarial Network)に基づくディープラーニングフレームワークを提案する。
このフレームワークを一般的なパームプリントデータベースに適用し、非常にリアルに見え、このデータベースのサンプルとよく似た画像を生成する。
論文 参考訳(メタデータ) (2020-03-21T03:24:36Z) - Image Matching across Wide Baselines: From Paper to Practice [80.9424750998559]
局所的な特徴とロバストな推定アルゴリズムの包括的なベンチマークを導入する。
パイプラインのモジュール構造は、さまざまなメソッドの容易な統合、構成、組み合わせを可能にします。
適切な設定で、古典的な解決策は依然として芸術の知覚された状態を上回る可能性があることを示す。
論文 参考訳(メタデータ) (2020-03-03T15:20:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。