論文の概要: Binary Image Skeletonization Using 2-Stage U-Net
- arxiv url: http://arxiv.org/abs/2112.11824v1
- Date: Wed, 22 Dec 2021 11:58:42 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-23 15:33:57.458521
- Title: Binary Image Skeletonization Using 2-Stage U-Net
- Title(参考訳): 2段階U-Netを用いたバイナリ画像スケトン化
- Authors: Mohamed A. Ghanem, Alaa A. Anani
- Abstract要約: この課題に対するF1の代替として、正規化相関係数に基づく新しい計量 M-CCORR を提案する。
本稿では、有名なU-Netアーキテクチャの2段階版を用いて、問題空間を2つのサブプロブレム(形状最小化と補正スケルトン薄化)に分割する。
我々のモデルは、ベースラインのSkelNetOnモデルよりも視覚的にはるかに優れた結果を生成する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Object Skeletonization is the process of extracting skeletal, line-like
representations of shapes. It provides a very useful tool for geometric shape
understanding and minimal shape representation. It also has a wide variety of
applications, most notably in anatomical research and activity detection.
Several mathematical algorithmic approaches have been developed to solve this
problem, and some of them have been proven quite robust. However, a lesser
amount of attention has been invested into deep learning solutions for it. In
this paper, we use a 2-stage variant of the famous U-Net architecture to split
the problem space into two sub-problems: shape minimization and corrective
skeleton thinning. Our model produces results that are visually much better
than the baseline SkelNetOn model. We propose a new metric, M-CCORR, based on
normalized correlation coefficients as an alternative to F1 for this challenge
as it solves the problem of class imbalance, managing to recognize skeleton
similarity without suffering from F1's over-sensitivity to pixel-shifts.
- Abstract(参考訳): 物体骨格化(Object Skeletonization)は、形状の骨格的な線状の表現を抽出する過程である。
幾何学的形状理解と最小形状表現のための非常に有用なツールを提供する。
様々な応用があり、特に解剖学の研究や活動検出に使われている。
この問題を解決するために数種類の数学的アルゴリズムアプローチが開発され、その一部は非常に堅牢であることが証明されている。
しかし、ディープラーニングソリューションにはあまり注意が払われていない。
本稿では,有名なu-netアーキテクチャの2段階の変種を用いて,問題空間を形状最小化と補正骨格薄化という2つのサブプロブレムに分割する。
我々のモデルは、ベースラインSkelNetOnモデルよりも視覚的にはるかに優れた結果を生成する。
本稿では,F1の画素シフトに対する過敏性に悩まされることなく,骨格の類似性を把握し,クラス不均衡の問題を解決する上で,F1の代替となる正規化相関係数に基づく新しい計量M-CCORRを提案する。
関連論文リスト
- Message-Passing Monte Carlo: Generating low-discrepancy point sets via Graph Neural Networks [64.39488944424095]
本稿では,Message-Passing Monte Carlo という低差点集合を生成する機械学習手法を提案する。
MPMC点は、低次元と少数の点との差に関して、最適かほぼ最適であることが実証的に示されている。
論文 参考訳(メタデータ) (2024-05-23T21:17:20Z) - What to Do When Your Discrete Optimization Is the Size of a Neural
Network? [24.546550334179486]
ニューラルネットワークを用いた機械学習アプリケーションは、離散最適化問題を解くことを含む。
離散的な設定で使用される古典的なアプローチは、大きなニューラルネットワークに対してうまくスケールしない。
連続経路(CP)法は,前者およびモンテカルロ法(MC)法を純粋に表現し,後者を表現している。
論文 参考訳(メタデータ) (2024-02-15T21:57:43Z) - A skeletonization algorithm for gradient-based optimization [13.2737105544687]
デジタル画像の骨格は、そのトポロジー、幾何学、スケールのコンパクトな表現である。
ほとんどの既存のスケルトン化アルゴリズムは微分不可能であり、勾配に基づく最適化と統合することは不可能である。
この研究は、勾配に基づく最適化と互換性があり、物体の位相を保存する最初の3次元スケルトン化アルゴリズムを導入する。
論文 参考訳(メタデータ) (2023-09-05T18:40:14Z) - Cascaded multitask U-Net using topological loss for vessel segmentation
and centerline extraction [2.264332709661011]
本稿では,血管骨格をセグメント化から直接計算するU-Netによるソフトスケルトンアルゴリズムの置き換えを提案する。
セグメンテーション中にトポロジ的制約を埋め込むために、clDice損失をトレーニングしたカスケードU-Netをこのネットワーク上に構築する。
論文 参考訳(メタデータ) (2023-07-21T14:12:28Z) - Action Recognition with Domain Invariant Features of Skeleton Image [25.519217340328442]
そこで本研究では,行動認識のための対人訓練のための新しいCNNベースの手法を提案する。
異なる視角や対象からスケルトン画像の特徴を整列させるために,2段階のドメイン対角学習を導入する。
最先端の手法と比較して、競争力のある結果が得られる。
論文 参考訳(メタデータ) (2021-11-19T08:05:54Z) - Self-supervised Geometric Perception [96.89966337518854]
自己教師付き幾何知覚(self-supervised geometric perception)は、基底幾何モデルラベルなしで対応マッチングのための特徴記述子を学ぶためのフレームワークである。
また,SGPは,地上トラスラベルを用いて訓練した教師付きオークルよりも同等か優れる最先端性能を達成できることを示す。
論文 参考訳(メタデータ) (2021-03-04T15:34:43Z) - Spatio-Temporal Inception Graph Convolutional Networks for
Skeleton-Based Action Recognition [126.51241919472356]
我々はスケルトンに基づく行動認識のためのシンプルで高度にモジュール化されたグラフ畳み込みネットワークアーキテクチャを設計する。
ネットワークは,空間的および時間的経路から多粒度情報を集約するビルディングブロックを繰り返すことで構築される。
論文 参考訳(メタデータ) (2020-11-26T14:43:04Z) - Generalized Intersection Algorithms with Fixpoints for Image
Decomposition Learning [1.237556184089774]
我々は、幅広い(学習された)画像分解モデルを含む共通点問題の一般的なクラスを定式化する。
このクラスは、TV-l2-モデルやより一般的なTV-ヒルベルトモデルのような古典的なモデルに基づく変分問題を一般化する。
論文 参考訳(メタデータ) (2020-10-16T22:55:34Z) - SkeletonNet: A Topology-Preserving Solution for Learning Mesh
Reconstruction of Object Surfaces from RGB Images [85.66560542483286]
本稿では,RGB画像から3次元物体表面再構成を学習する上での課題に焦点を当てる。
我々は,SkeGCNNとSkeDISNの2つのモデルを提案する。
提案するSkeletonNetの有効性を検証するための徹底的な実験を行った。
論文 参考訳(メタデータ) (2020-08-13T07:59:25Z) - A Flexible Framework for Designing Trainable Priors with Adaptive
Smoothing and Game Encoding [57.1077544780653]
我々は、前方通過を非滑らかな凸最適化問題として解釈できるニューラルネットワーク層の設計とトレーニングのための一般的なフレームワークを紹介する。
グラフのノードに代表されるローカルエージェントによって解決され、正規化関数を介して相互作用する凸ゲームに焦点を当てる。
このアプローチは、訓練可能なエンドツーエンドのディープモデル内で、古典的な画像の事前使用を可能にするため、画像の問題を解決するために魅力的である。
論文 参考訳(メタデータ) (2020-06-26T08:34:54Z) - Dense Non-Rigid Structure from Motion: A Manifold Viewpoint [162.88686222340962]
Non-Rigid Structure-from-Motion (NRSfM) 問題は、複数のフレームにまたがる2次元特徴対応から変形物体の3次元形状を復元することを目的としている。
提案手法は,ノイズに対する精度,スケーラビリティ,堅牢性を大幅に向上させる。
論文 参考訳(メタデータ) (2020-06-15T09:15:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。