論文の概要: ProAlignNet : Unsupervised Learning for Progressively Aligning Noisy
Contours
- arxiv url: http://arxiv.org/abs/2005.11546v1
- Date: Sat, 23 May 2020 14:56:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2022-11-30 03:17:28.832303
- Title: ProAlignNet : Unsupervised Learning for Progressively Aligning Noisy
Contours
- Title(参考訳): ProAlignNet : 雑音の進行的調整のための教師なし学習
- Authors: VSR Veeravasarapu, Abhishek Goel, Deepak Mittal, Maneesh Singh
- Abstract要約: ProAlignNetは、輪郭形状間の大規模なミスアライメントと複雑な変換を説明できる。
近接感度および局所形状依存類似度測定値の上界から導出される新しい損失関数を用いて学習する。
実世界の2つの応用において、提案したモデルは最先端の手法よりも一貫して優れている。
- 参考スコア(独自算出の注目度): 12.791313859673187
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Contour shape alignment is a fundamental but challenging problem in computer
vision, especially when the observations are partial, noisy, and largely
misaligned. Recent ConvNet-based architectures that were proposed to align
image structures tend to fail with contour representation of shapes, mostly due
to the use of proximity-insensitive pixel-wise similarity measures as loss
functions in their training processes. This work presents a novel ConvNet,
"ProAlignNet" that accounts for large scale misalignments and complex
transformations between the contour shapes. It infers the warp parameters in a
multi-scale fashion with progressively increasing complex transformations over
increasing scales. It learns --without supervision-- to align contours,
agnostic to noise and missing parts, by training with a novel loss function
which is derived an upperbound of a proximity-sensitive and local
shape-dependent similarity metric that uses classical Morphological Chamfer
Distance Transform. We evaluate the reliability of these proposals on a
simulated MNIST noisy contours dataset via some basic sanity check experiments.
Next, we demonstrate the effectiveness of the proposed models in two real-world
applications of (i) aligning geo-parcel data to aerial image maps and (ii)
refining coarsely annotated segmentation labels. In both applications, the
proposed models consistently perform superior to state-of-the-art methods.
- Abstract(参考訳): 輪郭形状のアライメントはコンピュータビジョンにおける基本的な問題であるが、特に観察が部分的でノイズがあり、概ね不一致である場合、難しい問題である。
画像構造を整列させるために提案された最近のConvNetアーキテクチャは、主に、そのトレーニングプロセスにおける損失関数として近接不感な画素単位の類似度測定を使用するため、形状の輪郭表現に失敗する傾向にある。
本研究は,輪郭形状間の大規模不一致と複雑な変換を考慮し,新しいコンブネット「proalignnet」を提案する。
マルチスケールでワープパラメータを推論し、スケールの増大よりも複雑な変換が徐々に増加する。
古典的な形態的チャムファー距離変換を用いた近接感度および局所形状依存類似度測定値の上限から導出される新しい損失関数をトレーニングすることで、輪郭、ノイズ、欠落部分の整列を -- 教師無しで- 学習する。
これらの提案の信頼性を,いくつかの基本的な健全性チェック実験により評価した。
次に,実世界の2つの応用における提案モデルの有効性を実証する。
(i)地理データを航空画像マップに整列すること。
(ii)粗アノテートされたセグメンテーションラベルの精錬
どちらのアプリケーションでも、提案したモデルは最先端の手法よりも一貫して優れている。
関連論文リスト
- Brep2Shape: Boundary and Shape Representation Alignment via Self-Supervised Transformers [46.87466345672103]
境界表現(B-rep)はコンピュータ支援設計(CAD)の業界標準である
ディープラーニングはB-repモデルの処理において有望であるが、既存の手法は表現ギャップに悩まされている。
本稿では,抽象境界表現と直感的な形状表現との整合性を考慮した自己教師付き事前学習手法であるBrep2Shapeを紹介する。
論文 参考訳(メタデータ) (2026-02-07T08:00:47Z) - Non-Rigid Structure-from-Motion via Differential Geometry with Recoverable Conformal Scale [17.935227965480475]
共形変形下でのNRSfMに対するCon-NRSfMという新しい手法を提案する。
提案手法は,グラフベースのフレームワークにより最適化された2次元画像ワープを用いて,ポイントワイズ再構成を行う。
我々のフレームワークは、他のアプローチでは分離できない深さと等角スケールの制約を分離する。
論文 参考訳(メタデータ) (2025-10-02T04:46:46Z) - Matching Shapes Under Different Topologies: A Topology-Adaptive Deformation Guided Approach [6.851721795186258]
非厳密な3Dメッシュマッチングは、コンピュータビジョンとコンピュータグラフィックスパイプラインにおける重要なステップである。
トポロジカルアーティファクトを含むメッシュに取り組み、現在のアプローチによる仮定を破ることができる。
私たちは、しばしばトポロジカルなアーティファクトに悩まされる、フレームごとのマルチビュー再構築のような現実世界のシナリオに動機付けられています。
提案手法は, 従来のデータ駆動手法に頼らず, 3次元アライメント品質の大規模データセットでトレーニングした手法よりも, ノイズの多いフレーム単位のマルチビュー再構成を含む, トポロジカルアーチファクトの非等尺形状や形状に適用される。
論文 参考訳(メタデータ) (2025-09-08T16:29:44Z) - TCFNet: Bidirectional face-bone transformation via a Transformer-based coarse-to-fine point movement network [1.9981869613001535]
そこで我々は,Transformer を用いた粗い点移動ネットワーク (TCFNet) を提案する。
TCFNetは、優れた評価指標と視覚化結果を達成する。
論文 参考訳(メタデータ) (2025-08-20T03:02:16Z) - WiNet: Wavelet-based Incremental Learning for Efficient Medical Image Registration [68.25711405944239]
深部画像登録は異常な精度と高速な推測を示した。
近年の進歩は、粗大から粗大の方法で密度変形場を推定するために、複数のカスケードまたはピラミッドアーキテクチャを採用している。
本稿では,様々なスケールにわたる変位/速度場に対して,スケールワイブレット係数を漸進的に推定するモデル駆動WiNetを提案する。
論文 参考訳(メタデータ) (2024-07-18T11:51:01Z) - Mesh Denoising Transformer [104.5404564075393]
Mesh Denoisingは、入力メッシュからノイズを取り除き、特徴構造を保存することを目的としている。
SurfaceFormerはTransformerベースのメッシュDenoisingフレームワークのパイオニアだ。
局所曲面記述子(Local Surface Descriptor)として知られる新しい表現は、局所幾何学的複雑さをキャプチャする。
Denoising Transformerモジュールは、マルチモーダル情報を受信し、効率的なグローバル機能アグリゲーションを実現する。
論文 参考訳(メタデータ) (2024-05-10T15:27:43Z) - Deformation-Guided Unsupervised Non-Rigid Shape Matching [7.327850781641328]
非厳密な形状マッチングのための教師なしデータ駆動方式を提案する。
本手法は,3次元スキャナを用いたディジタル形状のマッチングにおいて特に堅牢である。
論文 参考訳(メタデータ) (2023-11-27T09:55:55Z) - Non-Rigid Shape Registration via Deep Functional Maps Prior [1.9249120068573227]
本研究では,非剛体形状登録のための学習ベースフレームワークを提案する。
我々は、高次元埋め込みによって誘導される対応によって誘導されるターゲットポイントクラウドに向かって、ソースメッシュを変形する。
我々のパイプラインは、厳密でないクラウドマッチングのいくつかのベンチマークで最先端の結果を達成する。
論文 参考訳(メタデータ) (2023-11-08T06:52:57Z) - Distance Weighted Trans Network for Image Completion [52.318730994423106]
本稿では,DWT(Distance-based Weighted Transformer)を利用した画像コンポーネント間の関係をよりよく理解するためのアーキテクチャを提案する。
CNNは、粗い事前の局所的なテクスチャ情報を強化するために使用される。
DWTブロックは、特定の粗いテクスチャやコヒーレントな視覚構造を復元するために使用される。
論文 参考訳(メタデータ) (2023-10-11T12:46:11Z) - Flattening-Net: Deep Regular 2D Representation for 3D Point Cloud
Analysis [66.49788145564004]
我々は、任意の幾何学と位相の不規則な3次元点雲を表現するために、Flattning-Netと呼ばれる教師なしのディープニューラルネットワークを提案する。
我々の手法は、現在の最先端の競合相手に対して好意的に機能する。
論文 参考訳(メタデータ) (2022-12-17T15:05:25Z) - Bending Graphs: Hierarchical Shape Matching using Gated Optimal
Transport [80.64516377977183]
形状マッチングは、コンピュータグラフィックスと視覚のコミュニティにとって長い間研究されてきた問題である。
局所的なパッチレベル情報とグローバルな形状レベルの構造を組み込んだ階層型学習設計について検討する。
本研究では,非信頼ノード上の特徴を逐次更新し,形状間の一貫した一致を学習することで,新しい最適輸送解法を提案する。
論文 参考訳(メタデータ) (2022-02-03T11:41:46Z) - Sign-Agnostic CONet: Learning Implicit Surface Reconstructions by
Sign-Agnostic Optimization of Convolutional Occupancy Networks [39.65056638604885]
畳み込み型ネットワークの符号非依存最適化により暗黙的表面再構成を学習する。
この目標をシンプルで効果的な設計で効果的に達成できることを示す。
論文 参考訳(メタデータ) (2021-05-08T03:35:32Z) - Learning Graph-Convolutional Representations for Point Cloud Denoising [31.557988478764997]
本稿では,学習ベースのポイントクラウド処理手法で発生する置換不変問題に対処可能なディープニューラルネットワークを提案する。
ネットワークは完全に畳み込み可能で、近傍グラフを動的に構築することで、機能の複雑な階層を構築することができる。
特に高騒音レベルと実LiDARスキャンで遭遇したような構造ノイズの存在の両方において堅牢である。
論文 参考訳(メタデータ) (2020-07-06T08:11:28Z) - Deep Semantic Matching with Foreground Detection and Cycle-Consistency [103.22976097225457]
深層ネットワークに基づく弱い教師付きセマンティックマッチングに対処する。
本研究では,背景乱れの影響を抑えるために,前景領域を明示的に推定する。
複数の画像にまたがって予測変換を強制し、幾何的に可視かつ一貫したサイクル一貫性の損失を発生させる。
論文 参考訳(メタデータ) (2020-03-31T22:38:09Z) - Multistage Model for Robust Face Alignment Using Deep Neural Networks [8.504539228134082]
空間変換器ネットワーク,時間ガラスネットワーク,および模範的形状制約を利用する多段階モデルを提案する。
提案手法の他の最先端手法よりも優れた性能を示す実験を行った。
論文 参考訳(メタデータ) (2020-02-04T01:13:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。