論文の概要: MMGSD: Multi-Modal Gaussian Shape Descriptors for Correspondence
Matching in 1D and 2D Deformable Objects
- arxiv url: http://arxiv.org/abs/2010.04339v1
- Date: Fri, 9 Oct 2020 03:11:13 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-09 06:17:34.355283
- Title: MMGSD: Multi-Modal Gaussian Shape Descriptors for Correspondence
Matching in 1D and 2D Deformable Objects
- Title(参考訳): MMGSD:1次元および2次元変形可能な物体の対応マッチングのための多モードガウス形状記述子
- Authors: Aditya Ganapathi, Priya Sundaresan, Brijen Thananjeyan, Ashwin
Balakrishna, Daniel Seita, Ryan Hoque, Joseph E. Gonzalez, Ken Goldberg
- Abstract要約: MMGSD(Multi-Modal Gaussian Shape Descriptor)と呼ばれる変形可能な物体の視覚表現を提案する。
MMGSDは、合成データから自己指導的に学習され、測定可能な不確実性を伴う対応型ヒートマップを生成する。
実験の結果、MMGSDは正方形の布と編んだナイロンロープに対して32.4と31.3のRMSEを達成できることがわかった。
- 参考スコア(独自算出の注目度): 34.69048038821995
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We explore learning pixelwise correspondences between images of deformable
objects in different configurations. Traditional correspondence matching
approaches such as SIFT, SURF, and ORB can fail to provide sufficient
contextual information for fine-grained manipulation. We propose Multi-Modal
Gaussian Shape Descriptor (MMGSD), a new visual representation of deformable
objects which extends ideas from dense object descriptors to predict all
symmetric correspondences between different object configurations. MMGSD is
learned in a self-supervised manner from synthetic data and produces
correspondence heatmaps with measurable uncertainty. In simulation, experiments
suggest that MMGSD can achieve an RMSE of 32.4 and 31.3 for square cloth and
braided synthetic nylon rope respectively. The results demonstrate an average
of 47.7% improvement over a provided baseline based on contrastive learning,
symmetric pixel-wise contrastive loss (SPCL), as opposed to MMGSD which
enforces distributional continuity.
- Abstract(参考訳): 変形可能な物体の画像間の画素対応を異なる構成で学習する。
SIFT、SURF、ORBといった従来の対応マッチング手法は、きめ細かい操作に十分なコンテキスト情報を提供できない。
我々は,多モードガウス形状記述子 (MMGSD) を提案する。これは,高密度オブジェクト記述子からのアイデアを拡張し,異なるオブジェクト構成間のすべての対称対応を予測する,変形可能なオブジェクトの視覚表現である。
MMGSDは、合成データから自己指導的に学習され、測定可能な不確実性を伴う対応型ヒートマップを生成する。
シミュレーションでは、MMGSDは正方形の布と編んだ合成ナイロンロープに対して32.4と31.3のRMSEを達成できることが示されている。
その結果, 分布連続性を強制するMMGSDとは対照的に, コントラスト学習, 対称画素ワイドコントラスト損失(SPCL)に基づくベースラインに対する平均47.7%の改善が示された。
関連論文リスト
- LGU-SLAM: Learnable Gaussian Uncertainty Matching with Deformable Correlation Sampling for Deep Visual SLAM [11.715999663401591]
学習可能な2次元ガウス不確実性モデルは、マッチングフレームペアを関連付けるように設計されている。
マルチスケールの変形可能な相関戦略を考案し、各方向のサンプリングを適応的に微調整する。
本手法の有効性と優位性を検証するために,実世界のデータセットと合成データセットの実験を行った。
論文 参考訳(メタデータ) (2024-10-30T17:20:08Z) - RGM: A Robust Generalizable Matching Model [49.60975442871967]
RGM(Robust Generalist Matching)と呼ばれる疎密マッチングのための深部モデルを提案する。
合成トレーニングサンプルと実世界のシナリオのギャップを狭めるために、我々は、疎対応基盤真理を持つ新しい大規模データセットを構築した。
さまざまな密集したスパースなデータセットを混ぜ合わせることができ、トレーニングの多様性を大幅に改善しています。
論文 参考訳(メタデータ) (2023-10-18T07:30:08Z) - SIGMA: Scale-Invariant Global Sparse Shape Matching [50.385414715675076]
非剛体形状の正確なスパース対応を生成するための新しい混合整数プログラミング(MIP)法を提案する。
いくつかの挑戦的な3Dデータセットに対して,スパースな非剛性マッチングの最先端結果を示す。
論文 参考訳(メタデータ) (2023-08-16T14:25:30Z) - The Generalization Error of Stochastic Mirror Descent on
Over-Parametrized Linear Models [37.6314945221565]
ディープネットワークは、目に見えないデータにうまく一般化することが知られている。
正規化特性は「良い」性質を持つ補間解が見つかることを保証している。
理論を検証し、2つのデータモデルを導入するシミュレーション結果を提案する。
論文 参考訳(メタデータ) (2023-02-18T22:23:42Z) - DeepMLE: A Robust Deep Maximum Likelihood Estimator for Two-view
Structure from Motion [9.294501649791016]
動きからの2次元構造(SfM)は3次元再構成と視覚SLAM(vSLAM)の基礎となる。
本稿では,2視点SfM問題を最大最大推定(MLE)として定式化し,DeepMLEと表記されるフレームワークを用いて解いた。
提案手法は,最先端の2ビューSfM手法よりも精度と一般化能力において優れる。
論文 参考訳(メタデータ) (2022-10-11T15:07:25Z) - Unsupervised Learning Discriminative MIG Detectors in Nonhomogeneous
Clutter [0.8984888893275712]
主成分分析(PCA)は、高次元データをデータ分散を最大化する低次元空間にマッピングする。
PCAの原理にインスパイアされた新しいタイプの学習識別行列情報幾何(MIG)検出器を開発した。
3つの差別的なMIG検出器が、異なる幾何学的測度に関して説明されている。
論文 参考訳(メタデータ) (2022-04-24T13:50:05Z) - A new perspective on probabilistic image modeling [92.89846887298852]
本稿では,密度推定,サンプリング,トラクタブル推論が可能な画像モデリングのための新しい確率論的手法を提案する。
DCGMMは、CNNのように、ランダムな初期条件からSGDによってエンドツーエンドに訓練することができる。
本研究は,近年のPCおよびSPNモデルと,推論,分類,サンプリングの観点から比較した。
論文 参考訳(メタデータ) (2022-03-21T14:53:57Z) - A Model for Multi-View Residual Covariances based on Perspective
Deformation [88.21738020902411]
マルチビューSfM, オードメトリ, SLAMセットアップにおける視覚的残差の共分散モデルの導出を行う。
我々は、合成データと実データを用いてモデルを検証し、それを光度および特徴量に基づくバンドル調整に統合する。
論文 参考訳(メタデータ) (2022-02-01T21:21:56Z) - Similarity-Aware Fusion Network for 3D Semantic Segmentation [87.51314162700315]
本研究では,3次元セマンティックセグメンテーションのための2次元画像と3次元点雲を適応的に融合する類似性認識融合ネットワーク(SAFNet)を提案する。
我々は、入力とバックプロジェクションされた(2Dピクセルから)点雲の間の幾何学的および文脈的類似性を初めて学習する、後期融合戦略を採用している。
SAFNetは、様々なデータ完全性にまたがって、既存の最先端の核融合ベースのアプローチを著しく上回っている。
論文 参考訳(メタデータ) (2021-07-04T09:28:18Z) - Shape Estimation for Elongated Deformable Object using B-spline Chained
Multiple Random Matrices Model [5.94069939063928]
伸縮変形可能な物体の幾何学的特性をモデル化するために, B-スプライン鎖型多元ランダム行列表現を提案する。
予測最大化(EM)法は、伸長変形可能な物体の形状を推定するために導出される。
提案アルゴリズムは, シナリオ内での伸長変形可能な物体の形状推定に有用である。
論文 参考訳(メタデータ) (2020-04-10T21:15:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。