論文の概要: Denoise and Contrast for Category Agnostic Shape Completion
- arxiv url: http://arxiv.org/abs/2103.16671v1
- Date: Tue, 30 Mar 2021 20:33:24 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-01 14:37:13.844424
- Title: Denoise and Contrast for Category Agnostic Shape Completion
- Title(参考訳): カテゴリー非依存型形状補完のデノイズとコントラスト
- Authors: Antonio Alliegro, Diego Valsesia, Giulia Fracastoro, Enrico Magli,
Tatiana Tommasi
- Abstract要約: 本稿では,自己スーパービジョンのパワーを利用して3dポイントのクラウド補完を行うディープラーニングモデルを提案する。
Denoising Pretextタスクは、高レベルのセマンティクスから切り離された、必要なローカルキューをネットワークに提供する。
コントラスト学習は、異なる欠落部分を持つ同じ形状の変種間の一致を最大化する。
- 参考スコア(独自算出の注目度): 48.66519783934386
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we present a deep learning model that exploits the power of
self-supervision to perform 3D point cloud completion, estimating the missing
part and a context region around it. Local and global information are encoded
in a combined embedding. A denoising pretext task provides the network with the
needed local cues, decoupled from the high-level semantics and naturally shared
over multiple classes. On the other hand, contrastive learning maximizes the
agreement between variants of the same shape with different missing portions,
thus producing a representation which captures the global appearance of the
shape. The combined embedding inherits category-agnostic properties from the
chosen pretext tasks. Differently from existing approaches, this allows to
better generalize the completion properties to new categories unseen at
training time. Moreover, while decoding the obtained joint representation, we
better blend the reconstructed missing part with the partial shape by paying
attention to its known surrounding region and reconstructing this frame as
auxiliary objective. Our extensive experiments and detailed ablation on the
ShapeNet dataset show the effectiveness of each part of the method with new
state of the art results. Our quantitative and qualitative analysis confirms
how our approach is able to work on novel categories without relying neither on
classification and shape symmetry priors, nor on adversarial training
procedures.
- Abstract(参考訳): 本稿では,自己スーパービジョンのパワーを生かして3dポイントのクラウド補完を行い,不足部分と周囲のコンテキスト領域を推定する深層学習モデルを提案する。
ローカルおよびグローバル情報は、複合埋め込みにエンコードされる。
denoising pretextタスクは、ネットワークに必要なローカルなヒントを提供し、高レベルのセマンティクスから分離し、複数のクラスで自然に共有する。
一方、対照的な学習は、異なる欠落部分を持つ同一形状の変種間の一致を最大化することにより、その形状のグローバルな外観を捉えた表現を生成する。
複合埋め込みは、選択されたプリテキストタスクからカテゴリに依存しないプロパティを継承する。
既存のアプローチと異なり、これはトレーニング時に見つからない新しいカテゴリに完了プロパティをより一般化することを可能にする。
さらに, 得られた結合表現を復号化しながら, 既知領域に注意を払い, このフレームを補助目的として再構築することにより, 再構成した欠落部分を部分的な形状にブレンドする。
シェープネットデータセットの広範囲な実験と詳細なアブレーションにより,新たな技術結果が得られた場合,各部分の有効性を示す。
定量的・定性的分析により, 分類や形状対称性の優先順位や, 敵対的訓練手順に頼らずに, 新たなカテゴリーにどのように取り組むことができるかを確認した。
関連論文リスト
- Unsupervised Non-Rigid Point Cloud Matching through Large Vision Models [1.3030624795284795]
非剛点クラウドマッチングのための学習ベースのフレームワークを提案する。
重要な洞察は、大きな視覚モデル(LVM)から派生した意味的特徴を統合することである。
本フレームワークは,局所的な地形間の自己相似性から生じるあいまいさに対処するために,意味的特徴に含まれる構造情報を効果的に活用する。
論文 参考訳(メタデータ) (2024-08-16T07:02:19Z) - Understanding Imbalanced Semantic Segmentation Through Neural Collapse [81.89121711426951]
セマンティックセグメンテーションは自然に文脈的相関とクラス間の不均衡分布をもたらすことを示す。
機能中心にレギュレータを導入し、ネットワークが魅力ある構造に近い機能を学ぶことを奨励する。
我々の手法は、ScanNet200テストリーダーボードで1位にランクインし、新しい記録を樹立する。
論文 参考訳(メタデータ) (2023-01-03T13:51:51Z) - Global and Local Features through Gaussian Mixture Models on Image
Semantic Segmentation [0.38073142980732994]
本稿では,前者をサポートするグローバル表現を抽出しながら特徴表現の内部構造を提案する。
トレーニング中、データからガウス混合モデルを予測し、スキップ接続と復号ステージにマージすることで、誤った帰納バイアスを回避する。
この結果から,クラスタリングの動作を学習表現(言語とローカル)と組み合わせることで,セマンティックセマンティックセマンティクスを向上できることが示唆された。
論文 参考訳(メタデータ) (2022-07-19T10:10:49Z) - Bending Graphs: Hierarchical Shape Matching using Gated Optimal
Transport [80.64516377977183]
形状マッチングは、コンピュータグラフィックスと視覚のコミュニティにとって長い間研究されてきた問題である。
局所的なパッチレベル情報とグローバルな形状レベルの構造を組み込んだ階層型学習設計について検討する。
本研究では,非信頼ノード上の特徴を逐次更新し,形状間の一貫した一致を学習することで,新しい最適輸送解法を提案する。
論文 参考訳(メタデータ) (2022-02-03T11:41:46Z) - Point Discriminative Learning for Unsupervised Representation Learning
on 3D Point Clouds [54.31515001741987]
3次元点雲上での教師なし表現学習のための点識別学習法を提案する。
我々は、中間レベルとグローバルレベルの特徴に新しい点識別損失を課すことにより、これを達成した。
提案手法は強力な表現を学習し,新しい最先端性能を実現する。
論文 参考訳(メタデータ) (2021-08-04T15:11:48Z) - Learning to Segment Human Body Parts with Synthetically Trained Deep
Convolutional Networks [58.0240970093372]
本稿では,合成データのみを用いて学習した深部畳み込みニューラルネットワークに基づく人体部分分割のための新しい枠組みを提案する。
提案手法は,人体部品の実際の注釈付きデータを用いてモデルを訓練することなく,最先端の結果が得られる。
論文 参考訳(メタデータ) (2021-02-02T12:26:50Z) - Adaptive Prototypical Networks with Label Words and Joint Representation
Learning for Few-Shot Relation Classification [17.237331828747006]
本研究は,少ショット関係分類(FSRC)に焦点を当てる。
クラスプロトタイプの表現にラベル単語を追加するための適応的混合機構を提案する。
FewRelでは、異なる数ショット(FS)設定で実験が行われた。
論文 参考訳(メタデータ) (2021-01-10T11:25:42Z) - Commonality-Parsing Network across Shape and Appearance for Partially
Supervised Instance Segmentation [71.59275788106622]
そこで本稿では,マスク付分類から新しい分類へ一般化可能な,クラス非依存の共通性について考察する。
本モデルでは,COCOデータセット上のサンプルセグメンテーションにおける部分教師付き設定と少数ショット設定の両方において,最先端の手法を著しく上回っている。
論文 参考訳(メタデータ) (2020-07-24T07:23:44Z) - Focus on Semantic Consistency for Cross-domain Crowd Understanding [34.560447389853614]
いくつかのドメイン適応アルゴリズムは、合成データでモデルをトレーニングすることでそれを解放しようとする。
その結果,背景領域における推定誤差が既存手法の性能を阻害していることが判明した。
本稿では,ドメイン適応手法を提案する。
論文 参考訳(メタデータ) (2020-02-20T08:51:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。