論文の概要: Using Shape to Categorize: Low-Shot Learning with an Explicit Shape Bias
- arxiv url: http://arxiv.org/abs/2101.07296v1
- Date: Mon, 18 Jan 2021 19:29:41 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-27 06:03:57.446620
- Title: Using Shape to Categorize: Low-Shot Learning with an Explicit Shape Bias
- Title(参考訳): shape to categorize: 明示的な形状バイアスによる低ショット学習
- Authors: Stefan Stojanov, Anh Thai, James M. Rehg
- Abstract要約: 低ショット学習手法の一般化性能向上のために,3次元形状の推論をいかに活用できるかを検討する。
3Dオブジェクト形状を用いた識別埋め込み空間の学習により,既存の低ショット学習手法を改善する新しい方法を提案する。
また、低ショット学習もサポートできる最大数のオブジェクトカテゴリを持つ新しい3DオブジェクトデータセットであるToys4Kも開発しています。
- 参考スコア(独自算出の注目度): 22.863686803150625
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: It is widely accepted that reasoning about object shape is important for
object recognition. However, the most powerful object recognition methods today
do not explicitly make use of object shape during learning. In this work,
motivated by recent developments in low-shot learning, findings in
developmental psychology, and the increased use of synthetic data in computer
vision research, we investigate how reasoning about 3D shape can be used to
improve low-shot learning methods' generalization performance. We propose a new
way to improve existing low-shot learning approaches by learning a
discriminative embedding space using 3D object shape, and utilizing this
embedding by learning how to map images into it. Our new approach improves the
performance of image-only low-shot learning approaches on multiple datasets. We
also develop Toys4K, a new 3D object dataset with the biggest number of object
categories that can also support low-shot learning.
- Abstract(参考訳): 物体形状の推論が物体認識にとって重要であることは広く受け入れられている。
しかし、今日の最も強力なオブジェクト認識手法は、学習中に明示的にオブジェクト形状を使用しない。
本研究では,低ショット学習の最近の発展,発達心理学の知見,コンピュータビジョン研究における合成データの利用の増加に動機づけられ,低ショット学習法の一般化性能向上に3次元形状の推論がいかに役立つかを検討する。
本研究では, 3次元物体形状を用いた判別埋め込み空間を学習し, 画像のマッピング法を学習することにより, 既存の低ショット学習手法を改善する新しい手法を提案する。
新しいアプローチは、複数のデータセットにおける画像のみの低ショット学習アプローチのパフォーマンスを向上させる。
また、最も多くのオブジェクトカテゴリを持つ新しい3dオブジェクトデータセットであるtoys4kも開発しています。
関連論文リスト
- 3D-Augmented Contrastive Knowledge Distillation for Image-based Object
Pose Estimation [4.415086501328683]
トレーニングプロセスでは3D形状が活用され、テストは依然として純粋に画像ベースである。
マルチモーダルモデルから画像ベースモデルへ3次元拡張画像表現を効果的に転送する新しいコントラスト型知識蒸留フレームワークを提案する。
我々は,既存のカテゴリに依存しない画像ベース手法と比較して,最先端の成果を大きなマージンで報告した。
論文 参考訳(メタデータ) (2022-06-02T16:46:18Z) - End-to-End Learning of Multi-category 3D Pose and Shape Estimation [128.881857704338]
本稿では,画像から2次元キーポイントを同時に検出し,それらを3次元に引き上げるエンド・ツー・エンド手法を提案する。
提案手法は2次元キーポイントアノテーションからのみ2次元検出と3次元リフトを学習する。
画像から3D学習へのエンドツーエンド化に加えて,1つのニューラルネットワークを用いて複数のカテゴリからのオブジェクトも処理する。
論文 参考訳(メタデータ) (2021-12-19T17:10:40Z) - RandomRooms: Unsupervised Pre-training from Synthetic Shapes and
Randomized Layouts for 3D Object Detection [138.2892824662943]
有望な解決策は、CADオブジェクトモデルで構成される合成データセットをよりよく利用して、実際のデータセットでの学習を促進することである。
最近の3次元事前学習の研究は、合成物体から他の実世界の応用へ学習した伝達特性が失敗することを示している。
本研究では,この目的を達成するためにRandomRoomsという新しい手法を提案する。
論文 参考訳(メタデータ) (2021-08-17T17:56:12Z) - Learning without Forgetting for 3D Point Cloud Objects [7.761414660999872]
新しいクラスに対して、よく訓練されたディープラーニングモデルを微調整すると、ネットワークは新しい概念を学ぶが、古いトレーニングの知識を徐々に忘れていく。
本研究では,3次元データに対する知識蒸留技術について検討し,前回のトレーニングの破滅的な忘れ込みを減らすことを目的とした。
学習中に古い知識と新しい知識の相互関係を調べることは、古い知識を忘れずに新しい概念を学ぶのに役立つ。
論文 参考訳(メタデータ) (2021-06-27T16:39:39Z) - Neural Articulated Radiance Field [90.91714894044253]
本稿では,画像から学習した明瞭な物体に対する新しい変形可能な3次元表現であるニューラルArticulated Radiance Field(NARF)を提案する。
実験の結果,提案手法は効率的であり,新しいポーズにうまく一般化できることがわかった。
論文 参考訳(メタデータ) (2021-04-07T13:23:14Z) - Unsupervised Learning of 3D Object Categories from Videos in the Wild [75.09720013151247]
オブジェクトインスタンスの大規模なコレクションの複数のビューからモデルを学ぶことに重点を置いています。
再構成を大幅に改善するワープコンディショニングレイ埋め込み(WCR)と呼ばれる新しいニューラルネットワーク設計を提案する。
本評価は,既存のベンチマークを用いた複数の深部単眼再構成ベースラインに対する性能改善を示す。
論文 参考訳(メタデータ) (2021-03-30T17:57:01Z) - Secrets of 3D Implicit Object Shape Reconstruction in the Wild [92.5554695397653]
コンピュータビジョン、ロボティクス、グラフィックスの様々な用途において、高精細な3Dオブジェクトをスパースから再構築することは重要です。
最近の神経暗黙的モデリング法は、合成データセットまたは高密度データセットで有望な結果を示す。
しかし、粗末でノイズの多い実世界のデータではパフォーマンスが悪い。
本論文では, 一般的な神経暗黙モデルの性能低下の根本原因を解析する。
論文 参考訳(メタデータ) (2021-01-18T03:24:48Z) - PointContrast: Unsupervised Pre-training for 3D Point Cloud
Understanding [107.02479689909164]
本研究では,3次元表現学習の研究を支援することを目的とする。
教師なし事前学習が3Dシーンの大規模なソースセットに与える影響を計測する。
論文 参考訳(メタデータ) (2020-07-21T17:59:22Z) - Info3D: Representation Learning on 3D Objects using Mutual Information
Maximization and Contrastive Learning [8.448611728105513]
本稿では,3次元形状に関するInfoMaxと対照的な学習原理を拡張することを提案する。
我々は3Dオブジェクトとその「チャンク」間の相互情報を最大化して、整列したデータセットにおける表現を改善することができることを示す。
論文 参考訳(メタデータ) (2020-06-04T00:30:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。