論文の概要: Unsupervised Discovery of 3D Physical Objects from Video
- arxiv url: http://arxiv.org/abs/2007.12348v3
- Date: Tue, 23 Mar 2021 02:03:08 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-07 06:14:20.152053
- Title: Unsupervised Discovery of 3D Physical Objects from Video
- Title(参考訳): 映像からの3次元物体の無監督発見
- Authors: Yilun Du, Kevin Smith, Tomer Ulman, Joshua Tenenbaum, Jiajun Wu
- Abstract要約: 物理,特に物体相互作用は,映像から3次元幾何学と物体の位置を教師なしで切り離すのにどのように役立つのかを考察する。
我々の物理オブジェクト発見ネットワーク(POD-Net)は、多スケールの画素キューと物理モーションキューの両方を使用して、様々な大きさの観測可能および部分的に隠蔽されたオブジェクトを正確に分割する。
- 参考スコア(独自算出の注目度): 15.939924306990548
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: We study the problem of unsupervised physical object discovery. While
existing frameworks aim to decompose scenes into 2D segments based off each
object's appearance, we explore how physics, especially object interactions,
facilitates disentangling of 3D geometry and position of objects from video, in
an unsupervised manner. Drawing inspiration from developmental psychology, our
Physical Object Discovery Network (POD-Net) uses both multi-scale pixel cues
and physical motion cues to accurately segment observable and partially
occluded objects of varying sizes, and infer properties of those objects. Our
model reliably segments objects on both synthetic and real scenes. The
discovered object properties can also be used to reason about physical events.
- Abstract(参考訳): 我々は、教師なし物体発見の問題を研究する。
既存のフレームワークは、各オブジェクトの外観に基づいてシーンを2dセグメントに分解することを目指しているが、物理学、特にオブジェクトインタラクションは、ビデオからの3d幾何学とオブジェクトの位置の分離を、教師なしの方法で促進する。
発達心理学からインスピレーションを得た私たちの物理オブジェクト発見ネットワーク(POD-Net)は、マルチスケールの画素キューと物理モーションキューの両方を使用して、様々なサイズの観測可能な、あるいは部分的に隠されたオブジェクトを正確に分割し、それらのオブジェクトの特性を推測する。
私たちのモデルは、合成シーンと実シーンの両方で確実にオブジェクトを分割します。
検出されたオブジェクトプロパティは、物理イベントの推論にも使用できる。
関連論文リスト
- Unsupervised Discovery of Object-Centric Neural Fields [21.223170092979498]
1つの画像から3次元オブジェクト中心のシーン表現を推定する。
我々は、対象中心神経場(uOCF)の教師なし発見を提案する。
論文 参考訳(メタデータ) (2024-02-12T02:16:59Z) - Seeing Objects in a Cluttered World: Computational Objectness from
Motion in Video [0.0]
物体が重なり合う物体と物理的に異なるものとして、世界の視覚的に不連続な表面を認識することは、視覚的知覚の基礎となる。
対象モデルを持たない現象学から客観性を推定するための,単純だが新しい手法を提案する。
ぼやけやカメラの震えがあっても、個々の被写体をぼやけたシーンでしっかりと認識できることを示す。
論文 参考訳(メタデータ) (2024-02-02T03:57:11Z) - Grounding 3D Object Affordance from 2D Interactions in Images [128.6316708679246]
接地した3Dオブジェクトは、3D空間内のオブジェクトの'アクション可能性'領域を見つけようとする。
人間は、実演画像やビデオを通じて、物理的世界の物体の余裕を知覚する能力を持っている。
我々は、異なるソースからのオブジェクトの領域的特徴を整合させる、インタラクション駆動の3D Affordance Grounding Network (IAG) を考案する。
論文 参考訳(メタデータ) (2023-03-18T15:37:35Z) - 3D Object Aided Self-Supervised Monocular Depth Estimation [5.579605877061333]
本研究では,モノクロ3次元物体検出による動的物体の動きに対処する新しい手法を提案する。
具体的には、まず画像中の3Dオブジェクトを検出し、検出されたオブジェクトのポーズと動的ピクセル間の対応性を構築する。
このようにして、各ピクセルの深さは有意義な幾何学モデルによって学習することができる。
論文 参考訳(メタデータ) (2022-12-04T08:52:33Z) - D3D-HOI: Dynamic 3D Human-Object Interactions from Videos [49.38319295373466]
本稿では,D3D-HOIについて紹介する。D3D-HOIは3次元オブジェクトのポーズ,形状,動きを,人間と物体の相互作用の時,地上の真理アノテーションを付加したモノクロビデオのデータセットである。
我々のデータセットは、様々な現実世界のシーンとカメラの視点から捉えた、いくつかの共通したオブジェクトで構成されている。
我々は、推定された3次元人間のポーズを利用して、物体の空間的レイアウトとダイナミクスをより正確に推定する。
論文 参考訳(メタデータ) (2021-08-19T00:49:01Z) - Object Wake-up: 3-D Object Reconstruction, Animation, and in-situ
Rendering from a Single Image [58.69732754597448]
椅子の写真があれば、椅子の3次元形状を抽出し、その可愛らしい調音や動きをアニメーション化し、元の画像空間でその場でレンダリングできるだろうか?
単一画像中の調音対象を抽出・操作するための自動アプローチを考案する。
論文 参考訳(メタデータ) (2021-08-05T16:20:12Z) - Discovering 3D Parts from Image Collections [98.16987919686709]
本稿では,2次元画像収集のみによる3次元部分発見の問題に対処する。
そこで我々は,手動で注釈付部品を監督する代わりに,自己監督型アプローチを提案する。
私たちのキーとなる洞察は、前もって新しい部分の形状を学習することで、各部分は、単純な幾何学を持つように制約されたまま、忠実にオブジェクトの形状に適合できるようにします。
論文 参考訳(メタデータ) (2021-07-28T20:29:16Z) - Object Properties Inferring from and Transfer for Human Interaction
Motions [51.896592493436984]
本稿では,人間のインタラクション動作のみからオブジェクト特性を推測する,きめ細かい動作認識手法を提案する。
我々は、慣性モーションキャプチャー装置を用いて、演奏者の多数のビデオと3D骨格の動きを収集する。
特に, 相互作用対象の重み, 脆弱性, デリカシーを推定することにより, 相互作用対象の同定を学習する。
論文 参考訳(メタデータ) (2020-08-20T14:36:34Z) - Occlusion resistant learning of intuitive physics from videos [52.25308231683798]
人工システムの鍵となる能力は、オブジェクト間の物理的相互作用を理解し、状況の将来的な結果を予測することである。
この能力は直感的な物理学と呼ばれ、近年注目されており、ビデオシーケンスからこれらの物理規則を学ぶためのいくつかの方法が提案されている。
論文 参考訳(メタデータ) (2020-04-30T19:35:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。