論文の概要: Structured Latent Variable Models for Articulated Object Interaction
- arxiv url: http://arxiv.org/abs/2305.16567v1
- Date: Fri, 26 May 2023 01:22:35 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-29 17:28:49.758595
- Title: Structured Latent Variable Models for Articulated Object Interaction
- Title(参考訳): 人工物体相互作用のための構造化潜在変数モデル
- Authors: Emily Liu, Michael Noseworthy, Nicholas Roy
- Abstract要約: 本研究では,ロボットがドアの開閉映像からドアの低次元表現を学習するシナリオについて検討する。
この表現は、ドア関連のパラメータを推測し、ドアとの相互作用の結果を予測するために使用することができる。
- 参考スコア(独自算出の注目度): 24.97457132614502
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we investigate a scenario in which a robot learns a
low-dimensional representation of a door given a video of the door opening or
closing. This representation can be used to infer door-related parameters and
predict the outcomes of interacting with the door. Current machine learning
based approaches in the doors domain are based primarily on labelled datasets.
However, the large quantity of available door data suggests the feasibility of
a semisupervised approach based on pretraining. To exploit the hierarchical
structure of the dataset where each door has multiple associated images, we
pretrain with a structured latent variable model known as a neural
statistician. The neural satsitician enforces separation between shared
context-level variables (common across all images associated with the same
door) and instance-level variables (unique to each individual image). We first
demonstrate that the neural statistician is able to learn an embedding that
enables reconstruction and sampling of realistic door images. Then, we evaluate
the correspondence of the learned embeddings to human-interpretable parameters
in a series of supervised inference tasks. It was found that a pretrained
neural statistician encoder outperformed analogous context-free baselines when
predicting door handedness, size, angle location, and configuration from door
images. Finally, in a visual bandit door-opening task with a variety of door
configuration, we found that neural statistician embeddings achieve lower
regret than context-free baselines.
- Abstract(参考訳): 本稿では,ロボットがドアの開閉の映像から,ドアの低次元表現を学習するシナリオについて検討する。
この表現はドア関連のパラメータを推論し、ドアとのインタラクションの結果を予測するのに使うことができる。
現在の機械学習ベースのドアドメインのアプローチは、主にラベル付きデータセットに基づいている。
しかし,利用可能なドアデータの量が多ければ多いほど,事前学習に基づく半教師付きアプローチの可能性も示唆される。
各ドアに複数の関連画像があるデータセットの階層構造を利用するため、ニューラルネットワーク統計学として知られる構造化潜在変数モデルで事前学習する。
ニューラルネットワークは、共有コンテキストレベルの変数(同じドアに関連付けられたすべての画像に共通する)とインスタンスレベルの変数(個々の画像に共通)の分離を強制する。
まず,神経統計学者が現実的なドアイメージの再構成とサンプリングを可能にする埋め込みを学習できることを実証する。
次に、一連の教師付き推論タスクにおいて、人間解釈可能なパラメータに対する学習埋め込みの対応を評価する。
その結果, 事前学習したニューラルネットワークエンコーダは, ドアハンドネス, サイズ, 角度位置, 構成の予測において, 類似の文脈自由ベースラインよりも優れていた。
最後に,様々なドア構成の視覚的バンディットドア開放作業において,ニューラルネットワークによる統計的埋め込みは,文脈のないベースラインよりも後悔度が低いことがわかった。
関連論文リスト
- Model Pairing Using Embedding Translation for Backdoor Attack Detection on Open-Set Classification Tasks [63.269788236474234]
バックドア検出のためのオープンセット分類タスクにモデルペアを用いることを提案する。
このスコアは、異なるアーキテクチャのモデルがあるにもかかわらず、バックドアの存在を示す指標であることを示している。
この技術は、オープンセット分類タスク用に設計されたモデル上のバックドアの検出を可能にするが、文献ではほとんど研究されていない。
論文 参考訳(メタデータ) (2024-02-28T21:29:16Z) - The Contextual Lasso: Sparse Linear Models via Deep Neural Networks [5.607237982617641]
本研究では,空間的特徴の関数として空間的パターンと係数が変化するような説明的特徴に疎線形モデルに適合する新しい統計的推定器を開発する。
実データと合成データに関する広範な実験は、学習されたモデルは、非常に透明であり、通常のラッソよりもスペーサーであることを示している。
論文 参考訳(メタデータ) (2023-02-02T05:00:29Z) - Unsupervised learning of features and object boundaries from local
prediction [0.0]
本稿では,各因子が追加のバイナリ変数とペアリングされ,その因子をオン/オフに切り替える,ペアワイズマルコフ確率場モデルによる特徴写像の層を導入する。
マルコフ確率場要素の特徴とパラメータの両方を、さらなる監視信号なしで画像から学習することができる。
宇宙空間での計算予測はセグメンテーションと特徴学習の両方に役立ち、これらの予測を最適化するために訓練されたモデルは人間の視覚システムと類似性を示す。
論文 参考訳(メタデータ) (2022-05-27T18:54:10Z) - Category-Independent Articulated Object Tracking with Factor Graphs [14.574389906480867]
アーティキュレートされた物体は、カテゴリー的先行と矛盾する予期せぬ調音機構を持つ。
RGB-D画像のシーケンスから未知物体の調音モデルを予測するためのカテゴリ非依存のフレームワークを提案する。
我々の視覚知覚と因子グラフモジュールは、シミュレーションデータに基づくベースラインよりも優れており、実世界のデータに対する因子グラフの適用性を示している。
論文 参考訳(メタデータ) (2022-05-07T20:59:44Z) - Data-driven emergence of convolutional structure in neural networks [83.4920717252233]
識別タスクを解くニューラルネットワークが、入力から直接畳み込み構造を学習できることを示す。
データモデルを慎重に設計することにより、このパターンの出現は、入力の非ガウス的、高次局所構造によって引き起こされることを示す。
論文 参考訳(メタデータ) (2022-02-01T17:11:13Z) - Scene Synthesis via Uncertainty-Driven Attribute Synchronization [52.31834816911887]
本稿では,3次元シーンの多様な特徴パターンを捉えるニューラルシーン合成手法を提案する。
提案手法は,ニューラルネットワークと従来のシーン合成手法の双方の長所を結合する。
論文 参考訳(メタデータ) (2021-08-30T19:45:07Z) - Constructing interval variables via faceted Rasch measurement and
multitask deep learning: a hate speech application [63.10266319378212]
本稿では,教師付き深層学習と多面的ラッシュアイテム応答理論(IRT)構築手法を組み合わせることで,連続区間スペクトル上の複素変数を測定する手法を提案する。
われわれは、YouTube、Twitter、Redditから5万件のソーシャルメディアコメントを収集し、1万1000人の米国拠点のAmazon Mechanical Turkの労働者によってラベル付けされたデータセット上で、この新しい手法を実証した。
論文 参考訳(メタデータ) (2020-09-22T02:15:05Z) - Visual Neural Decomposition to Explain Multivariate Data Sets [13.117139248511783]
多次元データセットにおける変数間の関係を調べることは、データアナリストとエンジニアにとって共通の課題である。
本稿では,入力変数と対象変数との相関関係を可視化する新しい手法を提案する。
論文 参考訳(メタデータ) (2020-09-11T15:53:37Z) - Connecting the Dots: Multivariate Time Series Forecasting with Graph
Neural Networks [91.65637773358347]
多変量時系列データに特化して設計された汎用グラフニューラルネットワークフレームワークを提案する。
グラフ学習モジュールを用いて,変数間の一方向関係を自動的に抽出する。
提案手法は,4つのベンチマークデータセットのうち3つにおいて,最先端のベースライン手法よりも優れている。
論文 参考訳(メタデータ) (2020-05-24T04:02:18Z) - Learning What Makes a Difference from Counterfactual Examples and
Gradient Supervision [57.14468881854616]
ニューラルネットワークの一般化能力を改善するための補助的学習目標を提案する。
我々は、異なるラベルを持つ最小差の例のペア、すなわち反ファクトまたはコントラストの例を使用し、タスクの根底にある因果構造を示す信号を与える。
このテクニックで訓練されたモデルは、配布外テストセットのパフォーマンスを向上させる。
論文 参考訳(メタデータ) (2020-04-20T02:47:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。