論文の概要: Semantic State Estimation in Cloth Manipulation Tasks
- arxiv url: http://arxiv.org/abs/2203.11647v1
- Date: Tue, 22 Mar 2022 11:59:52 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-23 21:15:00.022950
- Title: Semantic State Estimation in Cloth Manipulation Tasks
- Title(参考訳): 衣服操作作業における意味的状態推定
- Authors: Georgies Tzelepis, Eren Erdal Aksoy, J\'ulia Borr\`as, and Guillem
Aleny\`a
- Abstract要約: 本稿では,布地操作作業における意味状態推定の課題を解決することを目的とする。
本稿では,さまざまな複雑な布地操作の人為的な実演を示す,大規模フルアノテートRGB画像データセットを提案する。
ベースラインディープネットワークのセットを提供し、セマンティック状態推定の問題に基づいてそれらをベンチマークする。
- 参考スコア(独自算出の注目度): 0.4812321790984493
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Understanding of deformable object manipulations such as textiles is a
challenge due to the complexity and high dimensionality of the problem.
Particularly, the lack of a generic representation of semantic states (e.g.,
\textit{crumpled}, \textit{diagonally folded}) during a continuous manipulation
process introduces an obstacle to identify the manipulation type. In this
paper, we aim to solve the problem of semantic state estimation in cloth
manipulation tasks. For this purpose, we introduce a new large-scale
fully-annotated RGB image dataset showing various human demonstrations of
different complicated cloth manipulations. We provide a set of baseline deep
networks and benchmark them on the problem of semantic state estimation using
our proposed dataset. Furthermore, we investigate the scalability of our
semantic state estimation framework in robot monitoring tasks of long and
complex cloth manipulations.
- Abstract(参考訳): 織物などの変形可能な物体操作を理解することは、問題の複雑さと高次元のため課題である。
特に、連続的な操作プロセス中に意味状態の一般的な表現(例えば \textit{crumpled}, \textit{diagonally fold})がないことは、操作タイプを特定するための障害をもたらす。
本稿では,布地操作作業における意味状態推定の課題を解決することを目的とする。
そこで本研究では,さまざまな複雑な布地操作の人間の実演を実演する大規模フルアノテートRGB画像データセットを提案する。
我々は,ベースライン深層ネットワークのセットを提供し,提案するデータセットを用いた意味的状態推定の問題をベンチマークする。
さらに,長く複雑な布操作を行うロボット監視作業における意味状態推定フレームワークのスケーラビリティについて検討した。
関連論文リスト
- Towards Confidence-guided Shape Completion for Robotic Applications [6.940242990198]
深層学習は、部分的な視覚データから完全な3Dオブジェクト表現を推測する効果的な方法として牽引され始めている。
本稿では,各再構成点に対する信頼度を示す暗黙の3次元表現に基づくオブジェクト形状完備化手法を提案する。
再構成された形状と地上の真実を比較し,ロボットの把握パイプラインに形状完了アルゴリズムを配置することにより,我々のアプローチを実験的に検証する。
論文 参考訳(メタデータ) (2022-09-09T13:48:24Z) - MetaGraspNet: A Large-Scale Benchmark Dataset for Scene-Aware
Ambidextrous Bin Picking via Physics-based Metaverse Synthesis [72.85526892440251]
本稿では,物理に基づくメタバース合成により構築した大規模写真リアリスティックビンピックデータセットであるMetaGraspNetを紹介する。
提案データセットは,82種類の記事に対して217kのRGBD画像を含み,オブジェクト検出,アモーダル認識,キーポイント検出,操作順序,および並列ジャウと真空グリップパー用のアンビデクストグリップラベルの完全なアノテーションを備える。
また,2.3k以上の完全アノテートされた高品質なRGBD画像からなる実際のデータセットを5段階の難易度と,異なるオブジェクトおよびレイアウト特性を評価するための見えないオブジェクトセットに分割する。
論文 参考訳(メタデータ) (2022-08-08T08:15:34Z) - An End-to-End Approach for Seam Carving Detection using Deep Neural
Networks [0.0]
シーム・カービング(Seam Carving)は、画像形状ではなく、その内容に基づいて画像の縮小と拡大の両面を縮小する計算方法である。
本稿では,自動シーム彫刻検出の課題に対処するためのエンドツーエンドアプローチを提案する。
論文 参考訳(メタデータ) (2022-03-05T12:53:55Z) - Object-aware Monocular Depth Prediction with Instance Convolutions [72.98771405534937]
本稿では,特徴集合を避けるために明示的に調整された新しい畳み込み演算子を提案する。
提案手法は,部分ごとの深度をスーパーピクセルで推定する。
NYUv2とiBimsデータセットに対する我々の評価は、インスタンスの畳み込みの優位性を明確に示している。
論文 参考訳(メタデータ) (2021-12-02T18:59:48Z) - RICE: Refining Instance Masks in Cluttered Environments with Graph
Neural Networks [53.15260967235835]
本稿では,インスタンスマスクのグラフベース表現を利用して,そのような手法の出力を改良する新しいフレームワークを提案する。
我々は、セグメンテーションにスマートな摂動をサンプリングできるディープネットワークと、オブジェクト間の関係をエンコード可能なグラフニューラルネットワークを訓練し、セグメンテーションを評価する。
本稿では,本手法によって生成された不確実性推定を用いてマニピュレータを誘導し,乱れたシーンを効率的に理解するアプリケーションについて紹介する。
論文 参考訳(メタデータ) (2021-06-29T20:29:29Z) - Differentiable Multi-Granularity Human Representation Learning for
Instance-Aware Human Semantic Parsing [131.97475877877608]
カテゴリーレベルの人間のセマンティックセグメンテーションとマルチパーソンポーズ推定を共同およびエンドツーエンドで学習するために,新たなボトムアップ方式を提案する。
さまざまな人間の粒度にわたって構造情報を利用する、コンパクトで効率的で強力なフレームワークです。
3つのインスタンス認識型ヒューマンデータセットの実験は、我々のモデルがより効率的な推論で他のボトムアップの代替案よりも優れていることを示している。
論文 参考訳(メタデータ) (2021-03-08T06:55:00Z) - Video Anomaly Detection by Estimating Likelihood of Representations [21.879366166261228]
ビデオ異常は、モーション表現、オブジェクトのローカライゼーション、アクション認識など、多くのサブタスクを解決するため、困難なタスクである。
伝統的に、この課題に対する解決策は、これらの特徴の空間的接続を無視しながら、ビデオフレームとその低次元特徴のマッピングに焦点を当ててきた。
最近のソリューションでは、K-Meansのようなハードクラスタリング技術を用いてこれらの空間的接続を分析することや、潜伏した特徴を一般的な理解にマップするためにニューラルネットワークを適用することに焦点を当てている。
潜在特徴空間における映像異常を解決するために,このタスクを密度推定問題に転送するための深い確率モデルを提案する。
論文 参考訳(メタデータ) (2020-12-02T19:16:22Z) - Encoding cloth manipulations using a graph of states and transitions [8.778914180886835]
本稿では,布の操作状態の汎用的,コンパクトかつ簡易な表現を提案する。
タスクを達成するためのすべての戦略をエンコードするクラス操作グラフも定義しています。
論文 参考訳(メタデータ) (2020-09-30T13:56:13Z) - Adversarial Semantic Data Augmentation for Human Pose Estimation [96.75411357541438]
本研究では,セマンティックデータ拡張法 (SDA) を提案する。
また,適応的セマンティックデータ拡張 (ASDA) を提案する。
最先端の結果は、挑戦的なベンチマークで得られます。
論文 参考訳(メタデータ) (2020-08-03T07:56:04Z) - Efficient State Abstraction using Object-centered Predicates for
Manipulation Planning [86.24148040040885]
本稿では,より広い構成空間の変化を特徴付けるオブジェクト中心表現を提案する。
この表現に基づいて、幾何学的および力的整合性を持つ計画の生成を可能にする行動の選択と配置のための普遍的な計画演算子を定義する。
論文 参考訳(メタデータ) (2020-07-16T10:52:53Z) - Robust, Occlusion-aware Pose Estimation for Objects Grasped by Adaptive
Hands [16.343365158924183]
内部操作のような操作タスクは、ロボットハンドに対してオブジェクトのポーズを必要とする。
本稿では,頑健なポーズ推定と応答時間の短縮を目的とした奥行きに基づくフレームワークを提案する。
論文 参考訳(メタデータ) (2020-03-07T05:51:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。