論文の概要: Fashion Landmark Detection and Category Classification for Robotics
- arxiv url: http://arxiv.org/abs/2003.11827v1
- Date: Thu, 26 Mar 2020 10:53:26 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-19 21:04:07.946431
- Title: Fashion Landmark Detection and Category Classification for Robotics
- Title(参考訳): ロボティクスのためのファッションランドマーク検出とカテゴリー分類
- Authors: Thomas Ziegler, Judith Butepage, Michael C. Welle, Anastasiia Varava,
Tonci Novkovic and Danica Kragic
- Abstract要約: 我々は、大規模なファッションデータセットから、ロボットラボで収集されたあまり構造化されていない小さなデータセットまでを一般化できる技術に焦点を当てる。
提案手法は, これまでに見つからなかったデータセットを用いて, 衣服カテゴリー分類やファッションランドマーク検出において, 最先端技術モデルよりも優れていることを示す。
- 参考スコア(独自算出の注目度): 15.134184609780924
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Research on automated, image based identification of clothing categories and
fashion landmarks has recently gained significant interest due to its potential
impact on areas such as robotic clothing manipulation, automated clothes
sorting and recycling, and online shopping. Several public and annotated
fashion datasets have been created to facilitate research advances in this
direction. In this work, we make the first step towards leveraging the data and
techniques developed for fashion image analysis in vision-based robotic
clothing manipulation tasks. We focus on techniques that can generalize from
large-scale fashion datasets to less structured, small datasets collected in a
robotic lab. Specifically, we propose training data augmentation methods such
as elastic warping, and model adjustments such as rotation invariant
convolutions to make the model generalize better. Our experiments demonstrate
that our approach outperforms stateof-the art models with respect to clothing
category classification and fashion landmark detection when tested on
previously unseen datasets. Furthermore, we present experimental results on a
new dataset composed of images where a robot holds different garments,
collected in our lab.
- Abstract(参考訳): 衣料品カテゴリーやファッションランドマークの自動識別に関する研究は, ロボット衣料品の操作, 自動衣料品選別・リサイクル, オンラインショッピングといった分野への潜在的な影響から, 最近大きな関心を集めている。
この方向の研究を促進するために、いくつかの公開および注釈付きファッションデータセットが作成されている。
本研究では,視覚に基づくロボット服の操作作業において,ファッション画像解析のために開発されたデータと技術を活用するための第一歩を踏み出す。
我々は、大規模なファッションデータセットから、ロボットラボで収集されたあまり構造化されていない小さなデータセットまでを一般化できる技術に焦点を当てる。
具体的には、弾性ワープなどのトレーニングデータ拡張手法と回転不変の畳み込みなどのモデル調整を提案し、モデルをより一般化する。
提案手法は,従来未発見のデータセットでテストした服の分類やファッションランドマークの検出に関して,最先端の美術モデルよりも優れることを示す。
さらに,実験室で収集した異なる衣服をロボットが保持する画像からなる新しいデータセットについて実験を行った。
関連論文リスト
- SKT: Integrating State-Aware Keypoint Trajectories with Vision-Language Models for Robotic Garment Manipulation [82.61572106180705]
本稿では、視覚言語モデル(VLM)を用いて、様々な衣服カテゴリーにおけるキーポイント予測を改善する統一的なアプローチを提案する。
我々は、高度なシミュレーション技術を用いて大規模な合成データセットを作成し、大規模な実世界のデータを必要としないスケーラブルなトレーニングを可能にした。
実験結果から, VLM法はキーポイント検出精度とタスク成功率を大幅に向上させることが示された。
論文 参考訳(メタデータ) (2024-09-26T17:26:16Z) - UniFolding: Towards Sample-efficient, Scalable, and Generalizable
Robotic Garment Folding [53.38503172679482]
UniFoldingは、服の折り畳みと折り畳みを行うための、サンプル効率が高く、スケーラブルで、汎用的なロボットシステムである。
UniFoldingは提案されたUFONetニューラルネットワークを使用して、展開決定と折り畳み決定を単一のポリシーモデルに統合する。
このシステムは、長袖のシャツと短袖のシャツの2種類の衣服でテストされている。
論文 参考訳(メタデータ) (2023-11-02T14:25:10Z) - Data Efficient Training with Imbalanced Label Sample Distribution for
Fashion Detection [5.912870746288055]
本稿では,長期データ分布を持つ多ラベル分類のためのディープニューラルネットワーク(DNN)の性能向上を目的とした,最先端の重み付き目的関数を提案する。
本実験では,ファッションアパレルのイメージに基づく属性分類を行い,新しい重み付け法に好適な性能を示した。
論文 参考訳(メタデータ) (2023-05-07T21:25:09Z) - Automatically Classifying Emotions based on Text: A Comparative
Exploration of Different Datasets [0.0]
関連文献で最近紹介された3つのデータセットに注目した。
従来型および最先端のディープラーニングモデルの性能について、データに異なる特性が存在する場合について検討する。
実験により,RoBERTaのような最先端モデルがすべてのケースで最高の性能を発揮することが示された。
論文 参考訳(メタデータ) (2023-02-28T16:34:55Z) - RT-1: Robotics Transformer for Real-World Control at Scale [98.09428483862165]
我々は,有望なスケーラブルなモデル特性を示す,ロボティクストランスフォーマーと呼ばれるモデルクラスを提示する。
実世界の課題を遂行する実ロボットの大規模データ収集に基づいて,様々なモデルクラスと,データサイズ,モデルサイズ,データの多様性の関数として一般化する能力について検証した。
論文 参考訳(メタデータ) (2022-12-13T18:55:15Z) - StyleGAN-Human: A Data-Centric Odyssey of Human Generation [96.7080874757475]
この研究は、データ中心の観点から、"データエンジニアリング"における複数の重要な側面を調査します。
さまざまなポーズやテクスチャを抽出した230万以上のサンプルで、大規模な人間の画像データセットを収集し、注釈付けします。
本稿では,データサイズ,データ分布,データアライメントといった,スタイルGANに基づく人為的生成のためのデータ工学における3つの重要な要素について精査する。
論文 参考訳(メタデータ) (2022-04-25T17:55:08Z) - Using Artificial Intelligence to Analyze Fashion Trends [0.76146285961466]
本研究では,人工知能(A.I.)アルゴリズムを用いたデータ駆動量抽象手法を提案する。
A.I.モデルは、さまざまなシナリオ下で大規模なデータセットのファッションイメージに基づいてトレーニングされた。
A.I.モデルは検出された領域の豊富な記述を生成でき、画像中の衣服を正確に結合できることがわかった。
論文 参考訳(メタデータ) (2020-05-03T04:46:12Z) - Learning Diverse Fashion Collocation by Neural Graph Filtering [78.9188246136867]
本稿では,グラフニューラルネットワークを用いて,フレキシブルなファッションアイテムセットをモデル化する新しいファッションコロケーションフレームワークであるNeural Graph Filteringを提案する。
エッジベクトルに対称演算を適用することにより、このフレームワークは様々な入力/出力を許容し、それらの順序に不変である。
提案手法を,Polyvoreデータセット,Polyvore-Dデータセット,Amazon Fashionデータセットの3つの一般的なベンチマークで評価した。
論文 参考訳(メタデータ) (2020-03-11T16:17:08Z) - A Strong Baseline for Fashion Retrieval with Person Re-Identification
Models [0.0]
ファッション検索は、画像に含まれるファッションアイテムの正確なマッチングを見つけるのに難しいタスクである。
ファッション検索のためのシンプルなベースラインモデルを導入する。
Street2ShopとDeepFashionのデータセットで詳細な実験を行い、その結果を検証する。
論文 参考訳(メタデータ) (2020-03-09T12:50:15Z) - Learning Predictive Models From Observation and Interaction [137.77887825854768]
世界との相互作用から予測モデルを学ぶことで、ロボットのようなエージェントが世界がどのように働くかを学ぶことができる。
しかし、複雑なスキルのダイナミクスを捉えるモデルを学ぶことは大きな課題である。
本研究では,人間などの他のエージェントの観察データを用いて,トレーニングセットを増強する手法を提案する。
論文 参考訳(メタデータ) (2019-12-30T01:10:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。