論文の概要: Synthetic data enables faster annotation and robust segmentation for
multi-object grasping in clutter
- arxiv url: http://arxiv.org/abs/2401.13405v1
- Date: Wed, 24 Jan 2024 11:58:30 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-25 14:43:11.915288
- Title: Synthetic data enables faster annotation and robust segmentation for
multi-object grasping in clutter
- Title(参考訳): 合成データによりクラッタのマルチオブジェクト把握のためのより高速なアノテーションとロバストセグメンテーションが可能に
- Authors: Dongmyoung Lee, Wei Chen, Nicolas Rojas
- Abstract要約: 本稿では、人間の介入を最小限に抑え、下流画像分割アルゴリズムをより堅牢にする合成データ生成手法を提案する。
実験により,提案した合成シーン生成はラベリング時間を劇的に短縮できることが示された。
Pick-and-place実験は、私たちのハイブリッドデータセット(98.9%、70%)でトレーニングされたセグメンテーションが、実際のデータセットと公開データセット(6.7%、18.8%)と(2.8%、10%)をラベリングと達成率で上回っていることを示した。
- 参考スコア(独自算出の注目度): 9.092550803271005
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Object recognition and object pose estimation in robotic grasping continue to
be significant challenges, since building a labelled dataset can be time
consuming and financially costly in terms of data collection and annotation. In
this work, we propose a synthetic data generation method that minimizes human
intervention and makes downstream image segmentation algorithms more robust by
combining a generated synthetic dataset with a smaller real-world dataset
(hybrid dataset). Annotation experiments show that the proposed synthetic scene
generation can diminish labelling time dramatically. RGB image segmentation is
trained with hybrid dataset and combined with depth information to produce
pixel-to-point correspondence of individual segmented objects. The object to
grasp is then determined by the confidence score of the segmentation algorithm.
Pick-and-place experiments demonstrate that segmentation trained on our hybrid
dataset (98.9%, 70%) outperforms the real dataset and a publicly available
dataset by (6.7%, 18.8%) and (2.8%, 10%) in terms of labelling and grasping
success rate, respectively. Supplementary material is available at
https://sites.google.com/view/synthetic-dataset-generation.
- Abstract(参考訳): ラベル付きデータセットの構築には、データ収集とアノテーションの面での時間と費用がかかるため、ロボット把持におけるオブジェクト認識とオブジェクトポーズ推定は依然として重要な課題である。
本研究では,生成した合成データセットとより小さな実世界データセット(hybrid dataset)を組み合わせることにより,人間の介入を最小限にし,下流画像分割アルゴリズムをより堅牢にする合成データ生成手法を提案する。
アノテーション実験により,提案する合成シーン生成はラベリング時間を劇的に削減できることが示された。
rgbイメージセグメンテーションはハイブリッドデータセットでトレーニングされ、深度情報と組み合わせて個々のセグメンテーションオブジェクトのピクセル間対応を生成する。
次に、把握対象をセグメンテーションアルゴリズムの信頼度スコアによって決定する。
ピック・アンド・プレイス実験では、我々のハイブリッドデータセット(98.9%、70%)でトレーニングされたセグメンテーションが、実際のデータセットと公開データセット(6.7%、18.8%)と(2.8%、10%)をそれぞれラベル付けと達成率で上回っている。
補足資料はhttps://sites.google.com/view/synthetic-dataset-generationで入手できる。
関連論文リスト
- Modified CycleGAN for the synthesization of samples for wheat head
segmentation [0.09999629695552192]
注釈付きデータセットがない場合は、モデル開発に合成データを使用することができる。
そこで我々は,小麦頭部分割のための現実的な注釈付き合成データセットを開発した。
その結果、Diceのスコアは内部データセットで83.4%、外部のGlobal Wheat Head Detectionデータセットで83.6%に達した。
論文 参考訳(メタデータ) (2024-02-23T06:42:58Z) - TarGEN: Targeted Data Generation with Large Language Models [51.87504111286201]
TarGENは、高品質な合成データセットを生成するための、多段階のプロンプト戦略である。
我々は,LLMが不正確なラベル付きインスタンスを修正できるようにする自己補正法により,TarGENを増強する。
合成データセットを元のデータセットと比較した包括的な分析により、データセットの複雑さと多様性の類似または高いレベルが明らかになる。
論文 参考訳(メタデータ) (2023-10-27T03:32:17Z) - Diffusion-based Data Augmentation for Nuclei Image Segmentation [68.28350341833526]
核セグメンテーションのための拡散法を初めて導入する。
このアイデアは、多数のラベル付き画像を合成し、セグメンテーションモデルを訓練することを目的としている。
実験の結果,10%のラベル付き実データセットを合成サンプルで拡張することにより,同等のセグメンテーション結果が得られることがわかった。
論文 参考訳(メタデータ) (2023-10-22T06:16:16Z) - DatasetDM: Synthesizing Data with Perception Annotations Using Diffusion
Models [61.906934570771256]
多様な合成画像や知覚アノテーションを生成できる汎用データセット生成モデルを提案する。
本手法は,事前学習した拡散モデルに基づいて,テキスト誘導画像合成を知覚データ生成に拡張する。
拡散モデルのリッチ潜時コードはデコーダモジュールを用いて正確な認識アノテーションとして効果的に復号できることを示す。
論文 参考訳(メタデータ) (2023-08-11T14:38:11Z) - Bridging the Gap: Enhancing the Utility of Synthetic Data via
Post-Processing Techniques [7.967995669387532]
生成モデルは、実世界のデータを置き換えたり拡張したりできる合成データセットを生成するための有望なソリューションとして登場した。
本稿では,合成データセットの品質と多様性を向上させるために,新しい3つのポストプロセッシング手法を提案する。
Gap Filler(GaFi)は、Fashion-MNIST、CIFAR-10、CIFAR-100データセットにおいて、実精度スコアとのギャップを2.03%、1.78%、および3.99%に効果的に減少させることを示した。
論文 参考訳(メタデータ) (2023-05-17T10:50:38Z) - TRoVE: Transforming Road Scene Datasets into Photorealistic Virtual
Environments [84.6017003787244]
本研究では、シミュレーションデータセットに存在する困難とドメインギャップに対処する合成データ生成パイプラインを提案する。
既存のデータセットからアノテーションや視覚的手がかりを利用すれば、自動マルチモーダルデータ生成が容易になることを示す。
論文 参考訳(メタデータ) (2022-08-16T20:46:08Z) - Delving into High-Quality Synthetic Face Occlusion Segmentation Datasets [83.749895930242]
そこで本研究では,高品質な自然主義的合成隠蔽顔を製造するための2つの手法を提案する。
両手法の有効性とロバスト性を実証的に示す。
我々は,RealOccとRealOcc-Wildという,微細なアノテーションを付加した高精細な実世界の顔データセットを2つ提示する。
論文 参考訳(メタデータ) (2022-05-12T17:03:57Z) - DatasetGAN: Efficient Labeled Data Factory with Minimal Human Effort [117.41383937100751]
現在のディープネットワークは、大規模なデータセットのトレーニングの恩恵を受ける、非常にデータハングリーです。
GAN潜入コードがどのようにデコードされ、イメージのセマンティックセグメンテーションを生成するかを示す。
これらの生成されたデータセットは、実際のデータセットと同じように、コンピュータビジョンアーキテクチャのトレーニングに使用できます。
論文 参考訳(メタデータ) (2021-04-13T20:08:29Z) - Semi-synthesis: A fast way to produce effective datasets for stereo
matching [16.602343511350252]
現実に近いテクスチャレンダリングは、ステレオマッチングのパフォーマンスを高める重要な要素です。
実物に近いテクスチャーで大量のデータを合成する効果的かつ高速な方法である半合成法を提案します。
実際のデータセットのさらなる微調整により、MiddleburyのSOTAパフォーマンスとKITTIおよびETH3Dデータセットの競争結果も達成します。
論文 参考訳(メタデータ) (2021-01-26T14:34:49Z) - Mask-based Data Augmentation for Semi-supervised Semantic Segmentation [3.946367634483361]
そこで我々は,CutMix と ClassMix の側面を組み込んだデータ拡張手法である ComplexMix を提案する。
提案手法は、意味論的に正しいようにしながら、拡張データの複雑さを制御できる。
実験結果から,セマンティック画像分割のための標準データセットにおける最新手法の改良が得られた。
論文 参考訳(メタデータ) (2021-01-25T15:09:34Z) - Self-supervised Robust Object Detectors from Partially Labelled Datasets [3.1669406516464007]
データセットをマージすることで、複数のオブジェクトをトレーニングする代わりに、1つの統合オブジェクト検出器をトレーニングすることができます。
本稿では,統合されたデータセットのラベルの欠落を克服するためのトレーニングフレームワークを提案する。
VOC2012 と VOC2007 を用いて,Yolo の誤り率 $approx!48%$ で,シミュレーションした統合データセット上で Yolo をトレーニングするためのフレームワークの評価を行った。
論文 参考訳(メタデータ) (2020-05-23T15:18:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。